AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

SadTalker - 开源AI数字人项目，一键让照片说话

SadTalker是西安交通大学、腾讯AI实验室和蚂蚁集团联合推出的开源AI数字人项目。SadTalker专注于通过单张人脸图像和语音音频，利用3D运动系数生成逼真的说话...

AIプロジェクト2025/12/18

xGen-MM - Salesforce推出的开源多模态AI模型

xGen-MM是Salesforce推出的一款开源多模态AI模型，具有处理交错数据的能力，能同时理解和生成文本、图像等多种数据类型。xGen-MM通过学习大量的图片和文字信...

AIプロジェクト2025/12/18

Phi-3.5 - 微软推出的新一代AI模型，mini、MoE混合和视觉模型

Phi-3.5是微软推出的新一代AI模型系列，包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三个版本，分别针对轻量级推理、混合...

AIプロジェクト2025/12/18

TrackGo - 先进的可控AI视频生成技术

TrackGo是先进的可控AI视频生成技术，通过用自由形状的遮罩和箭头，为用户提供了一种灵活而精确的机制来控制视频中对象的运动。技术的核心是TrackAdapter，一...

AIプロジェクト2025/12/18

GPT Pilot - AI编程工具，让95%的开发者实现自动写代码

GPT Pilot 是一款AI编程工具，通过模仿人类开发者的工作流程，帮助从零开始构建应用程序。能编写代码、调试程序、与用户讨论问题，并请求代码审查，是真正的 ...

AIプロジェクト2025/12/18

GaussianEditor - 一种3D编辑算法，支持快速且精确地修改3D场景

GaussianEditor 是一种基于高斯飞溅（Gaussian Splatting）的3D编辑算法，支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高斯飞溅，提供了高度的编...

AIプロジェクト2025/12/18

Seed-ASR - 字节跳动推出的AI语音识别模型

Seed-ASR是字节跳动开发的一款基于大型语言模型（LLM）的语音识别（ASR）模型。在超过2000万小时的语音数据和近90万小时的配对ASR数据上训练，支持普通话和13...

AIプロジェクト2025/12/18

mPLUG-Owl3 - 阿里巴巴推出的通用多模态AI模型

mPLUG-Owl3是阿里巴巴推出的先进通用多模态大模型，专为理解和处理多图及长视频设计。在保持准确性的同时，显著提升了推理效率，能在4秒内分析完2小时电影。

AIプロジェクト2025/12/18

Moffee - 开源的Markdown转PPT工具

Moffee是开源的Markdown转PPT工具，支持用户使用Markdown语法快速创建专业的幻灯片。Moffee自动处理布局、分页和样式，支持实时预览和导出为PDF或HTML格式。

AIプロジェクト2025/12/18

Lingo - 西湖心辰推出的端到端语音大模型，媲美GPT-4o

Lingo 是西湖心辰推出的国内首个端到端语音大模型，在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力，拥有比 GPT-4o 更出色的中文语音效果。

AIプロジェクト2025/12/18

山海大模型 - 云知声推出的多模态AI大模型

山海大模型是云知声推出的多模态AI大模型，具备丰富的知识储备和多模态交互能力。山海大模型能通过文本、音频、图像等多种形式与用户进行实时互动，提供信息...

AIプロジェクト2025/12/18

AIEditor - 面向AI的下一代富文本编辑器

AIEditor是面向 AI 的下一代富文本编辑器，AIEditor基于 Web Component 开发，支持 Layui、Vue、React、Angular、Svelte 等几乎任何前端框架。AIEditor适配了...

AIプロジェクト2025/12/18

Omages - 开源的3D模型生成项目

Omages是一个开源的3D模型生成项目，基于图像扩散技术将3D形状的几何和纹理信息编码进64x64像素的2D图像中，从而简化3D建模流程。

AIプロジェクト2025/12/18

浦语灵笔 - 开源的多模态大模型，性能媲美GPT-4V

浦语灵笔IXC-2.5是上海人工智能实验室推出的新一代多模态大模型，具备7B规模的大型语言模型后端。能处理长达96K的长上下文，支持超高分辨率图像和细粒度视频...

AIプロジェクト2025/12/18

GLM-4-Flash - 智谱AI推出的首个免费大模型API

GLM-4-Flash是智谱AI推出的首个免费大模型API，GLM-4-Flash不仅支持多轮对话和多语言处理，还具备网页浏览、代码执行等高级功能。开发者和企业可以在智谱AI开...

AIプロジェクト2025/12/18

AgentGen - 微软联合港大推出的提高AI大模型规划能力的框架

AgentGen是香港大学与微软联合推出的AI项目框架，通过自动生成多样化环境和任务，显著提升了大语言模型（LLM）的规划能力。AgentGen利用BI-EVOL方法，创建难...

AIプロジェクト2025/12/18

MotionGen - 元象科技推出的3D动作生成模型

MotionGen是元象科技推出的3D动作生成模型，结合了大模型、物理仿真和强化学习算法，支持用户仅通过简单文本指令即可快速生成逼真且流畅的3D动作。MotionGen...

AIプロジェクト2025/12/18

新壹视频大模型 - 新壹科技推出的AI视频创作大模型

新壹视频大模型是新壹科技推出的AI视频创作大模型，自研AI算法和深度学习技术，实现从剧本到成品的一键式创作。具备剧本生成、情感化语音合成、3D元素创建和...

AIプロジェクト2025/12/18

GameNGen - 谷歌推出的首个AI游戏引擎，生成实时可玩的游戏

GameNGen是谷歌推出的首个AI游戏引擎，能以每秒20帧的速度实时生成逼真的DOOM游戏画面，甚至让60%的玩家无法区分真假。GameNGen预示着游戏开发可能不再需要传...

AIプロジェクト2025/12/18

GLM-4-Plus - 智谱AI最新推出的旗舰大模型，性能全面提升

GLM-4-Plus是智谱AI最新推出的高智能旗舰大模型，在语言理解和长文本处理上取得突破，采用创新技术如PPO，显著提升推理和指令遵循能力。GLM-4-Plus在多个关键...

AIプロジェクト2025/12/18

书生·浦语 - 上海人工智能实验室推出的开源AI大模型

书生·浦语是上海人工智能实验室推出的开源AI大模型，具有卓越的推理能力和超长文本处理功能。书生·浦语支持高达一百万词元的文本输入，能自主进行网络搜索并...

AIプロジェクト2025/12/18

CogView-3-Plus - 智谱AI最新推出的AI文生图模型，媲美 MJ-V6 和 FLUX

CogView-3-Plus是智谱AI最新推出的AI文生图模型，采用Transformer架构替代传统UNet，优化了扩散模型的噪声规划。CogView-3-Plus在图像生成方面表现出色，能根...

AIプロジェクト2025/12/18

GLM-4V-Plus - 智谱AI最新推出的多模态AI模型，专注图像和视频理解

GLM-4V-Plus是智谱AI最新推出的多模态AI模型，专注于图像和视频理解。GLM-4V-Plus不仅能够精确分析静态图像，还具备动态视频内容的时间感知和理解能力，能捕...

AIプロジェクト2025/12/18

MetaHuman-Stream - 实时交互流式AI数字人技术

MetaHuman-Stream 是一项前沿的实时交互流式AI数字人技术，集成了 ERNerf、MuseTalk、Wav2lip 等多种先进模型，支持声音克隆和深度学习算法，确保对话流畅自...

←1...34 35 36 37 38 39 40...137 →

AIニュース

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

SadTalker - 开源AI数字人项目，一键让照片说话

xGen-MM - Salesforce推出的开源多模态AI模型

Phi-3.5 - 微软推出的新一代AI模型，mini、MoE混合和视觉模型

TrackGo - 先进的可控AI视频生成技术

GPT Pilot - AI编程工具，让95%的开发者实现自动写代码

GaussianEditor - 一种3D编辑算法，支持快速且精确地修改3D场景

Seed-ASR - 字节跳动推出的AI语音识别模型

mPLUG-Owl3 - 阿里巴巴推出的通用多模态AI模型

Moffee - 开源的Markdown转PPT工具

Lingo - 西湖心辰推出的端到端语音大模型，媲美GPT-4o

山海大模型 - 云知声推出的多模态AI大模型

AIEditor - 面向AI的下一代富文本编辑器

Omages - 开源的3D模型生成项目

浦语灵笔 - 开源的多模态大模型，性能媲美GPT-4V

GLM-4-Flash - 智谱AI推出的首个免费大模型API

AgentGen - 微软联合港大推出的提高AI大模型规划能力的框架

MotionGen - 元象科技推出的3D动作生成模型

新壹视频大模型 - 新壹科技推出的AI视频创作大模型

GameNGen - 谷歌推出的首个AI游戏引擎，生成实时可玩的游戏

GLM-4-Plus - 智谱AI最新推出的旗舰大模型，性能全面提升

书生·浦语 - 上海人工智能实验室推出的开源AI大模型

CogView-3-Plus - 智谱AI最新推出的AI文生图模型，媲美 MJ-V6 和 FLUX

GLM-4V-Plus - 智谱AI最新推出的多模态AI模型，专注图像和视频理解

MetaHuman-Stream - 实时交互流式AI数字人技术

AIニュース

SadTalker - 开源AI数字人项目，一键让照片说话

xGen-MM - Salesforce推出的开源多模态AI模型

Phi-3.5 - 微软推出的新一代AI模型，mini、MoE混合和视觉模型

TrackGo - 先进的可控AI视频生成技术

GPT Pilot - AI编程工具，让95%的开发者实现自动写代码

GaussianEditor - 一种3D编辑算法，支持快速且精确地修改3D场景

Seed-ASR - 字节跳动推出的AI语音识别模型

mPLUG-Owl3 - 阿里巴巴推出的通用多模态AI模型

Moffee - 开源的Markdown转PPT工具

Lingo - 西湖心辰推出的端到端语音大模型，媲美GPT-4o

山海大模型 - 云知声推出的多模态AI大模型

AIEditor - 面向AI的下一代富文本编辑器

Omages - 开源的3D模型生成项目

浦语灵笔 - 开源的多模态大模型，性能媲美GPT-4V

GLM-4-Flash - 智谱AI推出的首个免费大模型API

AgentGen - 微软联合港大推出的提高AI大模型规划能力的框架

MotionGen - 元象科技推出的3D动作生成模型

新壹视频大模型 - 新壹科技推出的AI视频创作大模型

GameNGen - 谷歌推出的首个AI游戏引擎，生成实时可玩的游戏

GLM-4-Plus - 智谱AI最新推出的旗舰大模型，性能全面提升

书生·浦语 - 上海人工智能实验室推出的开源AI大模型

CogView-3-Plus - 智谱AI最新推出的AI文生图模型，媲美 MJ-V6 和 FLUX

GLM-4V-Plus - 智谱AI最新推出的多模态AI模型，专注图像和视频理解

MetaHuman-Stream - 实时交互流式AI数字人技术