AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

WorldCraft - 港科大推出的3D虚拟世界创建和定制系统

WorldCraft是香港科技大学推出的基于大型语言模型（LLM）代理的3D世界创建和定制系统，用在创建和定制逼真的3D虚拟世界。基于自然语言交互，让用户能轻松生成...

AIプロジェクト2025/12/18

Mobius - 重庆邮电联合美团等推出的无缝循环视频生成技术

Mobius 是先进的无缝循环视频生成技术，能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型，能自动识别视频中的关键元素并生成平滑...

AIプロジェクト2025/12/18

WarriorCoder - 微软联合华南理工大学推出的代码生成大模型

WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型（LLM）。基于模拟专家模型之间的对抗生成高质量训练数据，提升模型性能。...

AIプロジェクト2025/12/18

xAR - 字节联合霍普金斯大学推出的自回归视觉生成框架

xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”（Next-X Prediction）和“噪声上下文学习”（Noisy Context Lear...

AIプロジェクト2025/12/18

Avat3r - 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型

Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型，仅需几张输入图像，能生成高质量且可动画化的 3D 头部头...

AIプロジェクト2025/12/18

WhisperChain - AI实时语音转文字工具，自动对文本进行清理和优化

WhisperChain 是开源的语音识别工具，基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别，将语音转换为文本，基于 LangChain 对文本进...

AIプロジェクト2025/12/18

星火医疗大模型X1 - 讯飞医疗推出的深度推理大模型

星火医疗大模型X1是科大讯飞发布的深度推理大模型，专门针对医疗领域设计，具备强大的复杂问题处理能力。模型通过深度推理算法，能逐步解释循证过程，显著降...

AIプロジェクト2025/12/18

story-flicks - AI视频生成工具，一键生成高清故事短视频

story-flicks 是基于AI大模型的项目，支持一键生成高清故事短视频。用户输入故事主题后，系统基于AI技术生成包含图像、文本、音频和字幕的短视频。story-flic...

AIプロジェクト2025/12/18

CSM - Sesame团队推出的语音对话模型

CSM（Conversational Speech Model）是Sesame团队推出的新型语音对话模型，提升语音助手的自然度和情感交互能力。CSM基于多模态学习框架，结合文本和语音数据...

AIプロジェクト2025/12/18

AgiBot Digital World - 智元机器人推出的机器人仿真框架

AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架，为机器人操作技能研究与应用提供高效支持。AgiBot Digital World集成海量逼真的三维资产、多...

AIプロジェクト2025/12/18

ARTalk - 东京大学等机构推出的3D头部动画生成框架

ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然的面部表情及头部姿势生成。A...

AIプロジェクト2025/12/18

LuminaBrush - AI光源绘制工具，手绘光影线条自动生成光影效果

LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目，用两阶段方法：第一阶段将图像转换为“均匀照明”的外观，第二阶段根据...

AIプロジェクト2025/12/18

HumanOmni - 阿里通义等推出专注人类中心场景的多模态大模型

HumanOmni 是专注于人类中心场景的多模态大模型，视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入，能全面理解人类行为、情感和交互。模型基于...

AIプロジェクト2025/12/18

Spark-TTS - AI文本转语音工具，支持中英零样本语音克隆

Spark-TTS 是SparkAudio 团队开源的基于大型语言模型（LLM）的高效文本转语音（TTS）工具，无需额外的生成模型，直接从 LLM 预测的编码中重建音频，实现零样...

AIプロジェクト2025/12/18

ViDoRAG - 通义联合中科大、上交大推出的视觉文档检索增强生成框架

ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭代推理，解决传统方法在处理复杂...

AIプロジェクト2025/12/18

Shandu - AI研究工具，自动进行多层次信息挖掘和分析

Shandu 是开源的 AI 研究自动化工具，结合了 LangChain 和 LangGraph 技术，能自动化地进行多层次信息挖掘和分析，生成结构化的研究报告。Shandu 的核心功能...

AIプロジェクト2025/12/18

LCVD - 川大推出的光照可控肖像动画生成框架

LCVD（Lighting Controllable Video Diffusion Model）是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征（如身份和外观）与...

AIプロジェクト2025/12/18

SepLLM - 基于分隔符压缩加速大语言模型的高效框架

SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型（LLM）的高效框架，通过压缩段落信息并消除冗余标记，显著提高了模型的推理速度和...

AIプロジェクト2025/12/18

CogView4 - 智谱开源的AI文生图模型，支持生成汉字

CogView4 是智谱推出的开源文生图模型，具有60亿参数，支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一，达到开源文生图模型...

AIプロジェクト2025/12/18

PRefLexOR - MIT 团队推出的新型自学习AI框架

PRefLexOR（Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning）是MIT团队提出的新型自学习AI框架，结合了偏好优化...

AIプロジェクト2025/12/18

Probly - AI电子表格工具，交互式生成分析结果或可视化图表

Probly 是 AI 驱动的电子表格工具，结合电子表格功能与 Python 数据分析能力。Probly基于 WebAssembly 在浏览器中运行 Python 代码，支持交互式电子表格、数...

AIプロジェクト2025/12/18

MindLLM - 耶鲁联合剑桥等机构推出的医疗领域 AI 模型

MindLLM 是耶鲁大学、达特茅斯学院和剑桥大学联合推出的AI模型，能将脑部功能性磁共振成像（fMRI）信号解码为自然语言文本。MindLLM基于一个主体无关（subjec...

AIプロジェクト2025/12/18

MiniMind - 开源的AI模型训练工具，2小时训练25.8M小模型

MiniMind 是开源的超小型语言模型项目，极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计，最小版本仅需25.8M参数，体积仅为GPT-...

AIプロジェクト2025/12/18

Fractal Generative Models - 麻省理工推出的分形生成模型

Fractal Generative Models（分形生成模型）是麻省理工学院计算机科学与人工智能实验室和Google DeepMind团队推出的新型图像生成方法。Fractal Generative Mo...

←1...85 86 87 88 89 90 91...137 →

AIニュース

AIプロジェクト2025/12/18

WorldCraft - 港科大推出的3D虚拟世界创建和定制系统

AIプロジェクト2025/12/18

Mobius - 重庆邮电联合美团等推出的无缝循环视频生成技术

AIプロジェクト2025/12/18

WarriorCoder - 微软联合华南理工大学推出的代码生成大模型

AIプロジェクト2025/12/18

xAR - 字节联合霍普金斯大学推出的自回归视觉生成框架

AIプロジェクト2025/12/18

Avat3r - 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型

AIプロジェクト2025/12/18

WhisperChain - AI实时语音转文字工具，自动对文本进行清理和优化

WhisperChain 是开源的语音识别工具，基于语音输入提升工作效率。WhisperChain用 Whisper.cpp 实现实时语音识别，将语音转换为文本，基于 LangChain 对文本进...

AIプロジェクト2025/12/18

星火医疗大模型X1 - 讯飞医疗推出的深度推理大模型

AIプロジェクト2025/12/18

story-flicks - AI视频生成工具，一键生成高清故事短视频

AIプロジェクト2025/12/18

CSM - Sesame团队推出的语音对话模型

AIプロジェクト2025/12/18

AgiBot Digital World - 智元机器人推出的机器人仿真框架

AIプロジェクト2025/12/18

ARTalk - 东京大学等机构推出的3D头部动画生成框架

AIプロジェクト2025/12/18

LuminaBrush - AI光源绘制工具，手绘光影线条自动生成光影效果

AIプロジェクト2025/12/18

HumanOmni - 阿里通义等推出专注人类中心场景的多模态大模型

AIプロジェクト2025/12/18

Spark-TTS - AI文本转语音工具，支持中英零样本语音克隆

AIプロジェクト2025/12/18

ViDoRAG - 通义联合中科大、上交大推出的视觉文档检索增强生成框架

AIプロジェクト2025/12/18

Shandu - AI研究工具，自动进行多层次信息挖掘和分析

AIプロジェクト2025/12/18

LCVD - 川大推出的光照可控肖像动画生成框架

LCVD（Lighting Controllable Video Diffusion Model）是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征（如身份和外观）与...

AIプロジェクト2025/12/18

SepLLM - 基于分隔符压缩加速大语言模型的高效框架

AIプロジェクト2025/12/18

CogView4 - 智谱开源的AI文生图模型，支持生成汉字

AIプロジェクト2025/12/18

PRefLexOR - MIT 团队推出的新型自学习AI框架

PRefLexOR（Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning）是MIT团队提出的新型自学习AI框架，结合了偏好优化...

AIプロジェクト2025/12/18

Probly - AI电子表格工具，交互式生成分析结果或可视化图表

Probly 是 AI 驱动的电子表格工具，结合电子表格功能与 Python 数据分析能力。Probly基于 WebAssembly 在浏览器中运行 Python 代码，支持交互式电子表格、数...

AIプロジェクト2025/12/18

MindLLM - 耶鲁联合剑桥等机构推出的医疗领域 AI 模型

AIプロジェクト2025/12/18

MiniMind - 开源的AI模型训练工具，2小时训练25.8M小模型

AIプロジェクト2025/12/18

Fractal Generative Models - 麻省理工推出的分形生成模型

Fractal Generative Models（分形生成模型）是麻省理工学院计算机科学与人工智能实验室和Google DeepMind团队推出的新型图像生成方法。Fractal Generative Mo...

すべてのカテゴリ

AIニュース

WorldCraft - 港科大推出的3D虚拟世界创建和定制系统

Mobius - 重庆邮电联合美团等推出的无缝循环视频生成技术

WarriorCoder - 微软联合华南理工大学推出的代码生成大模型

xAR - 字节联合霍普金斯大学推出的自回归视觉生成框架

Avat3r - 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型

WhisperChain - AI实时语音转文字工具，自动对文本进行清理和优化

星火医疗大模型X1 - 讯飞医疗推出的深度推理大模型

story-flicks - AI视频生成工具，一键生成高清故事短视频

CSM - Sesame团队推出的语音对话模型

AgiBot Digital World - 智元机器人推出的机器人仿真框架

ARTalk - 东京大学等机构推出的3D头部动画生成框架

LuminaBrush - AI光源绘制工具，手绘光影线条自动生成光影效果

HumanOmni - 阿里通义等推出专注人类中心场景的多模态大模型

Spark-TTS - AI文本转语音工具，支持中英零样本语音克隆

ViDoRAG - 通义联合中科大、上交大推出的视觉文档检索增强生成框架

Shandu - AI研究工具，自动进行多层次信息挖掘和分析

LCVD - 川大推出的光照可控肖像动画生成框架

SepLLM - 基于分隔符压缩加速大语言模型的高效框架

CogView4 - 智谱开源的AI文生图模型，支持生成汉字

PRefLexOR - MIT 团队推出的新型自学习AI框架

Probly - AI电子表格工具，交互式生成分析结果或可视化图表

MindLLM - 耶鲁联合剑桥等机构推出的医疗领域 AI 模型

MiniMind - 开源的AI模型训练工具，2小时训练25.8M小模型

Fractal Generative Models - 麻省理工推出的分形生成模型

AIニュース

WorldCraft - 港科大推出的3D虚拟世界创建和定制系统

Mobius - 重庆邮电联合美团等推出的无缝循环视频生成技术

WarriorCoder - 微软联合华南理工大学推出的代码生成大模型

xAR - 字节联合霍普金斯大学推出的自回归视觉生成框架

Avat3r - 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型

WhisperChain - AI实时语音转文字工具，自动对文本进行清理和优化

星火医疗大模型X1 - 讯飞医疗推出的深度推理大模型

story-flicks - AI视频生成工具，一键生成高清故事短视频

CSM - Sesame团队推出的语音对话模型

AgiBot Digital World - 智元机器人推出的机器人仿真框架

ARTalk - 东京大学等机构推出的3D头部动画生成框架

LuminaBrush - AI光源绘制工具，手绘光影线条自动生成光影效果

HumanOmni - 阿里通义等推出专注人类中心场景的多模态大模型

Spark-TTS - AI文本转语音工具，支持中英零样本语音克隆

ViDoRAG - 通义联合中科大、上交大推出的视觉文档检索增强生成框架

Shandu - AI研究工具，自动进行多层次信息挖掘和分析

LCVD - 川大推出的光照可控肖像动画生成框架

SepLLM - 基于分隔符压缩加速大语言模型的高效框架

CogView4 - 智谱开源的AI文生图模型，支持生成汉字

PRefLexOR - MIT 团队推出的新型自学习AI框架

Probly - AI电子表格工具，交互式生成分析结果或可视化图表

MindLLM - 耶鲁联合剑桥等机构推出的医疗领域 AI 模型

MiniMind - 开源的AI模型训练工具，2小时训练25.8M小模型

Fractal Generative Models - 麻省理工推出的分形生成模型