AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

TheoremExplainAgent（TEA）是滑铁卢大学、Votee AI等机构开源的多模态代理系统，基于生成长篇动画视频帮助人们更好地理解数学和科学定理。TheoremExplainAge...

AIプロジェクト2025/12/18

Aya Vision - Cohere 推出多模态、多语言的视觉模型

Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型，提升全球范围内的多语言和多模态通信能力。支持 23 种语言，能执行图像描述生成、视觉问答、文本翻译...

AIプロジェクト2025/12/18

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型，基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务，如图文检索和组合图像检...

AIプロジェクト2025/12/18

混元图生视频 - 腾讯混元开源的图生视频模型

混元图生视频是腾讯混元推出的开源图生视频模型，用户可以通过上传一张图片进行简短描述，让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效...

AIプロジェクト2025/12/18

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Granite 3.2 是IBM开源的多模态AI模型系列，具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本， Granite 3.2 Instruct 提供实验性链式推理能力...

AIプロジェクト2025/12/18

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

Resume Matcher 是开源的 AI 简历优化工具，帮助求职者提升简历通过自动化筛选系统（ATS）的概率。Resume Matcher基于解析简历和职位描述，提取关键技能、经...

AIプロジェクト2025/12/18

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

OpenManus 是MetaGPT 团队推出的开源复刻版 Manus，提供无需邀请码的 AI Agent 。OpenManus基于模块化设计，支持多种语言模型和工具链，能执行代码、处理文件...

AIプロジェクト2025/12/18

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型，能实现对语言、音频和视觉信息的全方位感知与交...

AIプロジェクト2025/12/18

OWL - 开源多智能体协作系统，动态交互实现任务自动化

OWL（Optimized Workforce Learning）是基于CAMEL-AI框架开发的多智能体协作系统，通过智能体之间的动态交互实现高效的任务自动化。通过角色分配和任务分解，...

AIプロジェクト2025/12/18

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

AIプロジェクト2025/12/18

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型，基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存...

AIプロジェクト2025/12/18

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型（dLLM），是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...

AIプロジェクト2025/12/18

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

GCDance（Genre-Controlled 3D Full Body Dance Generation Driven by Music）是英国萨里大学和江南大学推出的3D舞蹈生成框架，能根据音乐和文本提示生成符合...

AIプロジェクト2025/12/18

LaWGPT - 南京大学推出的中文法律大语言模型

LaWGPT 是南京大学推出的中文法律大语言模型，基于 LLaMA 模型进行二次预训练，融入大量中文法律知识。专注于法律领域，能理解和生成与法律相关的文本，适用...

AIプロジェクト2025/12/18

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

autoMate是基于AI和RPA的本地自动化工具，用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型，用户无需编程知识，用自然语言描述任务，能完成计...

AIプロジェクト2025/12/18

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

URO-Bench 是面向端到端语音对话模型（SDMs）的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务，全面评估语音对话模型的性能。

AIプロジェクト2025/12/18

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

Nanobrowser 是开源的 Chrome 扩展工具，专注于 AI 驱动的网页自动化。Nanobrowser基于多智能体系统实现复杂的网页任务，如信息提取、自动化操作等。用户用自...

AIプロジェクト2025/12/18

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

DINO-XSeek 是 IDEA 研究院推出的多模态目标检测模型，结合视觉感知和自然语言理解能力。DINO-XSeek基于复杂的语言描述精准定位图像中的目标，识别目标的属性...

AIプロジェクト2025/12/18

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

AppAgentX 是西湖大学推出的新型自我进化式 GUI（图形用户界面）代理框架，基于从执行历史中抽象出高级动作提升代理在智能手机交互中的效率和智能性。AppAgen...

AIプロジェクト2025/12/18

GO-1 - 智元机器人推出的首个通用具身基座模型

GO-1（Genie Operator-1，智元启元大模型）是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action（ViLLA）架构，由VLM（多模态大...

AIプロジェクト2025/12/18

Gemini Embedding - 谷歌推出的文本嵌入模型

Gemini Embedding 是 Google 推出的先进的文本嵌入模型，基于将文本转化为高维数值向量，捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练，具...

AIプロジェクト2025/12/18

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型，通过两个多模态循环（text-to-image-to-text 和 image-to-text-to-image）实现不同...

AIプロジェクト2025/12/18

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性，如无法同时生成多个不同姿态...

AIプロジェクト2025/12/18

Heygem - 硅基智能推出的开源数字人模型

Heygem 是硅基智能推出的开源数字人模型，专为 Windows 系统设计。基于先进的AI技术，仅需 1 秒视频或 1 张照片，能在 30 秒内完成数字人形象和声音克隆，在 ...

←1...87 88 89 90 91 92 93...137 →

AIニュース

AIプロジェクト2025/12/18

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

AIプロジェクト2025/12/18

Aya Vision - Cohere 推出多模态、多语言的视觉模型

AIプロジェクト2025/12/18

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

AIプロジェクト2025/12/18

混元图生视频 - 腾讯混元开源的图生视频模型

AIプロジェクト2025/12/18

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Granite 3.2 是IBM开源的多模态AI模型系列，具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本， Granite 3.2 Instruct 提供实验性链式推理能力...

AIプロジェクト2025/12/18

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

AIプロジェクト2025/12/18

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

AIプロジェクト2025/12/18

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

AIプロジェクト2025/12/18

OWL - 开源多智能体协作系统，动态交互实现任务自动化

AIプロジェクト2025/12/18

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

AIプロジェクト2025/12/18

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

AIプロジェクト2025/12/18

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型（dLLM），是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...

AIプロジェクト2025/12/18

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

GCDance（Genre-Controlled 3D Full Body Dance Generation Driven by Music）是英国萨里大学和江南大学推出的3D舞蹈生成框架，能根据音乐和文本提示生成符合...

AIプロジェクト2025/12/18

LaWGPT - 南京大学推出的中文法律大语言模型

AIプロジェクト2025/12/18

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

AIプロジェクト2025/12/18

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

URO-Bench 是面向端到端语音对话模型（SDMs）的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务，全面评估语音对话模型的性能。

AIプロジェクト2025/12/18

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

AIプロジェクト2025/12/18

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

AIプロジェクト2025/12/18

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

AIプロジェクト2025/12/18

GO-1 - 智元机器人推出的首个通用具身基座模型

GO-1（Genie Operator-1，智元启元大模型）是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action（ViLLA）架构，由VLM（多模态大...

AIプロジェクト2025/12/18

Gemini Embedding - 谷歌推出的文本嵌入模型

Gemini Embedding 是 Google 推出的先进的文本嵌入模型，基于将文本转化为高维数值向量，捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练，具...

AIプロジェクト2025/12/18

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型，通过两个多模态循环（text-to-image-to-text 和 image-to-text-to-image）实现不同...

AIプロジェクト2025/12/18

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

Aya Vision - Cohere 推出多模态、多语言的视觉模型

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

混元图生视频 - 腾讯混元开源的图生视频模型

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

OWL - 开源多智能体协作系统，动态交互实现任务自动化

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

LaWGPT - 南京大学推出的中文法律大语言模型

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

GO-1 - 智元机器人推出的首个通用具身基座模型

Gemini Embedding - 谷歌推出的文本嵌入模型

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

Heygem - 硅基智能推出的开源数字人模型

AIニュース

TheoremExplainAgent - AI教学双智能体，数理化定理自动转动画

Aya Vision - Cohere 推出多模态、多语言的视觉模型

BGE-VL - 智源研究院联合多所高校开源的多模态向量模型

混元图生视频 - 腾讯混元开源的图生视频模型

Granite 3.2 - IBM 开源的多模态系列 AI 模型

Resume Matcher - 开源AI简历优化工具，解析简历和职位描述提供改进建议

OpenManus - MetaGPT 团队推出的 Manus 开源复刻版

NEXUS-O - 多模态AI模型，实现对语言、音频和视觉全方位感知与交互

OWL - 开源多智能体协作系统，动态交互实现任务自动化

TicVoice 7.0 - 出门问问推出的第七代语音合成引擎

GEN3C - NVIDIA 联合多伦多大学等推出的生成式视频模型

Mercury Coder - Inception Labs 推出的商业级扩散大型语言模型

GCDance - 萨里大学和江南大学推出的3D舞蹈生成框架

LaWGPT - 南京大学推出的中文法律大语言模型

autoMate - AI本地自动化工具，自然语言实现自动化任务操作

URO-Bench - AI基准测试工具，专为端到端语音对话模型设计

Nanobrowser - AI网页自动化工具，自主完成复杂的网页任务

DINO-XSeek - IDEA 研究院推出的多模态目标检测模型

AppAgentX - 西湖大学推出的自我进化式 GUI 代理框架

GO-1 - 智元机器人推出的首个通用具身基座模型

Gemini Embedding - 谷歌推出的文本嵌入模型

DoraCycle - 新加坡国立大学推出多模态领域适应的统一生成模型

IMAGPose - 南京理工大学推出姿态引导图像生成的统一框架

Heygem - 硅基智能推出的开源数字人模型