AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

CogSound - 智谱AI最新推出的音效模型

CogSound是智谱AI最新推出的音效模型，能为无声视频增添动人的音效。基于GLM-4V的视频理解能力，CogSound能精准识别理解视频背后的语义和情感，为无声视频添...

AI Projects12/18/2025

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

AgentSquare是清华大学团队推出自动搜索和优化大型语言模型（LLM）代理的框架。基于标准化的模块接口抽象，实现AI智能体的高速自我演化和自适应演进。框架包...

AI Projects12/18/2025

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

Fashion-VDM是谷歌和华盛顿大学共同推出的基于视频扩散模型（VDM）的虚拟试穿技术。能在给定服装图像和人物视频的情况下，生成人物穿着指定服装的高质量试穿...

AI Projects12/18/2025

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

Olly.bot是集成于iMessage和SMS的个人AI助手，基于OpenAI大模型，提供网络搜索、文档分析、图片生成等功能。Olly.bot无需下载、注册，不收集用户身份信息，保...

AI Projects12/18/2025

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

AdaCache（Adaptive Caching）是Meta推出的开源技术，能加速AI视频生成过程。AdaCache自适应缓存机制优化计算资源分配，根据不同视频内容的复杂度动态调整计...

AI Projects12/18/2025

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本，5B 系列模型支持生成5至10秒、768P分辨率、16...

AI Projects12/18/2025

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

MiLoRA是参数高效的大型语言模型（LLMs）微调方法，通过更新权重分量来矩阵的次要奇异减少计算和内存成本。方法基于奇异值分解（SVD）将权重矩阵分为主要和次...

AI Projects12/18/2025

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

OpenCoder是墨尔本大学、复旦大学等高校研究人员联合无限光年推出的开源代码大型语言模型（LLM），能提升开源代码LLM的性能至专有模型水平，推动代码AI研究的...

AI Projects12/18/2025

Infinity-MM - 智源推出的千万级多模态指令数据集

Infinity-MM是智源研究院推出的千万级多模态指令数据集，包含4300万条样本，数据量达10TB。数据集经过质量过滤和去重，确保高质量和多样性，能提升开源视觉-...

AI Projects12/18/2025

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

FabricDiffusion是谷歌和卡内基梅隆大学共同推出的高保真度3D服装生成技术，能将现实世界中2D服装图像的纹理和印花高质量地转移到任意形状的3D服装模型上。Fa...

AI Projects12/18/2025

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集，包含500个第一人称视角视频，时长20至120分钟，覆盖77种日常活动，能评估多模态模型对...

AI Projects12/18/2025

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架，实现应用功能与系统体验（如Siri、Spotlight搜索、快捷指令...

AI Projects12/18/2025

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

DimensionX是香港科技大学、清华大学和生数科技共同推出的框架，能从单张图片生成高逼真度的3D和4D场景，基于视频扩散技术实现对空间和时间维度的精确控制。...

AI Projects12/18/2025

SeedEdit - 字节豆包团队推出的AI图像编辑模型

SeedEdit是字节跳动豆包大模型团队推出的通用图像编辑模型，基于简单的自然语言指令编辑图像，包括修图、换装、美化、风格转换及在指定区域添加或删除元素等...

AI Projects12/18/2025

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

HK-O1aw是香港生成式AI研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR)与北京大学对齐团队(PKU-Alignment Team)合作推出的全球首个慢思考范式法律推理大模型...

AI Projects12/18/2025

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

AnimePro FLUX是基于Apache 2.0许可的动漫风格图像生成模型，专为生成高质量二次元插画设计。AnimePro FLUX基于Flux.1 Shnell模型微调，克服DEV版本的许可限...

AI Projects12/18/2025

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

VideoChat是开源的实时数字人对话系统，支持语音输入和实时对话功能。用户自定义数字人的形象和音色，无需训练即可进行音色克隆，首包延迟可低至3秒，适用于...

AI Projects12/18/2025

TableGPT2 - 浙大推出整合与处理表格数据的多模态大模型

TableGPT2是浙江大学推出的新型大型多模态模型，针对表格数据的整合与处理。首次将结构化数据作为独立模态进行训练，直接理解并操作数据库、Excel等数据，执...

AI Projects12/18/2025

GenXD - 新加坡国立和微软共同推出的通用3D和4D联合生成框架

GenXD是新加坡国立大学和微软公司共同推出的3D-4D联合生成框架，能从任意数量的条件图像中生成高质量的3D和4D场景。框架用一个数据整理流程从视频中提取相机...

AI Projects12/18/2025

AlphaFold 3 - 谷歌DeepMind开源的结构预测统一框架

AlphaFold 3是谷歌DeepMind团队推出的AI模型，能预测蛋白质、核酸（DNA和RNA）、小分子、离子及修饰残基等生物分子的三维结构。模型在结构预测的准确性上取得...

AI Projects12/18/2025

PDFMathTranslate - 开源的PDF文档翻译和双语对照工具

PDFMathTranslate是开源的PDF文档翻译工具，设计用于翻译科技论文等PDF文件，能保留原文的排版，包括公式和图表。PDFMathTranslate支持双语对照，保持原有目...

AI Projects12/18/2025

MoneyPrinterTurbo - 开源的AI短视频生成工具

MoneyPrinterTurbo是开源的AI短视频生成工具，能自动化地根据用户提供的视频主题或关键词生成视频文案、素材、字幕和背景音乐，合成高清短视频。工具支持API...

AI Projects12/18/2025

文心iRAG - 百度推出检索增强的文生图技术，解决生成上的幻觉问题

文心iRAG是百度在2024年百度世界大会上推出的检索增强的文生图技术（iRAG）技术，结合了百度搜索的亿级图片资源和强大的基础模型能力，解决大模型在文生图方...

AI Projects12/18/2025

Vidu 1.5 - 生数科技推出支持多主体一致性的多模态大模型

Vidu 1.5是生数科技推出的AI视频生成平台最新版本，致力于帮助创作者自由表达和高效创作。具备多模态视频大模型，支持参考生视频、图生视频和文生视频，确保...

←1...51 52 53 54 55 56 57...137 →

AI News

AI Projects12/18/2025

All Categories

AI News

CogSound - 智谱AI最新推出的音效模型

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

Infinity-MM - 智源推出的千万级多模态指令数据集

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

SeedEdit - 字节豆包团队推出的AI图像编辑模型

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

TableGPT2 - 浙大推出整合与处理表格数据的多模态大模型

GenXD - 新加坡国立和微软共同推出的通用3D和4D联合生成框架

AlphaFold 3 - 谷歌DeepMind开源的结构预测统一框架

PDFMathTranslate - 开源的PDF文档翻译和双语对照工具

MoneyPrinterTurbo - 开源的AI短视频生成工具

文心iRAG - 百度推出检索增强的文生图技术，解决生成上的幻觉问题

Vidu 1.5 - 生数科技推出支持多主体一致性的多模态大模型

AI News

CogSound - 智谱AI最新推出的音效模型

AgentSquare - 清华推出模块化智能体系统设计和搜索新框架

Fashion-VDM - 谷歌和华盛顿大学联合推出的虚拟试穿技术

olly.bot - 个人AI助理，集成多种通用AI能力支持本地使用

AdaCache - Meta推出加速AI视频实时高质量生成的开源项目

CogVideoX v1.5 - 智谱最新开源的AI视频生成模型

MiLoRA - 上海财经、南方科技和清华大学联合推出针对LLMs的微调方法

OpenCoder - 无限光年联合多所高校推出的开源代码大型语言模型

Infinity-MM - 智源推出的千万级多模态指令数据集

FabricDiffusion - 谷歌联合卡内基梅隆大学推出的高保真度3D服装生成技术

HourVideo - 李飞飞和吴佳俊团队推出的长视频理解基准数据集

App Intents - 苹果推出的集成Siri和Apple Intelligence新框架

DimensionX - 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架

SeedEdit - 字节豆包团队推出的AI图像编辑模型

HK-O1aw - HKGAI团队联合北大团队推出的慢思考范式法律推理大模型

AnimePro FLUX - 动漫风格图像生成模型，基于Flux.1 Shnell模型微调

VideoChat - 开源的实时数字人对话系统，首包延迟低至3秒

TableGPT2 - 浙大推出整合与处理表格数据的多模态大模型

GenXD - 新加坡国立和微软共同推出的通用3D和4D联合生成框架

AlphaFold 3 - 谷歌DeepMind开源的结构预测统一框架

PDFMathTranslate - 开源的PDF文档翻译和双语对照工具

MoneyPrinterTurbo - 开源的AI短视频生成工具

文心iRAG - 百度推出检索增强的文生图技术，解决生成上的幻觉问题

Vidu 1.5 - 生数科技推出支持多主体一致性的多模态大模型