AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

AppFlowy - 开源的AI笔记和任务管理工具，对标Notion

AppFlowy 是一个开源的笔记和任务管理工具，被设计为 Notion 的替代品，提供了更好的隐私保护。使用 Rust 和 Flutter 构建，遵循极简原则，提供了足够的调整...

AI Projects12/18/2025

丰语大模型 - 顺丰推出物流行业的大语言模型，摘要准确率达95%+

丰语大模型是顺丰科技推出的物流行业专用大语言模型。顺丰科技表示，丰语大模型以更小的尺寸模型对更大尺寸通用模型在物流垂域的全面超越。丰语大模型已在市...

AI Projects12/18/2025

SAM2Point - 基于SAM2的零样本3D分割技术，增强3D分割精确度

SAM2Point是基于SAM2的3D分割技术，无需额外训练或 2D-3D 投影，直接对任意3D数据进行零样本分割。通过将3D数据体素化，模拟为多方向视频流，基于SAM2实现精...

AI Projects12/18/2025

CodeFuse-muAgent - 蚂蚁CodeFuse团队推出开源的多智能体框架

CodeFuse-muAgent 是蚂蚁集团 CodeFuse 团队开发的多智能体框架，基于知识图谱引擎来驱动智能体的编排和协作。简化智能体的标准操作程序编排流程。通过集成工...

AI Projects12/18/2025

VoxInstruct - 清华推出的开源语音合成技术，支持多语言和跨语言合成

VoxInstruct 是由清华大学开源的语音合成技术，能根据人类语言指令生成高度符合用户需求的语音。系统采用统一的多语言编解码器语言建模框架，将传统的文本到...

AI Projects12/18/2025

Pixtral 12B - Mistral AI推出的首款多模态AI模型

Pixtral 12B 是法国AI初创公司Mistral推出的首款多模态AI模型，能同时处理图像和文本。模型拥有 120 亿参数，模型大小约为 24GB，基于文本模型 Nemo 12B构建...

AI Projects12/18/2025

MMRole - AI多模态角色扮演智能体（MRPA）框架

MMRole是由中国人民大学高瓴人工智能学院研究团队推出的的一种多模态角色扮演智能体（MRPA）框架。通过结合图像和文本，使智能体以特定角色进行更自然和沉浸...

AI Projects12/18/2025

ReHiFace-S - 硅基智能推出的实时人脸替换AI技术

RReHiFace-S是由硅基智能团队推出的开源项目，实现高保真、实时人脸替换的AI算法，用户通过简单的操作在视频或直播中进行面部交换。

AI Projects12/18/2025

NarratoAI - 开源自动化影视解说和视频剪辑的AI工具

NarratoAI 是基于AI技术自动化影视解说和编辑的工具。通过大型语言模型（LLM）理解视频内容，自动生成解说文案，并将文案转化为配音，同时进行视频剪辑和字幕...

AI Projects12/18/2025

Skywork-Reward - 昆仑万维推出的高性能奖励模型，辅助智能体决策

Skywork-Reward 是昆仑万维推出的一系列高性能奖励模型，包括 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。主要用于指导和优化大语言模型的...

AI Projects12/18/2025

Torch-MLU - 寒武纪开源的PyTorch后端插件，支持大模型一键迁移

Torch-MLU 是寒武纪开源的 PyTorch 设备后端扩展插件，支持开发者将寒武纪 MLU 系列智能加速卡作为 PyTorch 的加速后端使用。插件实现了对 PyTorch 的原生支...

AI Projects12/18/2025

ImageBind - Meta推出开源多模态AI模型，实现六种多模态数据整合

ImageBind是Meta公司推出的开源多模态AI模型，将文本、音频、视觉、温度和运动数据等六种不同类型的信息整合到一个统一的嵌入空间中。模型通过图像模态作为桥...

AI Projects12/18/2025

LlamaCoder - 开发者的AI工具，快速创建全栈应用程序

LlamaCoder 是一个开源的 AI 工具，使用 Llama 3.1 405B 模型快速生成全栈应用程序。旨在提供一种替代 Claude Artifacts 的解决方案。集成了 Sandpack、Next....

AI Projects12/18/2025

XVERSE-MoE-A36B - 元象开源的国内最大MoE模型，推理性能提升100%

XVERSE-MoE-A36B是由元象推出的中国最大的MoE（Mixture of Experts，混合专家模型）开源大模型。模型具有2550亿的总参数和360亿的激活参数，性能上与超过100B...

AI Projects12/18/2025

PyVideoTrans - 开源的视频翻译和配音工具，支持多种语言

PyVideoTrans 是开源的视频翻译配音工具，将视频内容从一种语言自动翻译成另一种语言，并添加相应的字幕和配音。PyVideoTrans支持多语言，具备高效的语音识别...

AI Projects12/18/2025

LongCite - 清华推出的开源模型，提升LLMs的精准引用减少幻觉

ongCite是由清华大学推出的项目，旨在提升大型语言模型（LLMs）在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用，使用户能验证模型的...

AI Projects12/18/2025

CSGO AI - 小红书联合南理工推出的AI文生图项目

CSGO（Content-Style Composition in Text-to-Image Generation）是由南京理工大学、小红书等机构合作开发的图像风格迁移和文本到图像生成的研究项目。CSGO的...

AI Projects12/18/2025

GameGen-O - 腾讯推出的游戏视频生成模型，自动生成角色、场景、动作和事件

GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型，专门用于生成开放世界视频游戏。模型能模拟游戏引擎的多种功能，包括生成游戏角色、动...

AI Projects12/18/2025

mPLUG-DocOwl2 - 阿里推出多页文档理解的多模态大模型，单页仅需324个token

mPLUG-DocOwl 2是由阿里巴巴通义实验室mPLUG团队推出的用于多页文档理解的多模态大型语言模型。在不依赖光学字符识别（OCR）技术的情况下，通过高分辨率文档...

AI Projects12/18/2025

SleepFM - 斯坦福大学开源的多模态睡眠分析模型

SleepFM 是斯坦福大学开源的多模态睡眠分析模型，基于超过14,000名参与者的100,000小时睡眠数据，通过融合大脑活动、心电图和呼吸信号，提供全面的睡眠健康评...

AI Projects12/18/2025

QA-MDT - 中科大联合科大讯飞推出开源音乐生成模型

QA-MDT（Quality-aware Masked Diffusion Transformer）是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强...

AI Projects12/18/2025

书生·筑梦2.0（Vchitect 2.0） - 上海人工智能实验室推出的AI视频生成模型

书生·筑梦2.0（Vchitect 2.0）是由上海人工智能实验室推出的升级版视频生成开源大模型，旨在生成符合中国文化和东方审美的视频内容。模型支持长达20秒的视频...

AI Projects12/18/2025

AI Youtube Shorts Generator - 开源的AI视频编辑工具，自动分析视频提取精彩片段

AI Youtube Shorts Generator 是一款开源的 AI 视频编辑工具，基于 GPT-4、FFmpeg 和 OpenCV 等技术自动分析长视频，提取最精彩的片段，将其裁剪成适合短视频...

AI Projects12/18/2025

PhotoPrism - 开源的AI照片管理工具，AI驱动的照片分类和搜索功能

PhotoPrism 是一个开源的AI照片管理工具，用 Go 语言编写，旨在为用户提供一个去中心化的照片存储和组织解决方案。支持用户在自己的硬件上运行，完全控制自己...

←1...38 39 40 41 42 43 44...137 →

All Categories

AI News

AppFlowy - 开源的AI笔记和任务管理工具，对标Notion

丰语大模型 - 顺丰推出物流行业的大语言模型，摘要准确率达95%+

SAM2Point - 基于SAM2的零样本3D分割技术，增强3D分割精确度

CodeFuse-muAgent - 蚂蚁CodeFuse团队推出开源的多智能体框架

VoxInstruct - 清华推出的开源语音合成技术，支持多语言和跨语言合成

Pixtral 12B - Mistral AI推出的首款多模态AI模型

MMRole - AI多模态角色扮演智能体（MRPA）框架

ReHiFace-S - 硅基智能推出的实时人脸替换AI技术

NarratoAI - 开源自动化影视解说和视频剪辑的AI工具

Skywork-Reward - 昆仑万维推出的高性能奖励模型，辅助智能体决策

Torch-MLU - 寒武纪开源的PyTorch后端插件，支持大模型一键迁移

ImageBind - Meta推出开源多模态AI模型，实现六种多模态数据整合

LlamaCoder - 开发者的AI工具，快速创建全栈应用程序

XVERSE-MoE-A36B - 元象开源的国内最大MoE模型，推理性能提升100%

PyVideoTrans - 开源的视频翻译和配音工具，支持多种语言

LongCite - 清华推出的开源模型，提升LLMs的精准引用减少幻觉

CSGO AI - 小红书联合南理工推出的AI文生图项目

GameGen-O - 腾讯推出的游戏视频生成模型，自动生成角色、场景、动作和事件

mPLUG-DocOwl2 - 阿里推出多页文档理解的多模态大模型，单页仅需324个token

SleepFM - 斯坦福大学开源的多模态睡眠分析模型

QA-MDT - 中科大联合科大讯飞推出开源音乐生成模型

书生·筑梦2.0（Vchitect 2.0） - 上海人工智能实验室推出的AI视频生成模型

AI Youtube Shorts Generator - 开源的AI视频编辑工具，自动分析视频提取精彩片段

PhotoPrism - 开源的AI照片管理工具，AI驱动的照片分类和搜索功能

AI News

AppFlowy - 开源的AI笔记和任务管理工具，对标Notion

丰语大模型 - 顺丰推出物流行业的大语言模型，摘要准确率达95%+

SAM2Point - 基于SAM2的零样本3D分割技术，增强3D分割精确度

CodeFuse-muAgent - 蚂蚁CodeFuse团队推出开源的多智能体框架

VoxInstruct - 清华推出的开源语音合成技术，支持多语言和跨语言合成

Pixtral 12B - Mistral AI推出的首款多模态AI模型

MMRole - AI多模态角色扮演智能体（MRPA）框架

ReHiFace-S - 硅基智能推出的实时人脸替换AI技术

NarratoAI - 开源自动化影视解说和视频剪辑的AI工具

Skywork-Reward - 昆仑万维推出的高性能奖励模型，辅助智能体决策

Torch-MLU - 寒武纪开源的PyTorch后端插件，支持大模型一键迁移

ImageBind - Meta推出开源多模态AI模型，实现六种多模态数据整合

LlamaCoder - 开发者的AI工具，快速创建全栈应用程序

XVERSE-MoE-A36B - 元象开源的国内最大MoE模型，推理性能提升100%

PyVideoTrans - 开源的视频翻译和配音工具，支持多种语言

LongCite - 清华推出的开源模型，提升LLMs的精准引用减少幻觉

CSGO AI - 小红书联合南理工推出的AI文生图项目

GameGen-O - 腾讯推出的游戏视频生成模型，自动生成角色、场景、动作和事件

mPLUG-DocOwl2 - 阿里推出多页文档理解的多模态大模型，单页仅需324个token

SleepFM - 斯坦福大学开源的多模态睡眠分析模型

QA-MDT - 中科大联合科大讯飞推出开源音乐生成模型

书生·筑梦2.0（Vchitect 2.0） - 上海人工智能实验室推出的AI视频生成模型

AI Youtube Shorts Generator - 开源的AI视频编辑工具，自动分析视频提取精彩片段

PhotoPrism - 开源的AI照片管理工具，AI驱动的照片分类和搜索功能