AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

QLIP - 英伟达推出的视觉标记化方法

QLIP（Quantized Language-Image Pretraining）是英伟达等推出的视觉标记化方法，结合高质量的图像重建和零样本图像理解能力。QLIP二进制球形量化（BSQ）的自...

AI Projects12/18/2025

ZeroSearch - 阿里通义开源的大模型搜索引擎框架

ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架，基于强化学习激励大模型的搜索能力，无需与真实搜索引擎交互。框架爱基于大模型预训练知识，...

AI Projects12/18/2025

Chatlog - 开源AI聊天记录分析工具，自动解析、可视化和挖掘聊天记录

Chatlog是开源的聊天记录分析工具，支持高效解析、可视化和挖掘微信、QQ、Telegram等主流聊天工具的聊天记录。工具支持从本地数据库文件获取数据，提供智能分...

AI Projects12/18/2025

SuperEdit - 字节跳动等机构推出的图像编辑方法

SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法，基于优化监督信号提高图像编辑的精度和效果。SuperE...

AI Projects12/18/2025

FlowGram - 字节跳动开源的可视化工作流搭建引擎

FlowGram是字节跳动开源的基于节点编辑的可视化工作流搭建引擎，帮助开发者快速构建固定布局或自由连线布局的工作流。支持两种布局模式：固定布局适合顺序工...

AI Projects12/18/2025

Mogao - 字节跳动Seed团队推出的多模态理解与生成统一架构

Mogao是字节跳动Seed团队推出的交错多模态生成全基础模型。在架构上采用了双视觉编码器，结合变分自编码器（VAE）和视觉变换器（ViT），能更好地进行视觉理解...

AI Projects12/18/2025

Scenethesis - 英伟达推出的交互式3D场景生成框架

Scenethesis 是 NVIDIA 推出的创新框架，用在从文本生成交互式 3D 场景。框架结合大型语言模型（LLM）和视觉感知技术，基于多阶段流程实现高效生成，用 LLM ...

AI Projects12/18/2025

Seed-Coder - 字节跳动开源的代码模型系列

Seed-Coder是字节跳动开源的8B规模代码模型系列，提升代码生成与理解能力。包含Base、Instruct和Reasoning三个版本，分别适用于代码补全、指令遵循和复杂推理...

AI Projects12/18/2025

LegoGPT - 卡内基梅隆大学推出的乐高积木设计模型

LegoGPT 是卡内基梅隆大学推出的乐高积木设计模型，支持基于文本提示生成物理稳定且能构建的乐高积木模型。LegoGPT 基于自回归语言模型和大规模乐高设计数据...

AI Projects12/18/2025

BILIVE - 开源AI录播工具，一站式自动直播录制与处理

BILIVE 是一款基于 AI 技术的开源工具，专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕，支持语音识别、自动切片精彩片段，生成有趣的...

AI Projects12/18/2025

LTXV-13B - Lightricks开源的最新视频生成模型

LTXV-13B 是Lightricks推出的开源 AI 视频生成模型，拥有 130 亿参数。具备极高的生成速度，比同类产品快 30 倍，能在普通消费级显卡（如 4090/5090）上运行...

AI Projects12/18/2025

PixelHacker - 华中科技联合VIVO推出的图像修复模型

PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复（Image Inpainting）模型。基于引入潜在类别引导（Latent Categories Guidance, LCG）范式，分...

AI Projects12/18/2025

ZenCtrl - Fotographer AI 推出的商品图生成AI工具

ZenCtrl 是 Fotographer AI 推出的 AI 图像生成工具，支持从单张图像生成高质量、多视角和多样化场景的图像，无需额外训练数据。

AI Projects12/18/2025

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型，基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文 SOTA 效...

AI Projects12/18/2025

FastVLM - 苹果推出的高效视觉语言模型

FastVLM是苹果推出的高效的视觉语言模型（VLM），能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器，有效减少视觉token数量，显著...

AI Projects12/18/2025

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域带来了重大突破。无需...

AI Projects12/18/2025

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

PrimitiveAnything是腾讯人工智能平台部（AIPD）和清华大学联合开发的新型3D形状生成框架。将复杂的3D形状分解为简单的基元元素，通过自回归方式生成这些基元...

AI Projects12/18/2025

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

OptoChat AI是南智光电与南京大学共同推出的国内首款光子专用大模型。模型聚焦光子领域全产业链，集成超过30万条光子芯片相关专利、文献和行业数据资源，具备...

AI Projects12/18/2025

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

Xianyu AutoAgent 是为闲鱼平台设计的智能客服机器人系统。支持实现7×24小时自动化值守，多专家协同决策、智能议价及上下文感知对话。基于上下文感知技术，管...

AI Projects12/18/2025

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

Matrix-Game是昆仑万维开源的工业界首个10B+空间智能大模型，是Matrix-Zero世界模型中的可交互视频生成大模型。模型基于两阶段训练策略，根据用户输入生成连...

AI Projects12/18/2025

GitFriend - AI GitHub助手，自动生成定制化README文件

GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具，能简化 GitHub 的使用流程，提升开发效率。GitFriend支持基于 AI 聊天功能为用户...

AI Projects12/18/2025

Muyan-TTS - 开源文本转语音模型，零样本语音合成

Muyan-TTS 是为播客场景设计的开源文本转语音（TTS）模型。模型预训练超过10万小时的播客音频数据，能实现零样本语音合成，无需大量目标说话人的语音数据可生...

AI Projects12/18/2025

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

Chinese-LiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集，包含100小时的语音、视频和手动转录文本，创新性地融合了唇读视频和演讲...

AI Projects12/18/2025

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

ViLAMP（VIdeo-LAnguage Model with Mixed Precision）是蚂蚁集团和中国人民大学联合推出的视觉语言模型，专门用在高效处理长视频内容。基于混合精度策略，对...

←1...88 89 90 91 92 93 94...123 →

AI News

AI Projects12/18/2025

QLIP - 英伟达推出的视觉标记化方法

QLIP（Quantized Language-Image Pretraining）是英伟达等推出的视觉标记化方法，结合高质量的图像重建和零样本图像理解能力。QLIP二进制球形量化（BSQ）的自...

AI Projects12/18/2025

ZeroSearch - 阿里通义开源的大模型搜索引擎框架

AI Projects12/18/2025

Chatlog - 开源AI聊天记录分析工具，自动解析、可视化和挖掘聊天记录

AI Projects12/18/2025

SuperEdit - 字节跳动等机构推出的图像编辑方法

AI Projects12/18/2025

FlowGram - 字节跳动开源的可视化工作流搭建引擎

AI Projects12/18/2025

Mogao - 字节跳动Seed团队推出的多模态理解与生成统一架构

AI Projects12/18/2025

Scenethesis - 英伟达推出的交互式3D场景生成框架

AI Projects12/18/2025

Seed-Coder - 字节跳动开源的代码模型系列

AI Projects12/18/2025

LegoGPT - 卡内基梅隆大学推出的乐高积木设计模型

AI Projects12/18/2025

BILIVE - 开源AI录播工具，一站式自动直播录制与处理

AI Projects12/18/2025

LTXV-13B - Lightricks开源的最新视频生成模型

LTXV-13B 是Lightricks推出的开源 AI 视频生成模型，拥有 130 亿参数。具备极高的生成速度，比同类产品快 30 倍，能在普通消费级显卡（如 4090/5090）上运行...

AI Projects12/18/2025

PixelHacker - 华中科技联合VIVO推出的图像修复模型

PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复（Image Inpainting）模型。基于引入潜在类别引导（Latent Categories Guidance, LCG）范式，分...

AI Projects12/18/2025

ZenCtrl - Fotographer AI 推出的商品图生成AI工具

ZenCtrl 是 Fotographer AI 推出的 AI 图像生成工具，支持从单张图像生成高质量、多视角和多样化场景的图像，无需额外训练数据。

AI Projects12/18/2025

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

Seed1.5-Embedding 是字节跳动 Seed 团队最新发布的向量模型，基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文 SOTA 效...

AI Projects12/18/2025

FastVLM - 苹果推出的高效视觉语言模型

AI Projects12/18/2025

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域带来了重大突破。无需...

AI Projects12/18/2025

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

AI Projects12/18/2025

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

AI Projects12/18/2025

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

AI Projects12/18/2025

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

AI Projects12/18/2025

GitFriend - AI GitHub助手，自动生成定制化README文件

GitFriend 是基于 React、TypeScript 和 AI 技术推出的 AI GitHub 辅助工具，能简化 GitHub 的使用流程，提升开发效率。GitFriend支持基于 AI 聊天功能为用户...

AI Projects12/18/2025

Muyan-TTS - 开源文本转语音模型，零样本语音合成

AI Projects12/18/2025

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

AI Projects12/18/2025

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

ViLAMP（VIdeo-LAnguage Model with Mixed Precision）是蚂蚁集团和中国人民大学联合推出的视觉语言模型，专门用在高效处理长视频内容。基于混合精度策略，对...

All Categories

AI News

QLIP - 英伟达推出的视觉标记化方法

ZeroSearch - 阿里通义开源的大模型搜索引擎框架

Chatlog - 开源AI聊天记录分析工具，自动解析、可视化和挖掘聊天记录

SuperEdit - 字节跳动等机构推出的图像编辑方法

FlowGram - 字节跳动开源的可视化工作流搭建引擎

Mogao - 字节跳动Seed团队推出的多模态理解与生成统一架构

Scenethesis - 英伟达推出的交互式3D场景生成框架

Seed-Coder - 字节跳动开源的代码模型系列

LegoGPT - 卡内基梅隆大学推出的乐高积木设计模型

BILIVE - 开源AI录播工具，一站式自动直播录制与处理

LTXV-13B - Lightricks开源的最新视频生成模型

PixelHacker - 华中科技联合VIVO推出的图像修复模型

ZenCtrl - Fotographer AI 推出的商品图生成AI工具

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

FastVLM - 苹果推出的高效视觉语言模型

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

GitFriend - AI GitHub助手，自动生成定制化README文件

Muyan-TTS - 开源文本转语音模型，零样本语音合成

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型

AI News

QLIP - 英伟达推出的视觉标记化方法

ZeroSearch - 阿里通义开源的大模型搜索引擎框架

Chatlog - 开源AI聊天记录分析工具，自动解析、可视化和挖掘聊天记录

SuperEdit - 字节跳动等机构推出的图像编辑方法

FlowGram - 字节跳动开源的可视化工作流搭建引擎

Mogao - 字节跳动Seed团队推出的多模态理解与生成统一架构

Scenethesis - 英伟达推出的交互式3D场景生成框架

Seed-Coder - 字节跳动开源的代码模型系列

LegoGPT - 卡内基梅隆大学推出的乐高积木设计模型

BILIVE - 开源AI录播工具，一站式自动直播录制与处理

LTXV-13B - Lightricks开源的最新视频生成模型

PixelHacker - 华中科技联合VIVO推出的图像修复模型

ZenCtrl - Fotographer AI 推出的商品图生成AI工具

Seed1.5-Embedding - 字节跳动 Seed 团队推出的向量模型

FastVLM - 苹果推出的高效视觉语言模型

Audio-SDS - NVIDIA推出的扩展文本条件音频扩散模型

PrimitiveAnything - 腾讯联合清华大学推出的新型3D形状生成框架

OptoChat AI - 南智光电联合南大推出的光子芯片领域专用大模型

Xianyu AutoAgent - AI闲鱼客服机器人，支持多专家协同决策

Matrix-Game - 昆仑万维开源的工业界首个空间智能大模型

GitFriend - AI GitHub助手，自动生成定制化README文件

Muyan-TTS - 开源文本转语音模型，零样本语音合成

Chinese-LiPS - 智源研究院联合南大开源的中文多模态语音识别数据集

ViLAMP - 蚂蚁联合人民大学推出的视觉语言模型