AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

DeepEP - DeepSeek 开源的专家并行通信库，专为 MoE 训练和推理设计

DeepEP 是 DeepSeek 开源的首个专为混合专家模型（MoE）训练和推理设计的开源 EP（专家并行）通信库。提供了高吞吐量和低延迟的全对全 GPU 内核，支持节点内...

AI Projects12/18/2025

QwQ-Max - 阿里推出的深度推理模型，基于 Qwen2.5-Max

QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型，是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出，QwQ-Max即将正式发布并全面开源。QwQ-Max专...

AI Projects12/18/2025

FantasyID - 阿里联合北邮大学推出的身份保持视频生成框架

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成（IPT2V）框架，基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器（D...

AI Projects12/18/2025

SigStyle - 吉大联合 Adobe 等机构推出的风格迁移框架

SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架，支持将单张风格图像中独特的视觉特征（如几何结构、色彩搭配、笔触等...

AI Projects12/18/2025

VLM-R1 - 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像中的目标物体，如根据描述“图中红色的杯子”找到对应的图像区域。...

AI Projects12/18/2025

FacePoke - 开源的实时面部编辑工具，拖拽操作面部表情

FacePoke是基于AI技术的开源实时面部编辑工具。用户基于简单的鼠标拖拽操作，对人物照片中的头部朝向（如抬头、低头、左右摇头）和面部表情（如眼睛睁闭、眼...

AI Projects12/18/2025

BFS-Prover - 字节豆包推出的自动定理证明系统

BFS-Prover 是字节跳动豆包大模型团队推出的基于大语言模型（LLM）的自动定理证明系统，通过改进传统的广度优先搜索（BFS）算法，结合专家迭代、直接偏好优化...

AI Projects12/18/2025

PySpur - 开源 AI 代理构建工具，拖拽式构建 AI 工作流

PySpur 是开源的轻量级可视化 AI 智能体工作流构建器，简化 AI 系统的开发流程。基于拖拽式界面让用户能快速构建、测试和迭代 AI 工作流，无需编写复杂代码。...

AI Projects12/18/2025

Wan2.1 - 阿里开源的AI视频生成大模型

Wan2.1是阿里云开源的AI视频生成大模型，具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务，包含两种尺寸的模型，14B参数的专业版擅长复杂运动生成...

AI Projects12/18/2025

AgentRefine - 北京邮电大学联合美团推出的智能体合成框架

AgentRefine 是北京邮电大学和美团联合提出的智能体合成框架，通过“精炼调整”（Refinement Tuning）提升基于大型语言模型（LLM）的智能体在多样化任务中的泛...

AI Projects12/18/2025

DeepGEMM - DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法（GEMM）设计的库，目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家（MoE）分组的GEMM操作，...

AI Projects12/18/2025

TinyR1-Preview - 奇虎360联合北大团队推出的推理模型

TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量，逼近Deepseek-R1-671B的性能，TinyR1-Preview在数学领域...

AI Projects12/18/2025

SurveyX - 人民大学联合悉尼大学等推出自动化生成学术综述的系统

SurveyX 是基于大型语言模型（LLMs）自动化生成学术综述的系统，是中国人民大学、悉尼大学和中国东北大学联合推出的。基于用户提供论文标题和关键词，快速生...

AI Projects12/18/2025

Flame - 开源的多模态前端代码生成模型

Flame是开源的多模态AI模型，支持将UI设计截图转换为高质量的现代前端代码。Flame基于视觉语言建模、自动化数据合成和结构化训练流程，生成符合React等现代前...

AI Projects12/18/2025

OctoTools - 斯坦福推出解决复杂推理任务的开源智能体框架

OctoTools 是斯坦福大学推出的开源智能体框架，基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片（tool cards）封装工具功能，无需额外训练...

AI Projects12/18/2025

PhotoDoodle - 字节联合新加坡国立大学等推出的艺术化图像编辑框架

PhotoDoodle是新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合推出的艺术化图像编辑框架，基于少量样本学习艺术家的独特风格，实现照...

AI Projects12/18/2025

video-subtitle-master - 开源AI字幕生成工具，支持批量为视频或音频生成字幕

video-subtitle-master 是能批量为视频或音频生成字幕的工具，基于开源项目 VideoSubtitleGenerator 开发，支持批量为视频或音频生成字幕，将字幕翻译成其他...

AI Projects12/18/2025

DualPipe - DeepSeek 开源的双向流水线并行技术

DualPipe 是DeepSeek开源的创新的双向流水线并行技术，主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独立的管道——前向计算...

AI Projects12/18/2025

EPLB - DeepSeek 开源的专家并行负载均衡器

EPLB（Expert Parallelism Load Balancer）是 DeepSeek 推出的专家并行负载均衡器，能解决大规模模型训练中不同专家模型（Expert）负载不均的问题。EPLB 基于...

AI Projects12/18/2025

Profiling Data - DeepSeek开源训练和推理框架的性能分析数据

PProfiling Data是DeepSeek开源的训练和推理框架的性能分析数据，基于PyTorch Profiler捕获的程序运行过程中的详细信息，用在分析和优化软件性能。

AI Projects12/18/2025

Phi-4-Multimodal - 微软最新推出的多模态语言模型

Phi-4-Multimodal 是微软最新推出的多模态语言模型，拥有 56 亿参数，能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异，在自动...

AI Projects12/18/2025

R1-Onevision - 开源多模态视觉推理模型，基于 Qwen2.5-VL 微调

R1-Onevision 是开源的多模态大语言模型，专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成，通过整合视觉和文本数据，能精准地进行多模态信息解释。在数学...

AI Projects12/18/2025

Phi-4-Mini - 微软推出专注于文本任务的小型语言模型

Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型，参数量为 38 亿。基于密集的解码器-only Transformer 架构，结合分组查询注意力（G...

AI Projects12/18/2025

IndexTTS - B 站推出的文本转语音模型，支持拼音纠正汉字发音

IndexTTS 是 B 站推出的工业级可控文本转语音（TTS）系统。基于 XTTS 和 Tortoise 模型开发，结合了 GPT 风格的生成技术，能将文本高效转化为自然流畅的语音...

←1...83 84 85 86 87 88 89...137 →

AI News

AI Projects12/18/2025

DeepEP - DeepSeek 开源的专家并行通信库，专为 MoE 训练和推理设计

AI Projects12/18/2025

QwQ-Max - 阿里推出的深度推理模型，基于 Qwen2.5-Max

QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型，是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出，QwQ-Max即将正式发布并全面开源。QwQ-Max专...

AI Projects12/18/2025

FantasyID - 阿里联合北邮大学推出的身份保持视频生成框架

AI Projects12/18/2025

SigStyle - 吉大联合 Adobe 等机构推出的风格迁移框架

AI Projects12/18/2025

VLM-R1 - 浙大 Om AI Lab 推出的视觉语言模型

AI Projects12/18/2025

FacePoke - 开源的实时面部编辑工具，拖拽操作面部表情

AI Projects12/18/2025

BFS-Prover - 字节豆包推出的自动定理证明系统

AI Projects12/18/2025

PySpur - 开源 AI 代理构建工具，拖拽式构建 AI 工作流

AI Projects12/18/2025

Wan2.1 - 阿里开源的AI视频生成大模型

AI Projects12/18/2025

AgentRefine - 北京邮电大学联合美团推出的智能体合成框架

AI Projects12/18/2025

DeepGEMM - DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法（GEMM）设计的库，目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家（MoE）分组的GEMM操作，...

AI Projects12/18/2025

TinyR1-Preview - 奇虎360联合北大团队推出的推理模型

TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量，逼近Deepseek-R1-671B的性能，TinyR1-Preview在数学领域...

AI Projects12/18/2025

SurveyX - 人民大学联合悉尼大学等推出自动化生成学术综述的系统

AI Projects12/18/2025

Flame - 开源的多模态前端代码生成模型

AI Projects12/18/2025

OctoTools - 斯坦福推出解决复杂推理任务的开源智能体框架

AI Projects12/18/2025

PhotoDoodle - 字节联合新加坡国立大学等推出的艺术化图像编辑框架

AI Projects12/18/2025

video-subtitle-master - 开源AI字幕生成工具，支持批量为视频或音频生成字幕

video-subtitle-master 是能批量为视频或音频生成字幕的工具，基于开源项目 VideoSubtitleGenerator 开发，支持批量为视频或音频生成字幕，将字幕翻译成其他...

AI Projects12/18/2025

DualPipe - DeepSeek 开源的双向流水线并行技术

AI Projects12/18/2025

EPLB - DeepSeek 开源的专家并行负载均衡器

EPLB（Expert Parallelism Load Balancer）是 DeepSeek 推出的专家并行负载均衡器，能解决大规模模型训练中不同专家模型（Expert）负载不均的问题。EPLB 基于...

AI Projects12/18/2025

Profiling Data - DeepSeek开源训练和推理框架的性能分析数据

PProfiling Data是DeepSeek开源的训练和推理框架的性能分析数据，基于PyTorch Profiler捕获的程序运行过程中的详细信息，用在分析和优化软件性能。

AI Projects12/18/2025

Phi-4-Multimodal - 微软最新推出的多模态语言模型

AI Projects12/18/2025

R1-Onevision - 开源多模态视觉推理模型，基于 Qwen2.5-VL 微调

AI Projects12/18/2025

Phi-4-Mini - 微软推出专注于文本任务的小型语言模型

AI Projects12/18/2025

All Categories

AI News

DeepEP - DeepSeek 开源的专家并行通信库，专为 MoE 训练和推理设计

QwQ-Max - 阿里推出的深度推理模型，基于 Qwen2.5-Max

FantasyID - 阿里联合北邮大学推出的身份保持视频生成框架

SigStyle - 吉大联合 Adobe 等机构推出的风格迁移框架

VLM-R1 - 浙大 Om AI Lab 推出的视觉语言模型

FacePoke - 开源的实时面部编辑工具，拖拽操作面部表情

BFS-Prover - 字节豆包推出的自动定理证明系统

PySpur - 开源 AI 代理构建工具，拖拽式构建 AI 工作流

Wan2.1 - 阿里开源的AI视频生成大模型

AgentRefine - 北京邮电大学联合美团推出的智能体合成框架

DeepGEMM - DeepSeek 开源的 FP8 通用矩阵乘法库

TinyR1-Preview - 奇虎360联合北大团队推出的推理模型

SurveyX - 人民大学联合悉尼大学等推出自动化生成学术综述的系统

Flame - 开源的多模态前端代码生成模型

OctoTools - 斯坦福推出解决复杂推理任务的开源智能体框架

PhotoDoodle - 字节联合新加坡国立大学等推出的艺术化图像编辑框架

video-subtitle-master - 开源AI字幕生成工具，支持批量为视频或音频生成字幕

DualPipe - DeepSeek 开源的双向流水线并行技术

EPLB - DeepSeek 开源的专家并行负载均衡器

Profiling Data - DeepSeek开源训练和推理框架的性能分析数据

Phi-4-Multimodal - 微软最新推出的多模态语言模型

R1-Onevision - 开源多模态视觉推理模型，基于 Qwen2.5-VL 微调

Phi-4-Mini - 微软推出专注于文本任务的小型语言模型

IndexTTS - B 站推出的文本转语音模型，支持拼音纠正汉字发音

AI News

DeepEP - DeepSeek 开源的专家并行通信库，专为 MoE 训练和推理设计

QwQ-Max - 阿里推出的深度推理模型，基于 Qwen2.5-Max

FantasyID - 阿里联合北邮大学推出的身份保持视频生成框架

SigStyle - 吉大联合 Adobe 等机构推出的风格迁移框架

VLM-R1 - 浙大 Om AI Lab 推出的视觉语言模型

FacePoke - 开源的实时面部编辑工具，拖拽操作面部表情

BFS-Prover - 字节豆包推出的自动定理证明系统

PySpur - 开源 AI 代理构建工具，拖拽式构建 AI 工作流

Wan2.1 - 阿里开源的AI视频生成大模型

AgentRefine - 北京邮电大学联合美团推出的智能体合成框架

DeepGEMM - DeepSeek 开源的 FP8 通用矩阵乘法库

TinyR1-Preview - 奇虎360联合北大团队推出的推理模型

SurveyX - 人民大学联合悉尼大学等推出自动化生成学术综述的系统

Flame - 开源的多模态前端代码生成模型

OctoTools - 斯坦福推出解决复杂推理任务的开源智能体框架

PhotoDoodle - 字节联合新加坡国立大学等推出的艺术化图像编辑框架

video-subtitle-master - 开源AI字幕生成工具，支持批量为视频或音频生成字幕

DualPipe - DeepSeek 开源的双向流水线并行技术

EPLB - DeepSeek 开源的专家并行负载均衡器

Profiling Data - DeepSeek开源训练和推理框架的性能分析数据

Phi-4-Multimodal - 微软最新推出的多模态语言模型

R1-Onevision - 开源多模态视觉推理模型，基于 Qwen2.5-VL 微调

Phi-4-Mini - 微软推出专注于文本任务的小型语言模型

IndexTTS - B 站推出的文本转语音模型，支持拼音纠正汉字发音