AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

Baichuan4-Finance - 百川智能推出的全链路金融领域增强大模型

Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型，包括Baichuan4-Finance-Base和Baichuan4-Finance。基于Baichuan4-Turbo，用领域自约束训练，在...

AI Projects12/18/2025

VSI-Bench - 李飞飞谢赛宁团队推出的视觉空间智能基准测试集

VSI-Bench（Visual-Spatial Intelligence Benchmark）是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集，研究者构建用在评估多模态大型语言模...

AI Projects12/18/2025

Bamba-9B - 基于 Mamba2 架构的仅解码语言模型

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的，基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练，能提...

AI Projects12/18/2025

Univer - 开源 AI 办公工具，支持Word、Excel等文档处理全栈解决方案

Univer是开源的全栈框架，支持创建和编辑电子表格、文档及幻灯片，为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行，易于集成到各...

AI Projects12/18/2025

Kheish - 开源的多智能体协调平台，可灵活配置多个Agent解决复杂任务

Kheish是开源的、基于大型语言模型（LLM）的多智能体编排平台，用多个专门的角色（智能体）和灵活的工作流协调复杂任务的各个步骤，如提案生成、审核、验证和...

AI Projects12/18/2025

HelloMeme - 面部表情与姿态迁移框架，基于Stable Diffusion 1.5模型理解能力

HelloMeme是基于最新的Diffusion生成技术的框架，实现表情与姿态的迁移，HelloMeme集成空间编织注意力（Spatial Knitting Attentions）机制，基于Stable Diff...

AI Projects12/18/2025

InvSR - 开源图像超分辨率模型，高清修复老旧照片

InvSR是创新的图像超分辨率模型，基于扩散模型的逆过程恢复高分辨率图像。用大型预训练扩散模型中丰富的图像先验，改善超分辨率的效果。InvSR的核心在于深度...

AI Projects12/18/2025

CLEAR - 新加坡国立大学推出的线性注意力机制，生成8K图像时提速6.3倍

CLEAR是新加坡国立大学推出新型线性注意力机制，能提升预训练扩散变换器（DiTs）生成高分辨率图像的效率。基于将每个查询的注意力限制在局部窗口内，CLEAR实...

AI Projects12/18/2025

DisPose - 北大等多所高校推出的增强人物图像控制动画质量的技术

DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的，提高人物图像动画质量的控制技术，基于从骨骼姿态和参考图像中提取有效...

AI Projects12/18/2025

OCTAVE - Hume AI推出的语音语言模型

OCTAVE（Omni-Capable Text and Voice Engine）是Hume AI推出的新一代语音语言模型，结合EVI 2模型和OpenAI、Elevenlab、Google Deepmind等系统的能力。OCTAV...

AI Projects12/18/2025

Granite 3.1 - IBM 推出的新版语言模型

Granite 3.1是IBM推出的新一代语言模型，具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构：密集模型2B和8B参数模型...

AI Projects12/18/2025

Sketch2Sound - Adobe 联合西北大学推出的AI音频生成技术

Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术，能基于声音模仿和文本提示生成高品质音效。Sketch2Sound从声音模仿中提取响度、亮度和音高三个...

AI Projects12/18/2025

OmniAudio-2.6B - Nexa AI推出的端侧多模态音频语言模型

OmniAudio-2.6B是Nexa AI推出的音频语言模型，专为边缘部署设计，能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2...

AI Projects12/18/2025

DreamOmni - 港中文、字节等机构共同推出的统一图像生成和编辑模型

DreamOmni 是香港中文大学、字节跳动和香港科技大学共同推出的统一图像生成和编辑模型。模型整合文本到图像（T2I）生成和多种编辑任务，包括指令式编辑、修复...

AI Projects12/18/2025

QVQ - 阿里通义开源的视觉推理模型

QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型，结合视觉理解和复杂问题解决能力，提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力，尤...

AI Projects12/18/2025

Open Notebook - 开源 AI 笔记工具，自动将多格式笔记转换成博客

Open Notebook是开源、注重隐私的谷歌NotebookLM替代工具，能帮助用户管理研究工作流程，生成AI辅助笔记，并与内容互动。Open Notebook支持多笔记本、多模型...

AI Projects12/18/2025

PC Agent - 上海交大联合 GAIR 推出的电脑智能体AI系统

PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。系统基于模拟人类认知过程，执行如组织研究材料、起草报告和创建演示文稿...

AI Projects12/18/2025

Midscene.js - AI驱动的 UI 自动化测试框架

Midscene.js是基于AI技术的自动化SDK，通过用大型语言模型（LLM）简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式，Midscene.js将执行...

AI Projects12/18/2025

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

ASAL（Automated Search for Artificial Life）是用基础模型自动化搜索人工生命（ALife）系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的，主要基于三种...

AI Projects12/18/2025

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

Browser Use是专门为大语言模型服务的智能浏览器工具，创新的Python工具库，让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉...

AI Projects12/18/2025

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

TRELLIS是清华大学、中国科学技术大学和微软研究院推出的3D生成模型，基于Structured LATent（SLAT）表示法，从文本或图像提示中生成高质量、多样化的3D资产...

AI Projects12/18/2025

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

WiS（Who is Spy）是淘天集团和阿里的技术研究团队推出的创新在线AI竞赛平台，专门设计用在测试和分析基于大型语言模型（LLMs）的多智能体系统（MAS）。WiS模...

AI Projects12/18/2025

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

DRT-o1是腾讯研究院推出的一系列AI模型，通过长链思考推理（CoT）技术显著提升了文学作品的翻译质量，尤其在处理比喻和隐喻等修辞手法时。模型能更深入地理解...

AI Projects12/18/2025

FastExcel - 开源的高性能 Excel 处理工具

FastExcel是基于Java的开源库，提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel，提供性能优化、bug修复，新增如读取指定...

←1...64 65 66 67 68 69 70...137 →

AI News

AI Projects12/18/2025

Baichuan4-Finance - 百川智能推出的全链路金融领域增强大模型

Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型，包括Baichuan4-Finance-Base和Baichuan4-Finance。基于Baichuan4-Turbo，用领域自约束训练，在...

AI Projects12/18/2025

VSI-Bench - 李飞飞谢赛宁团队推出的视觉空间智能基准测试集

VSI-Bench（Visual-Spatial Intelligence Benchmark）是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集，研究者构建用在评估多模态大型语言模...

AI Projects12/18/2025

Bamba-9B - 基于 Mamba2 架构的仅解码语言模型

AI Projects12/18/2025

Univer - 开源 AI 办公工具，支持Word、Excel等文档处理全栈解决方案

AI Projects12/18/2025

Kheish - 开源的多智能体协调平台，可灵活配置多个Agent解决复杂任务

AI Projects12/18/2025

HelloMeme - 面部表情与姿态迁移框架，基于Stable Diffusion 1.5模型理解能力

HelloMeme是基于最新的Diffusion生成技术的框架，实现表情与姿态的迁移，HelloMeme集成空间编织注意力（Spatial Knitting Attentions）机制，基于Stable Diff...

AI Projects12/18/2025

InvSR - 开源图像超分辨率模型，高清修复老旧照片

AI Projects12/18/2025

CLEAR - 新加坡国立大学推出的线性注意力机制，生成8K图像时提速6.3倍

AI Projects12/18/2025

DisPose - 北大等多所高校推出的增强人物图像控制动画质量的技术

AI Projects12/18/2025

OCTAVE - Hume AI推出的语音语言模型

OCTAVE（Omni-Capable Text and Voice Engine）是Hume AI推出的新一代语音语言模型，结合EVI 2模型和OpenAI、Elevenlab、Google Deepmind等系统的能力。OCTAV...

AI Projects12/18/2025

Granite 3.1 - IBM 推出的新版语言模型

AI Projects12/18/2025

Sketch2Sound - Adobe 联合西北大学推出的AI音频生成技术

AI Projects12/18/2025

OmniAudio-2.6B - Nexa AI推出的端侧多模态音频语言模型

OmniAudio-2.6B是Nexa AI推出的音频语言模型，专为边缘部署设计，能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2...

AI Projects12/18/2025

DreamOmni - 港中文、字节等机构共同推出的统一图像生成和编辑模型

AI Projects12/18/2025

QVQ - 阿里通义开源的视觉推理模型

AI Projects12/18/2025

Open Notebook - 开源 AI 笔记工具，自动将多格式笔记转换成博客

AI Projects12/18/2025

PC Agent - 上海交大联合 GAIR 推出的电脑智能体AI系统

AI Projects12/18/2025

Midscene.js - AI驱动的 UI 自动化测试框架

AI Projects12/18/2025

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

ASAL（Automated Search for Artificial Life）是用基础模型自动化搜索人工生命（ALife）系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的，主要基于三种...

AI Projects12/18/2025

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

AI Projects12/18/2025

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

AI Projects12/18/2025

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

AI Projects12/18/2025

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

AI Projects12/18/2025

All Categories

AI News

Baichuan4-Finance - 百川智能推出的全链路金融领域增强大模型

VSI-Bench - 李飞飞谢赛宁团队推出的视觉空间智能基准测试集

Bamba-9B - 基于 Mamba2 架构的仅解码语言模型

Univer - 开源 AI 办公工具，支持Word、Excel等文档处理全栈解决方案

Kheish - 开源的多智能体协调平台，可灵活配置多个Agent解决复杂任务

HelloMeme - 面部表情与姿态迁移框架，基于Stable Diffusion 1.5模型理解能力

InvSR - 开源图像超分辨率模型，高清修复老旧照片

CLEAR - 新加坡国立大学推出的线性注意力机制，生成8K图像时提速6.3倍

DisPose - 北大等多所高校推出的增强人物图像控制动画质量的技术

OCTAVE - Hume AI推出的语音语言模型

Granite 3.1 - IBM 推出的新版语言模型

Sketch2Sound - Adobe 联合西北大学推出的AI音频生成技术

OmniAudio-2.6B - Nexa AI推出的端侧多模态音频语言模型

DreamOmni - 港中文、字节等机构共同推出的统一图像生成和编辑模型

QVQ - 阿里通义开源的视觉推理模型

Open Notebook - 开源 AI 笔记工具，自动将多格式笔记转换成博客

PC Agent - 上海交大联合 GAIR 推出的电脑智能体AI系统

Midscene.js - AI驱动的 UI 自动化测试框架

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

FastExcel - 开源的高性能 Excel 处理工具

AI News

Baichuan4-Finance - 百川智能推出的全链路金融领域增强大模型

VSI-Bench - 李飞飞谢赛宁团队推出的视觉空间智能基准测试集

Bamba-9B - 基于 Mamba2 架构的仅解码语言模型

Univer - 开源 AI 办公工具，支持Word、Excel等文档处理全栈解决方案

Kheish - 开源的多智能体协调平台，可灵活配置多个Agent解决复杂任务

HelloMeme - 面部表情与姿态迁移框架，基于Stable Diffusion 1.5模型理解能力

InvSR - 开源图像超分辨率模型，高清修复老旧照片

CLEAR - 新加坡国立大学推出的线性注意力机制，生成8K图像时提速6.3倍

DisPose - 北大等多所高校推出的增强人物图像控制动画质量的技术

OCTAVE - Hume AI推出的语音语言模型

Granite 3.1 - IBM 推出的新版语言模型

Sketch2Sound - Adobe 联合西北大学推出的AI音频生成技术

OmniAudio-2.6B - Nexa AI推出的端侧多模态音频语言模型

DreamOmni - 港中文、字节等机构共同推出的统一图像生成和编辑模型

QVQ - 阿里通义开源的视觉推理模型

Open Notebook - 开源 AI 笔记工具，自动将多格式笔记转换成博客

PC Agent - 上海交大联合 GAIR 推出的电脑智能体AI系统

Midscene.js - AI驱动的 UI 自动化测试框架

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

FastExcel - 开源的高性能 Excel 处理工具