AiBossCross-market AI tools discovery, in your language

AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

FinRobot - 开源 AI Agent 平台，解决金融领域应用的综合解决方案

FinRobot是开源的AI代理平台，专注于金融领域的应用。基于大型语言模型（LLMs）来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链（CoT）提示...

AI Projects12/18/2025

DeepSeek V3 - DeepSeek开源的最新版 AI 模型，编程能力超越Claude

DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索（DeepSeek）开源的最新版AI模型，在多语言编程能力上的进步显著。在aider多语言编程测评中的表...

AI Projects12/18/2025

3DHM - 3D人体动作生成框架，单张图片生成任意视频动作

3DHM（3D Human Motions）是先进的3D人体动作生成技术，加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频，实现从静态图像...

AI Projects12/18/2025

Diff-Instruct - 从预训练扩散模型中迁移知识的通用框架

Diff-Instruct是先进的知识转移方法，用于从预训练的扩散模型中提取知识，指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leibler (IKL) 散...

AI Projects12/18/2025

VidTok - 微软开源的视频分词器，支持连续和离散分词化

VidTok（Video Tokenizer）是微软开源的先进的视频分词器，通过高效的算法将视频内容转换成一系列“视频词”。支持连续和离散分词化，具有灵活的压缩率和多样化...

AI Projects12/18/2025

Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型，能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正...

AI Projects12/18/2025

ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型，是对经典BERT模型的一次重大升级。...

AI Projects12/18/2025

cobalt是开源免费的图片、音频和视频下载工具，提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载，包括主流视频网站、社交媒体和音乐平台。

AI Projects12/18/2025

CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型，仅依赖屏幕截图作为输入，无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理，具备双语（中英文...

AI Projects12/18/2025

AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架，专为自主GUI智能体设计，能在各种平台（如网页、桌面、移动设备）上操作。AGUVIS基于图像观察和...

AI Projects12/18/2025

Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生成增强算法。算法能够显著提升AI视频的生成质量，特别是在...

AI Projects12/18/2025

Valley是字节跳动推出的多模态大模型，用于处理涉及文本、图像和视频数据的多样化任务。Valley在内部电子商务和短视频基准测试中取得了最佳成绩，并在OpenCom...

AI Projects12/18/2025

联通元景（UniT2IXL）是中国联通AI推出的中文原生文生图模型，完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块，优化中文长文本...

AI Projects12/18/2025

DiTCtrl是基于多模态扩散变换器（MM-DiT）架构的多提示视频生成方法，是香港中文大学和腾讯等机构联合推出的。DiTCtrl能在无需额外训练的情况下，实现多个文...

AI Projects12/18/2025

MNN（Mobile Neural Network）是阿里巴巴集团开源的轻量级深度学习推理框架，为移动端、服务器、个人电脑、嵌入式设备等多种设备提供高效的模型部署能力。MNN...

AI Projects12/18/2025

启元重症大模型是腾讯和迈瑞医疗联合发布的全球首个重症医疗大模型，专为ICU病房设计，解决重症监护中的痛点问题。模型整体参数量达到万亿级别，经过大量医学...

AI Projects12/18/2025

Poetry2Image是一个专为中文古诗词图像生成设计的迭代校正框架，哈尔滨工业大学提出。框架通过自动化的反馈和校正循环，增强了诗歌与图像之间的一致性，有效...

AI Projects12/18/2025

PeterCat是开源的智能答疑机器人助手。PeterCat能帮助开发者和社区维护者更高效地解决技术问题，提升社区支持效率。PeterCat基于自动构建知识库，能与GitHub...

AI Projects12/18/2025

PartGen是先进的3D对象生成和重建框架，是牛津大学的视觉几何小组和Meta AI共同推出的。PartGen能识别并生成由有意义部分组成的3D对象，3D对象能基于文本提示...

AI Projects12/18/2025

Vision Parse是开源的PDF文档转换工具，基于视觉语言模型（Vision LLMs）将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格，且...

AI Projects12/18/2025

The Language of Motion是斯坦福大学李飞飞团队推出的多模态语言模型，能整合人类动作中的言语和非言语语言。模型能处理文本、语音和动作数据，生成对应的目...

AI Projects12/18/2025

Mathtutor on Groq 是基于 Groq 架构的AI数学辅导工具，基于语音识别功能，支持用户用语音形式提出数学问题。工具内置强大的数学引擎，能实时计算并用 LaTeX ...

AI Projects12/18/2025

VE-Bench 是北京大学的研究团队 MMCAL 最近发布首个专门针对视频编辑质量评估的指标。VE-Bench 的设计目标是与人类感知能力高度一致，更准确地评估视频编辑效...

AI Projects12/18/2025

EDTalk是上海交通大学联合网易研发的音频驱动唇部同步模型，能实现对嘴型、头部姿态和情感表情的独立操控。只需上传一张图片、一段音频和参考视频，就能驱动...

......

All Categories

AI News

FinRobot - 开源 AI Agent 平台，解决金融领域应用的综合解决方案

DeepSeek V3 - DeepSeek开源的最新版 AI 模型，编程能力超越Claude

3DHM - 3D人体动作生成框架，单张图片生成任意视频动作

Diff-Instruct - 从预训练扩散模型中迁移知识的通用框架

VidTok - 微软开源的视频分词器，支持连续和离散分词化

Infinity - 字节跳动推出的高分辨率图像生成模型

ModernBERT - 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

cobalt - 开源免费的图片、音频和视频下载工具

CogAgent-9B - 智谱AI开源 GLM-PC 的基座模型

AGUVIS - 香港大学联合 Salesforce 推出统一纯视觉的GUI自动化框架

Enhance-A-Video - 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

Valley - 字节跳动推出的多模态大模型

联通元景 - 中国联通AI开源的中文原生文生图模型

DiTCtrl - 港中文联合腾讯等机构推出的多提示视频生成方法

MNN - 阿里开源的移动端深度学习推理框架

启元重症大模型 - 腾讯和迈瑞医疗联合推出的重症医疗大模型

Poetry2Image - 专为中文古诗词图像生成设计的迭代校正框架

PeterCat - AI问答机器人，自动抓取 GitHub 上的文档和 issue 作为知识库

PartGen - 牛津大学联合 Meta AI 推出的3D对象生成和重建框架

Vision Parse - 开源的 PDF 转 Markdown 工具

The Language of Motion - 斯坦福李飞飞团队推出的统一多模态语言模型

Mathtutor on Groq - AI数学辅导工具，支持用语音形式提出数学问题

VE-Bench - 北京大学开源首个针对视频编辑质量评估的新指标

EDTalk - 上海交大联合网易推出高效解耦的情感说话头像合成模型