AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Midscene.js - AI驱动的 UI 自动化测试框架

Midscene.js是基于AI技术的自动化SDK，通过用大型语言模型（LLM）简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式，Midscene.js将执行...

AIプロジェクト2025/12/18

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

ASAL（Automated Search for Artificial Life）是用基础模型自动化搜索人工生命（ALife）系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的，主要基于三种...

AIプロジェクト2025/12/18

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

Browser Use是专门为大语言模型服务的智能浏览器工具，创新的Python工具库，让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉...

AIプロジェクト2025/12/18

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

TRELLIS是清华大学、中国科学技术大学和微软研究院推出的3D生成模型，基于Structured LATent（SLAT）表示法，从文本或图像提示中生成高质量、多样化的3D资产...

AIプロジェクト2025/12/18

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

WiS（Who is Spy）是淘天集团和阿里的技术研究团队推出的创新在线AI竞赛平台，专门设计用在测试和分析基于大型语言模型（LLMs）的多智能体系统（MAS）。WiS模...

AIプロジェクト2025/12/18

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

DRT-o1是腾讯研究院推出的一系列AI模型，通过长链思考推理（CoT）技术显著提升了文学作品的翻译质量，尤其在处理比喻和隐喻等修辞手法时。模型能更深入地理解...

AIプロジェクト2025/12/18

FastExcel - 开源的高性能 Excel 处理工具

FastExcel是基于Java的开源库，提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel，提供性能优化、bug修复，新增如读取指定...

AIプロジェクト2025/12/18

FinRobot - 开源 AI Agent 平台，解决金融领域应用的综合解决方案

FinRobot是开源的AI代理平台，专注于金融领域的应用。基于大型语言模型（LLMs）来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链（CoT）提示...

AIプロジェクト2025/12/18

DeepSeek V3 - DeepSeek开源的最新版 AI 模型，编程能力超越Claude

DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索（DeepSeek）开源的最新版AI模型，在多语言编程能力上的进步显著。在aider多语言编程测评中的表...

AIプロジェクト2025/12/18

3DHM - 3D人体动作生成框架，单张图片生成任意视频动作

3DHM（3D Human Motions）是先进的3D人体动作生成技术，加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频，实现从静态图像...

AIプロジェクト2025/12/18

Diff-Instruct - 从预训练扩散模型中迁移知识的通用框架

Diff-Instruct是先进的知识转移方法，用于从预训练的扩散模型中提取知识，指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leibler (IKL) 散...

AIプロジェクト2025/12/18

VidTok - 微软开源的视频分词器，支持连续和离散分词化

VidTok（Video Tokenizer）是微软开源的先进的视频分词器，通过高效的算法将视频内容转换成一系列“视频词”。支持连续和离散分词化，具有灵活的压缩率和多样化...

AIプロジェクト2025/12/18

Infinity - 字节跳动推出的高分辨率图像生成模型

Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型，能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正...

AIプロジェクト2025/12/18

ModernBERT - 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型，是对经典BERT模型的一次重大升级。...

AIプロジェクト2025/12/18

cobalt - 开源免费的图片、音频和视频下载工具

cobalt是开源免费的图片、音频和视频下载工具，提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载，包括主流视频网站、社交媒体和音乐平台。

AIプロジェクト2025/12/18

CogAgent-9B - 智谱AI开源 GLM-PC 的基座模型

CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型，仅依赖屏幕截图作为输入，无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理，具备双语（中英文...

AIプロジェクト2025/12/18

AGUVIS - 香港大学联合 Salesforce 推出统一纯视觉的GUI自动化框架

AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架，专为自主GUI智能体设计，能在各种平台（如网页、桌面、移动设备）上操作。AGUVIS基于图像观察和...

AIプロジェクト2025/12/18

Enhance-A-Video - 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生成增强算法。算法能够显著提升AI视频的生成质量，特别是在...

AIプロジェクト2025/12/18

Valley - 字节跳动推出的多模态大模型

Valley是字节跳动推出的多模态大模型，用于处理涉及文本、图像和视频数据的多样化任务。Valley在内部电子商务和短视频基准测试中取得了最佳成绩，并在OpenCom...

AIプロジェクト2025/12/18

联通元景 - 中国联通AI开源的中文原生文生图模型

联通元景（UniT2IXL）是中国联通AI推出的中文原生文生图模型，完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块，优化中文长文本...

AIプロジェクト2025/12/18

DiTCtrl - 港中文联合腾讯等机构推出的多提示视频生成方法

DiTCtrl是基于多模态扩散变换器（MM-DiT）架构的多提示视频生成方法，是香港中文大学和腾讯等机构联合推出的。DiTCtrl能在无需额外训练的情况下，实现多个文...

AIプロジェクト2025/12/18

MNN - 阿里开源的移动端深度学习推理框架

MNN（Mobile Neural Network）是阿里巴巴集团开源的轻量级深度学习推理框架，为移动端、服务器、个人电脑、嵌入式设备等多种设备提供高效的模型部署能力。MNN...

AIプロジェクト2025/12/18

启元重症大模型 - 腾讯和迈瑞医疗联合推出的重症医疗大模型

启元重症大模型是腾讯和迈瑞医疗联合发布的全球首个重症医疗大模型，专为ICU病房设计，解决重症监护中的痛点问题。模型整体参数量达到万亿级别，经过大量医学...

AIプロジェクト2025/12/18

Poetry2Image - 专为中文古诗词图像生成设计的迭代校正框架

Poetry2Image是一个专为中文古诗词图像生成设计的迭代校正框架，哈尔滨工业大学提出。框架通过自动化的反馈和校正循环，增强了诗歌与图像之间的一致性，有效...

←1...65 66 67 68 69 70 71...137 →

AIニュース

AIプロジェクト2025/12/18

Midscene.js - AI驱动的 UI 自动化测试框架

AIプロジェクト2025/12/18

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

ASAL（Automated Search for Artificial Life）是用基础模型自动化搜索人工生命（ALife）系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的，主要基于三种...

AIプロジェクト2025/12/18

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

AIプロジェクト2025/12/18

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

AIプロジェクト2025/12/18

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

AIプロジェクト2025/12/18

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

AIプロジェクト2025/12/18

FastExcel - 开源的高性能 Excel 处理工具

AIプロジェクト2025/12/18

FinRobot - 开源 AI Agent 平台，解决金融领域应用的综合解决方案

AIプロジェクト2025/12/18

DeepSeek V3 - DeepSeek开源的最新版 AI 模型，编程能力超越Claude

AIプロジェクト2025/12/18

3DHM - 3D人体动作生成框架，单张图片生成任意视频动作

AIプロジェクト2025/12/18

Diff-Instruct - 从预训练扩散模型中迁移知识的通用框架

AIプロジェクト2025/12/18

VidTok - 微软开源的视频分词器，支持连续和离散分词化

AIプロジェクト2025/12/18

Infinity - 字节跳动推出的高分辨率图像生成模型

AIプロジェクト2025/12/18

ModernBERT - 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型，是对经典BERT模型的一次重大升级。...

AIプロジェクト2025/12/18

cobalt - 开源免费的图片、音频和视频下载工具

AIプロジェクト2025/12/18

CogAgent-9B - 智谱AI开源 GLM-PC 的基座模型

AIプロジェクト2025/12/18

AGUVIS - 香港大学联合 Salesforce 推出统一纯视觉的GUI自动化框架

AIプロジェクト2025/12/18

Enhance-A-Video - 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

AIプロジェクト2025/12/18

Valley - 字节跳动推出的多模态大模型

AIプロジェクト2025/12/18

联通元景 - 中国联通AI开源的中文原生文生图模型

AIプロジェクト2025/12/18

DiTCtrl - 港中文联合腾讯等机构推出的多提示视频生成方法

AIプロジェクト2025/12/18

MNN - 阿里开源的移动端深度学习推理框架

AIプロジェクト2025/12/18

启元重症大模型 - 腾讯和迈瑞医疗联合推出的重症医疗大模型

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Midscene.js - AI驱动的 UI 自动化测试框架

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

FastExcel - 开源的高性能 Excel 处理工具

FinRobot - 开源 AI Agent 平台，解决金融领域应用的综合解决方案

DeepSeek V3 - DeepSeek开源的最新版 AI 模型，编程能力超越Claude

3DHM - 3D人体动作生成框架，单张图片生成任意视频动作

Diff-Instruct - 从预训练扩散模型中迁移知识的通用框架

VidTok - 微软开源的视频分词器，支持连续和离散分词化

Infinity - 字节跳动推出的高分辨率图像生成模型

ModernBERT - 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

cobalt - 开源免费的图片、音频和视频下载工具

CogAgent-9B - 智谱AI开源 GLM-PC 的基座模型

AGUVIS - 香港大学联合 Salesforce 推出统一纯视觉的GUI自动化框架

Enhance-A-Video - 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

Valley - 字节跳动推出的多模态大模型

联通元景 - 中国联通AI开源的中文原生文生图模型

DiTCtrl - 港中文联合腾讯等机构推出的多提示视频生成方法

MNN - 阿里开源的移动端深度学习推理框架

启元重症大模型 - 腾讯和迈瑞医疗联合推出的重症医疗大模型

Poetry2Image - 专为中文古诗词图像生成设计的迭代校正框架

AIニュース

Midscene.js - AI驱动的 UI 自动化测试框架

ASAL - Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

Browser Use - AI 浏览器助手，自动执行网页中的交互任务

TRELLIS - 微软联合清华和中科大推出的高质量 3D 生成模型

WiS - 淘天联合阿里研究团队推出的多智能体博弈游戏平台

DRT-o1 - 腾讯研究院推出的文学翻译系列AI模型

FastExcel - 开源的高性能 Excel 处理工具

FinRobot - 开源 AI Agent 平台，解决金融领域应用的综合解决方案

DeepSeek V3 - DeepSeek开源的最新版 AI 模型，编程能力超越Claude

3DHM - 3D人体动作生成框架，单张图片生成任意视频动作

Diff-Instruct - 从预训练扩散模型中迁移知识的通用框架

VidTok - 微软开源的视频分词器，支持连续和离散分词化

Infinity - 字节跳动推出的高分辨率图像生成模型

ModernBERT - 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型

cobalt - 开源免费的图片、音频和视频下载工具

CogAgent-9B - 智谱AI开源 GLM-PC 的基座模型

AGUVIS - 香港大学联合 Salesforce 推出统一纯视觉的GUI自动化框架

Enhance-A-Video - 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法

Valley - 字节跳动推出的多模态大模型

联通元景 - 中国联通AI开源的中文原生文生图模型

DiTCtrl - 港中文联合腾讯等机构推出的多提示视频生成方法

MNN - 阿里开源的移动端深度学习推理框架

启元重症大模型 - 腾讯和迈瑞医疗联合推出的重症医疗大模型

Poetry2Image - 专为中文古诗词图像生成设计的迭代校正框架