AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

AnimaTensor - 吐司AI等推出的二次元图像生成模型

AnimaTensor是CagliostroLab团队和TensorArt共同推出的二次元图像生成模型。基于创新的V-Prediction技术，用预测图像生成过程中的“速度”优化噪声调度和采样策...

AIプロジェクト2025/12/18

DAMO GRAPE - 阿里达摩院联合浙江肿瘤医院推出的早期胃癌识别模型

DAMO GRAPE是浙江省肿瘤医院与阿里巴巴达摩院联合推出的全球首个基于平扫CT识别早期胃癌的AI模型。DAMO GRAPE突破传统影像学限制，基于深度学习分析非增强CT...

AIプロジェクト2025/12/18

Seed1.6 - 字节跳动推出的通用模型系列

Seed1.6是字节跳动Seed团队推出的通用模型系列，融合多模态能力，支持256K长上下文深度推理。Seed1.6沿用Seed1.5稀疏MoE探索成果，经纯文本预训练、多模态混...

AIプロジェクト2025/12/18

Gemini CLI - 谷歌开源的AI编程工具，免费用Gemini 2.5 Pro模型

Gemini CLI 是谷歌开源的终端AI编程工具，免费用Gemini 2.5 Pro模型。Gemini CLI提供强大 AI 功能，如代码理解、文件操作、命令执行及动态排查问题，助力开发...

AIプロジェクト2025/12/18

AlphaGenome - 谷歌推出的AI基因变异预测模型

AlphaGenome是谷歌DeepMind推出的全新AI模型，能更深入地理解基因组。模型能接收长达100万个碱基对的DNA序列输入，预测数千种表征其调控活性的分子特性，评估...

AIプロジェクト2025/12/18

Claudia 是为 Claude Code 设计的桌面应用程序和工具包，通过直观的图形界面提升 AI 辅助开发的效率和安全性。支持项目与会话管理，用户可以轻松浏览、恢复过...

AIプロジェクト2025/12/18

DRA-Ctrl（Dimension-Reduction Attack）是浙江大学联合蚂蚁集团等机构推出的创新跨模态图片编辑框架。框架借助视频生成模型的视觉、时间、空间和因果等多维...

AIプロジェクト2025/12/18

Kwai Keye-VL 是快手自主研发的多模态大语言模型，基于 Qwen3-8B 语言模型整合SigLIP初始化的视觉编码器，支持动态分辨率输入。模型能深度融合和处理文本、图...

AIプロジェクト2025/12/18

Twocast是AI驱动的双人播客生成器，支持生成双人对话形式的播客内容。生成器支持多语言、多音色，且能基于主题、链接、文档等多种方式快速生成3-5分钟的播客。

AIプロジェクト2025/12/18

VLN-R1是香港大学和上海人工智能实验室联合推出的全新具身智能框架，基于大型视觉语言模型（LVLM）直接将第一人称视频流转换为连续的导航动作。框架基于Habit...

AIプロジェクト2025/12/18

Nanonets-OCR-s（Nanonets OCR Small）是Nanonets推出的图像到 Markdown 的 OCR 模型，支持将图像中的文档内容转换为结构化的 Markdown 格式。模型能提取文本...

AIプロジェクト2025/12/18

混元-A13B是腾讯最新推出的开源大语言模型，基于专家混合（MoE）架构，总参数量达800亿，激活参数为130亿。具备轻量级设计和高效推理能力，仅需1张中低端GPU...

AIプロジェクト2025/12/18

Kling-Foley 是可灵 AI 推出的多模态视频生音效模型。模型将视频和文本提示作为条件输入，能生成与视频内容语义相关、时间同步的高质量立体声音频，涵盖音效...

AIプロジェクト2025/12/18

4D-LRM（Large Space-Time Reconstruction Model）是Adobe研究公司、密歇根大学等机构的研究人员共同推出的新型4D重建模型。模型能基于稀疏的输入视图和任意...

AIプロジェクト2025/12/18

FilMaster 是香港大学、快手科技、微软研究院和清华大学联合推出的AI电影制作系统，将电影制作原则与生成式人工智能相结合，实现从剧本到最终影片的全自动制...

AIプロジェクト2025/12/18

MultiAgentPPT 是多智能体演示文稿生成系统，基于 A2A（Ask-to-Answer）、MCP（Multi-agent Control Protocol）和 ADK（Agent Development Kit）架构。MultiA...

AIプロジェクト2025/12/18

Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。在多模态大模型的基础上进行了全面升级，能“看懂”世界，能基于理解进行高质量的再创造，实现了从感...

AIプロジェクト2025/12/18

XVerse是字节跳动智能创作团队推出的新型多主体控制图像生成模型。模型在文本到图像生成领域实现对多个主体身份和语义属性（如姿势、风格、光照）的精细控制...

AIプロジェクト2025/12/18

Fireplexity是Firecrawl推出的开源AI问答引擎，基于Next.js构建。Fireplexity支持让开发者快速搭建和托管自己的AI驱动的问答应用。具有快速部署（5分钟内启动...

AIプロジェクト2025/12/18

MAI-DxO（Microsoft AI Diagnostic Orchestrator）是微软推出的先进人工智能系统，能提升医疗诊断的准确性和效率。基于模拟一组具有不同诊断方法的虚拟医生协...

AIプロジェクト2025/12/18

RecGPT是淘天集团推出的百亿参数推荐大模型。现已全面接入手机淘宝首屏“猜你喜欢”信息流，基于融合多模态认知、用户行为分析及实时热点理解，精准捕捉用户长...

AIプロジェクト2025/12/18

ML-Master是上海交通大学人工智能学院Agents团队推出AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色，以29.3%的平均奖牌率位居榜首，超越了微软的...

AIプロジェクト2025/12/18

ThinkSound是阿里通义语音团队推出的首个CoT（链式思考）音频生成模型，用在视频配音，为每一帧画面生成专属匹配音效。模型引入CoT推理，解决传统技术难以捕...

AIプロジェクト2025/12/18

BlenderFusion是Google DeepMind推出的生成式视觉合成框架，将传统的 3D 编辑软件（Blender）与AI 模型相结合，实现精准的几何编辑和多样的视觉合成。

......

AIニュース

AIプロジェクト2025/12/18

AnimaTensor - 吐司AI等推出的二次元图像生成模型

AIプロジェクト2025/12/18

DAMO GRAPE - 阿里达摩院联合浙江肿瘤医院推出的早期胃癌识别模型

AIプロジェクト2025/12/18

Seed1.6 - 字节跳动推出的通用模型系列

AIプロジェクト2025/12/18

Gemini CLI - 谷歌开源的AI编程工具，免费用Gemini 2.5 Pro模型

AIプロジェクト2025/12/18

AlphaGenome - 谷歌推出的AI基因变异预测模型

AIプロジェクト2025/12/18

Nanonets-OCR-s（Nanonets OCR Small）是Nanonets推出的图像到 Markdown 的 OCR 模型，支持将图像中的文档内容转换为结构化的 Markdown 格式。模型能提取文本...

AIプロジェクト2025/12/18

4D-LRM（Large Space-Time Reconstruction Model）是Adobe研究公司、密歇根大学等机构的研究人员共同推出的新型4D重建模型。模型能基于稀疏的输入视图和任意...

AIプロジェクト2025/12/18

MultiAgentPPT 是多智能体演示文稿生成系统，基于 A2A（Ask-to-Answer）、MCP（Multi-agent Control Protocol）和 ADK（Agent Development Kit）架构。MultiA...

AIプロジェクト2025/12/18

BlenderFusion是Google DeepMind推出的生成式视觉合成框架，将传统的 3D 编辑软件（Blender）与AI 模型相结合，实现精准的几何编辑和多样的视觉合成。

......

すべてのカテゴリ

AIニュース

AnimaTensor - 吐司AI等推出的二次元图像生成模型

DAMO GRAPE - 阿里达摩院联合浙江肿瘤医院推出的早期胃癌识别模型

Seed1.6 - 字节跳动推出的通用模型系列

Gemini CLI - 谷歌开源的AI编程工具，免费用Gemini 2.5 Pro模型

AlphaGenome - 谷歌推出的AI基因变异预测模型

AIニュース

AnimaTensor - 吐司AI等推出的二次元图像生成模型

DAMO GRAPE - 阿里达摩院联合浙江肿瘤医院推出的早期胃癌识别模型

Seed1.6 - 字节跳动推出的通用模型系列

Gemini CLI - 谷歌开源的AI编程工具，免费用Gemini 2.5 Pro模型

AlphaGenome - 谷歌推出的AI基因变异预测模型

Claudia - 专为 Claude Code 设计的开源桌面端程序

DRA-Ctrl - 浙大联合蚂蚁等机构推出的跨模态图片编辑框架

Kwai Keye-VL - 快手推出的多模态大语言模型

Twocast - AI双人播客生成器，模拟真实双人对话形式

VLN-R1 - 港大联合上海AI lab推出的具身智能框架

Nanonets-OCR-s - Nanonets推出的OCR模型

混元-A13B - 腾讯开源基于MoE架构的大语言模型

Kling-Foley - 可灵AI推出的多模态视频生音效模型

4D-LRM - Adobe联合密歇根大学等机构推出的4D重建模型

FilMaster - 港大联合快手、微软、清华推出的AI电影制作系统

MultiAgentPPT - 开源多智能体AI演示文稿生成系统

Qwen VLo - 通义千问推出的多模态统一理解与生成模型

XVerse - 字节跳动推出的多主体控制图像生成模型

Fireplexity - Firecrawl推出的开源AI问答引擎

MAI-DxO - 微软推出的AI医疗诊断系统

RecGPT - 淘天集团推出的百亿参数推荐大模型

ML-Master - 上海交大推出的AI专家Agent

ThinkSound - 阿里通义推出的首个CoT音频生成模型

BlenderFusion - 谷歌DeepMind推出的生成式视觉合成框架