AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

AndroidGen - 智谱推出增强大语言模型 Agent 能力的框架

AndroidGen 是智谱技术团队推出增强基于大语言模型（LLM）的 Agent 能力的框架，特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模...

AIプロジェクト2025/12/18

ReasonGraph - 开源可视化与分析LLMs推理过程的AI工具

ReasonGraph 是用在可视化和分析大语言模型（LLMs）推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型（如 Anthropic、OpenAI、Google 等），涵盖...

AIプロジェクト2025/12/18

Gemini 2.5 Pro - 谷歌推出的最新 AI 思考模型

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型，是一个“思考模型”，能在回应前进行推理，提升性能和准确性。模型在多个基准测试中表现卓越，在推理和代码生成方面...

AIプロジェクト2025/12/18

pdf-craft - 开源 PDF 转 Markdown 工具

pdf-craft 是用在将 PDF 文件转换为其他格式（如 Markdown、EPUB）的工具，专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容，过滤掉页眉、页脚、...

AIプロジェクト2025/12/18

TaoAvatar - 阿里推出的实时高清3D全身对话数字人技术

TaoAvatar是阿里巴巴集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术，能生成照片级逼真的3D全身虚拟形象，支持高分辨率渲染且...

AIプロジェクト2025/12/18

Mureka O1 - 昆仑万维推出的音乐推理大模型

Mureka O1是昆仑万维发布的全球首款音乐推理大模型，全球首个引入“思维链”（Chain of Thought，CoT）技术的音乐模型，Mureka O1在推理过程中加入思考与自我批...

AIプロジェクト2025/12/18

Mureka V6 - 昆仑万维推出的AI音乐创作基座模型

Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型，支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL（in-context learning）技术，使声场更加开阔...

AIプロジェクト2025/12/18

Video-T1 - 清华联合腾讯推出的视频生成技术

Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术，基于测试时扩展（Test-Time Scaling，TTS）提升视频生成的质量和一致性。传统视频生成模型在训...

AIプロジェクト2025/12/18

Fin-R1 - 上海财经联合财跃星辰推出的金融推理大模型

Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构，通过在金融推理场景的高质量思维链数据上进行SF...

AIプロジェクト2025/12/18

Oliva - 开源语音RAG助手，实时语音搜索向量数据库

Oliva 是开源的语音RAG助手，结合 Langchain 和 Superlinked 技术，基于语音驱动的 RAG（检索增强生成）架构，帮助用户在 Qdrant 向量数据库中实时搜索信息。...

AIプロジェクト2025/12/18

Qwen2.5-Omni - 阿里开源的端到端多模态模型

Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型，拥有7B参数，Qwen2.5-Omni具备强大的多模态感知能力，能处理文本、图像、音频和视频输入，支持流式文...

AIプロジェクト2025/12/18

Cosmos-Reason1 - NVIDIA推出的系列多模态大语言模型

Cosmos-Reason1 是NVIDIA推出的系列多模态大语言模型，模型能生成基于物理现实的响应。Cosmos-Reason1 包含两个模型：Cosmos-Reason1-7B 和 Cosmos-Reason1-5...

AIプロジェクト2025/12/18

RF-DETR - Roboflow推出的实时目标检测模型

RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值（mAP）的实时模型，性能优于现有的目标检测模型。RF-DETR结合LW...

AIプロジェクト2025/12/18

Bolt3D - 牛津大学联合谷歌推出的 3D 场景生成技术

Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术，是潜在扩散模型，能在单个 GPU 上，仅需不到七秒的时间，直接从一...

AIプロジェクト2025/12/18

Piece it Together - Bria AI等机构推出的图像生成框架

Piece it Together （PiT）是Bria AI等机构推出的创新图像生成框架，专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识，将用户提供的碎片...

AIプロジェクト2025/12/18

TripoSR - Stability AI 联合 VAST 开源的 3D 生成模型

TripoSR是Stability AI和VAST联合推出的开源3D生成模型，能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构，采用了大型重建模型...

AIプロジェクト2025/12/18

ModelEngine - 华为开源的全流程 AI 开发工具链

ModelEngine 是华为开源的全流程 AI 开发工具链，围绕数据使能、模型使能和应用使能三大核心功能展开，解决 AI 行业化落地过程中数据工程耗时长、模型训练和...

AIプロジェクト2025/12/18

BizGen - 清华大学联合微软推出的AI信息图生成工具

BizGen是清华大学和微软研究院联合推出的AI信息图生成工具，专注于文章级别的视觉文本渲染。能一键将长篇文章内容转化为专业级的信息图和幻灯片，解决传统工...

AIプロジェクト2025/12/18

Ideogram 3.0 - Ideogram推出的 AI 图像生成模型

Ideogram 3.0 是Ideogram推出的 AI 图像生成模型。Ideogram 3.0在图像生成质量上实现飞跃，具备高度的真实感、出色的文本渲染和强大的语言理解能力，支持生成...

AIプロジェクト2025/12/18

QVQ-Max - 阿里通义推出的视觉推理模型

QVQ-Max 是阿里通义推出的视觉推理模型，是QVQ-72B-Preview的正式升级版。QVQ-Max能“看懂”图片和视频内容，结合信息进行分析、推理和解决问题。QVQ-Max支持应...

AIプロジェクト2025/12/18

TxGemma - 谷歌推出的通用医学治疗大模型

TxGemma 是谷歌推出的用于药物发现的通用人工智能模型，通过 AI 技术加速药物研发进程。基于 Google 的 Gemma 框架开发，能理解常规文本以及化学物质、分子和...

AIプロジェクト2025/12/18

TripoSG - VAST AI 开源的高保真 3D 形状合成技术

TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流（Rectified Flow, RF）模型的高保真 3D 形状合成技术，通过大规模修正流变换器架构、混合监督训练...

AIプロジェクト2025/12/18

TripoSF - VAST AI 开源的新一代 3D 基础模型

TripoSF是VAST推出的新一代3D基础模型，突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法，结合稀疏体素结构，仅在物体表面附近的区...

AIプロジェクト2025/12/18

DistilQwen2.5-R1 - 阿里推出的小型系列深度推理模型

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型，包含3B、7B、14B和32B四个参数量级的模型。DistilQwen2.5-R1将超大规模模型（...

←1...92 93 94 95 96 97 98...137 →

AIニュース

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

AndroidGen - 智谱推出增强大语言模型 Agent 能力的框架

ReasonGraph - 开源可视化与分析LLMs推理过程的AI工具

Gemini 2.5 Pro - 谷歌推出的最新 AI 思考模型

pdf-craft - 开源 PDF 转 Markdown 工具

TaoAvatar - 阿里推出的实时高清3D全身对话数字人技术

Mureka O1 - 昆仑万维推出的音乐推理大模型

Mureka V6 - 昆仑万维推出的AI音乐创作基座模型

Video-T1 - 清华联合腾讯推出的视频生成技术

Fin-R1 - 上海财经联合财跃星辰推出的金融推理大模型

Oliva - 开源语音RAG助手，实时语音搜索向量数据库

Qwen2.5-Omni - 阿里开源的端到端多模态模型

Cosmos-Reason1 - NVIDIA推出的系列多模态大语言模型

RF-DETR - Roboflow推出的实时目标检测模型

Bolt3D - 牛津大学联合谷歌推出的 3D 场景生成技术

Piece it Together - Bria AI等机构推出的图像生成框架

TripoSR - Stability AI 联合 VAST 开源的 3D 生成模型

ModelEngine - 华为开源的全流程 AI 开发工具链

BizGen - 清华大学联合微软推出的AI信息图生成工具

Ideogram 3.0 - Ideogram推出的 AI 图像生成模型

QVQ-Max - 阿里通义推出的视觉推理模型

TxGemma - 谷歌推出的通用医学治疗大模型

TripoSG - VAST AI 开源的高保真 3D 形状合成技术

TripoSF - VAST AI 开源的新一代 3D 基础模型

DistilQwen2.5-R1 - 阿里推出的小型系列深度推理模型

AIニュース

AndroidGen - 智谱推出增强大语言模型 Agent 能力的框架

ReasonGraph - 开源可视化与分析LLMs推理过程的AI工具

Gemini 2.5 Pro - 谷歌推出的最新 AI 思考模型

pdf-craft - 开源 PDF 转 Markdown 工具

TaoAvatar - 阿里推出的实时高清3D全身对话数字人技术

Mureka O1 - 昆仑万维推出的音乐推理大模型

Mureka V6 - 昆仑万维推出的AI音乐创作基座模型

Video-T1 - 清华联合腾讯推出的视频生成技术

Fin-R1 - 上海财经联合财跃星辰推出的金融推理大模型

Oliva - 开源语音RAG助手，实时语音搜索向量数据库

Qwen2.5-Omni - 阿里开源的端到端多模态模型

Cosmos-Reason1 - NVIDIA推出的系列多模态大语言模型

RF-DETR - Roboflow推出的实时目标检测模型

Bolt3D - 牛津大学联合谷歌推出的 3D 场景生成技术

Piece it Together - Bria AI等机构推出的图像生成框架

TripoSR - Stability AI 联合 VAST 开源的 3D 生成模型

ModelEngine - 华为开源的全流程 AI 开发工具链

BizGen - 清华大学联合微软推出的AI信息图生成工具

Ideogram 3.0 - Ideogram推出的 AI 图像生成模型

QVQ-Max - 阿里通义推出的视觉推理模型

TxGemma - 谷歌推出的通用医学治疗大模型

TripoSG - VAST AI 开源的高保真 3D 形状合成技术

TripoSF - VAST AI 开源的新一代 3D 基础模型

DistilQwen2.5-R1 - 阿里推出的小型系列深度推理模型