AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Computer Use OOTB - 开源 GUI 框架，基于Claude 3.5 Computer Use API实现远程控制

Computer Use OOTB是开源的GUI 框架，基于Claude 3.5 Computer Use API实现对计算机的自动化控制。框架支持跨平台操作，用户在Windows和macOS系统上能轻松部...

AIプロジェクト2025/12/18

Fireworks f1 - 复合AI模型，多个开源AI模型组合解决复杂推理问题

Fireworks f1是Fireworks公司推出的复合AI模型，针对复杂推理任务设计。基于在推理层融合多个开放模型，实现超越单一模型的性能和可靠性。f1模型支持开发者用...

AIプロジェクト2025/12/18

AgileGen - AI生成式软件开发框架，自动生成软件代码和原型

AgileGen是生成式软件开发框架，通过人与AI协作增强软件的创建过程。AgileGen包含两个核心部分：终端用户决策制定和AgileGen智能体。框架用Gherkin语言设计和...

AIプロジェクト2025/12/18

OmniSearch - 阿里通义推出的多模态检索增强生成框架

OmniSearch是阿里巴巴通义实验室推出的多模态检索增强生成框架，具备自适应规划能力。OmniSearch能动态拆解复杂问题，根据检索结果和问题情境调整检索策略，...

AIプロジェクト2025/12/18

Perplexica - 开源AI搜索引擎，支持多种搜索模式、实时信息更新

Perplexica是开源的AI驱动搜索引擎，是Perplexity AI的开源替代品。基于机器学习算法和自然语言处理技术理解用户查询，提供精确答案。Perplexica支持多种搜索...

AIプロジェクト2025/12/18

Memoripy - 支持 AI 应用上下文感知的记忆管理Python库

Memoripy是一个Python库，为AI应用提供上下文感知的记忆管理。Memoripy支持短期和长期记忆存储，兼容OpenAI和Ollama API。核心功能包括记忆检索、概念提取、...

AIプロジェクト2025/12/18

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

AnimateAnything是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateAnything能精确操作视频，包括控制相机轨迹、文本提示和用户动作注...

AIプロジェクト2025/12/18

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段，实现对图像中各个区域的精确控制和细节优化。RAG-Diff...

AIプロジェクト2025/12/18

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

FitDiT是高保真虚拟试穿技术，是腾讯和复旦大学联合推出的。基于Diffusion Transformers（DiT）关注高分辨率特征，提升服装细节的呈现。FitDiT用服装纹理提取...

AIプロジェクト2025/12/18

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

Documind是开源的AI文档处理工具，能从PDF文档中提取结构化数据。Documind具备将PDF转换为图像、用OpenAI API进行信息提取，根据用户定义的模式格式化输出结...

AIプロジェクト2025/12/18

MARS - 字节推出优化大模型训练效率的框架

MARS（Make vAriance Reduction Shine）是字节跳动推出的创新的优化框架，提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术，基于缩放随机递归...

AIプロジェクト2025/12/18

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

Verifier Engineering（验证器工程）是中国科学院、阿里巴巴和小红书联合推出的新型后训练范式，为基础模型设计，解决提供有效监督信号的挑战。Verifier Engi...

AIプロジェクト2025/12/18

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

XiYan-SQL是阿里巴巴推出的自然语言到SQL（NL2SQL）框架，基于多生成器集成策略，结合提示工程和监督微调，提升SQL查询生成质量。XiYan-SQL引入M-Schema半结...

AIプロジェクト2025/12/18

KuaiFormer - 快手推出的检索框架，基于Transformer

KuaiFormer是快手技术团队推出的基于Transformer的检索框架，用在大规模内容推荐系统。基于重新定义检索流程，从传统的分数估计任务转变为Transformer驱动的“...

AIプロジェクト2025/12/18

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

EyeDiff是文本到图像的扩散模型，基于自然语言提示生成多模态眼科图像，提高常见和罕见眼病的诊断准确性。模型在多个大规模数据集上训练，能准确捕捉关键病变...

AIプロジェクト2025/12/18

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法，支持高效部署多模态大型语言模型（MLLM）至移动设备。模型以小尺寸（2.7B语...

AIプロジェクト2025/12/18

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的研究人员共同推出的多模态数学推理框架。框架基于构建长链的思维（CoT）...

AIプロジェクト2025/12/18

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

DeepSeek-R1-Lite是DeepSeek推出的推理模型预览版，DeepSeek-R1-Lite用强化学习训练，具备长思维链推理能力，能实时展示推理思考过程，性能在多个基准测试中...

AIプロジェクト2025/12/18

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型，能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和图像等多种数据类型。Sa...

AIプロジェクト2025/12/18

AlphaQubit - 谷歌推出的量子错误解码器

AlphaQubit是谷歌推出基于AI技术的量子错误解码器，用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别，助力量子计算机...

AIプロジェクト2025/12/18

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学共同推出的，计算机辅助设计（CAD）模型生成系统，根据用户的多种输入（如文本描述、图像、...

AIプロジェクト2025/12/18

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

LaTRO（Latent Reasoning Optimization）是先进的框架，提升大型语言模型（LLMs）在复杂推理任务中的表现。基于将推理过程类比为从潜在分布中采样，用变分推...

AIプロジェクト2025/12/18

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

ReCapture是谷歌和新加坡国立大学推出的视频处理技术，能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCapture用多视图扩散模型或基于深度的点云渲...

AIプロジェクト2025/12/18

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

MagicClay 是 Adobe 推出3D建模工具，结合网格和有向距离场（SDF）技术，支持艺术家基于文本提示对3D模型的特定部分进行雕刻，同时保持模型的其他区域不变。M...

←1...54 55 56 57 58 59 60...137 →

AIニュース

AIプロジェクト2025/12/18

Computer Use OOTB - 开源 GUI 框架，基于Claude 3.5 Computer Use API实现远程控制

Computer Use OOTB是开源的GUI 框架，基于Claude 3.5 Computer Use API实现对计算机的自动化控制。框架支持跨平台操作，用户在Windows和macOS系统上能轻松部...

AIプロジェクト2025/12/18

Fireworks f1 - 复合AI模型，多个开源AI模型组合解决复杂推理问题

AIプロジェクト2025/12/18

AgileGen - AI生成式软件开发框架，自动生成软件代码和原型

AIプロジェクト2025/12/18

OmniSearch - 阿里通义推出的多模态检索增强生成框架

AIプロジェクト2025/12/18

Perplexica - 开源AI搜索引擎，支持多种搜索模式、实时信息更新

AIプロジェクト2025/12/18

Memoripy - 支持 AI 应用上下文感知的记忆管理Python库

AIプロジェクト2025/12/18

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

AIプロジェクト2025/12/18

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

AIプロジェクト2025/12/18

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

AIプロジェクト2025/12/18

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

AIプロジェクト2025/12/18

MARS - 字节推出优化大模型训练效率的框架

AIプロジェクト2025/12/18

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

AIプロジェクト2025/12/18

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

AIプロジェクト2025/12/18

KuaiFormer - 快手推出的检索框架，基于Transformer

AIプロジェクト2025/12/18

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

AIプロジェクト2025/12/18

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

AIプロジェクト2025/12/18

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

AIプロジェクト2025/12/18

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

AIプロジェクト2025/12/18

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

AIプロジェクト2025/12/18

AlphaQubit - 谷歌推出的量子错误解码器

AIプロジェクト2025/12/18

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

AIプロジェクト2025/12/18

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

AIプロジェクト2025/12/18

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Computer Use OOTB - 开源 GUI 框架，基于Claude 3.5 Computer Use API实现远程控制

Fireworks f1 - 复合AI模型，多个开源AI模型组合解决复杂推理问题

AgileGen - AI生成式软件开发框架，自动生成软件代码和原型

OmniSearch - 阿里通义推出的多模态检索增强生成框架

Perplexica - 开源AI搜索引擎，支持多种搜索模式、实时信息更新

Memoripy - 支持 AI 应用上下文感知的记忆管理Python库

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

MARS - 字节推出优化大模型训练效率的框架

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

KuaiFormer - 快手推出的检索框架，基于Transformer

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

AlphaQubit - 谷歌推出的量子错误解码器

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

AIニュース

Computer Use OOTB - 开源 GUI 框架，基于Claude 3.5 Computer Use API实现远程控制

Fireworks f1 - 复合AI模型，多个开源AI模型组合解决复杂推理问题

AgileGen - AI生成式软件开发框架，自动生成软件代码和原型

OmniSearch - 阿里通义推出的多模态检索增强生成框架

Perplexica - 开源AI搜索引擎，支持多种搜索模式、实时信息更新

Memoripy - 支持 AI 应用上下文感知的记忆管理Python库

AnimateAnything - 浙江大学联合北航推出的统一可控视频生成技术

RAG-Diffusion - 南京大学推出的区域感知文本到图像生成方法

FitDiT - 腾讯联合复旦推出的高保真虚拟试穿技术

Documind - 开源AI文档处理工具，将PDF转换为图像提取结构化数据

MARS - 字节推出优化大模型训练效率的框架

Verifier Engineering - 中科院、阿里、小红书联合推出的新型后训练范式

XiYan-SQL - 阿里推出文本到SQL的多生成器集成框架

KuaiFormer - 快手推出的检索框架，基于Transformer

EyeDiff - 文本到图像扩散模型，自然语言生成多模态眼科图像

BlueLM-V-3B - ViVo联合香港中文大学推出的算法和系统协同设计方法

AtomThink - 华为诺亚方舟联合多所高校推出的多模态数学推理框架

DeepSeek-R1-Lite - 深度求索推出的新一代AI推理模型，媲美OpenAI o1-preview

Samsung Gauss2 - 三星推出的第二代多模态生成式AI模型

AlphaQubit - 谷歌推出的量子错误解码器

CAD-MLLM - 上海科技大学联合多机构推出的计算机辅助设计CAD模型生成系统

LaTRO - 基于自我奖励提升LLMs复杂推理能力的框架

ReCapture - 谷歌和新加坡国立大学共同推出的视频处理技术

MagicClay - Adobe 推出的3D建模工具，文本引导3D模型局部雕刻