AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Takin AudioLLM - 喜马拉雅推出的系列零样本语音生成模型

Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型，包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术，专...

AIプロジェクト2025/12/18

AutoTrain - Hugging Face 开源的无代码模型训练平台

AutoTrain（AutoTrain Advanced）是Hugging Face推出的开源无代码平台，能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署自己的AI模型...

AIプロジェクト2025/12/18

CAMPHOR - 苹果推出的端侧小语言模型多智能体框架

CAMPHOR是苹果团队推出的端侧小语言模型（SLM）多智能体框架，能提升移动设备的隐私保护和响应速度。框架基于在设备本地处理多个用户输入并进行个人上下文推...

AIプロジェクト2025/12/18

ACE - 阿里通义实验室推出的全能图像生成和编辑模型

ACE（All-round Creator and Editor）是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元（LCU）和统一条件格...

AIプロジェクト2025/12/18

ViewExtrapolator - 南洋理工联合UCAS团队推出的新型视图合成方法

ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法，基于稳定视频扩散（Stable Video Diffusion, SVD）的生成先验合成远超出训练视图范...

AIプロジェクト2025/12/18

OpenScholar - 华盛顿大学联合艾伦研究所开源的学术搜索工具

OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型（LM），能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学...

AIプロジェクト2025/12/18

SmolVLM - Hugging Face推出的轻量级视觉语言模型

SmolVLM是Hugging Face推出的轻量级视觉语言模型，专为设备端推理设计。以20亿参数量，实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同...

AIプロジェクト2025/12/18

OneDiffusion - 无缝支持双向图像合成和理解的开源扩散模型

OneDiffusion是AI2推出的多功能大规模扩散模型，能无缝支持双向图像合成和理解，涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目...

AIプロジェクト2025/12/18

LongAlign - 港大推出的提升文本到图像扩散模型处理长文本对齐方法

LongAlign是香港大学研究团队推出的文本到图像（T2I）扩散模型的改进方法，能提升长文本输入的对齐精度。LongAlign用段级编码技术，将长文本分割处理，适应编...

AIプロジェクト2025/12/18

ebook2audiobookXTTS - 开源电子书转有声书 AI 工具，支持16种语言

ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式，如epub、pdf、mobi等，用Coqui XTTS技术实现高质量的...

AIプロジェクト2025/12/18

Optima - 清华联合北邮推出优化通信效率和任务有效性的训练框架

Optima是清华大学推出的优化基于大型语言模型（LLM）的多智能体系统（MAS）的框架。基于一个迭代的生成、排名、选择和训练范式，显著提高通信效率和任务效果...

AIプロジェクト2025/12/18

MuCodec - 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的研究人员共同推出的超低比特率音乐编解码器，能实现音乐的高效压缩与高保真重建。MuCodec...

AIプロジェクト2025/12/18

Find3D - 加州理工学院推出的3D部件分割模型

Find3D是加州理工学院推出的3D部件分割模型，能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据，...

AIプロジェクト2025/12/18

Sketch2Lineart - AI绘画工具，自动将手绘草图转换成清晰的线条画

Sketch2Lineart是基于人工智能的绘画工具，能将简单的手绘草图转换成清晰的线条画。通过自动生成草图描述并据此绘制线条画，支持调整细节适应不同风格。用户...

AIプロジェクト2025/12/18

Fancy123 - 华中科技和华南理工推出的3D网格生成技术

Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术，基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作，...

AIプロジェクト2025/12/18

Mooncake - 月之暗面Kimi联合清华等机构推出的大模型推理架构

Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构，通过分离预填充和解码集群，充分利用GPU集群中未充...

AIプロジェクト2025/12/18

QwQ-32B-Preview - 阿里开源的AI推理模型，基准测试超越 o1 模型

QwQ-32B-Preview（QwQ-32B）是阿里推出的开源AI推理模型，在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数，能处理长达32000个tokens的提示词。在多...

AIプロジェクト2025/12/18

InfiMM-WebMath-40B - 字节联合中科院开源的超大规模多模态数据集

InfiMM-WebMath-40B 是字节跳动和中国科学院联合开源的超大规模多模态数据集，旨在提升多模态模型的图文混合推理能力，在数学领域。数据集从 Common Crawl 中...

AIプロジェクト2025/12/18

SAM 2.1 - Meta 开源的视觉分割模型

SAM 2.1（全称Segment Anything Model 2.1）是Meta（Facebook的母公司）推出的先进视觉分割模型，用于图像和视频。基于简单的Transformer架构和流式记忆设计...

AIプロジェクト2025/12/18

Qwen2vl-Flux - 开源的多模态图像生成模型，支持多种生成模式

Qwen2VL-Flux是多模态图像生成模型，结合Qwen2VL的视觉语言理解和FLUX框架，基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式，包括变体生成、...

AIプロジェクト2025/12/18

ShowUI - 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型，能提升图形用户界面（GUI）助手的工作效率。模型基于UI引导的视觉令牌选择减少计算成本...

AIプロジェクト2025/12/18

NVLM - 英伟达推出的多模态大型语言模型

NVLM是NVIDIA推出的前沿多模态大型语言模型（LLMs），在视觉-语言任务上达到与顶尖专有模型（如GPT-4o）和开放访问模型（如Llama 3-V 405B和InternVL 2）相匹...

AIプロジェクト2025/12/18

Promptriever - 信息检索模型，支持自然语言提示响应用户搜索需求

Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型，能像语言模型一样接受自然语言提示，用直观的方式响应用户的搜索需求。Promptriever...

AIプロジェクト2025/12/18

LongLLaVA - 香港中文大学推出的多模态上下文混合架构大语言模型

LongLLaVA是多模态大型语言模型（MLLM），基于混合架构结合Mamba和Transformer模块，能高效处理大量图像，特别擅长视频理解和高分辨率图像分析。LongLLaVA在...

←1...57 58 59 60 61 62 63...137 →

AIニュース

AIプロジェクト2025/12/18

Takin AudioLLM - 喜马拉雅推出的系列零样本语音生成模型

Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型，包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术，专...

AIプロジェクト2025/12/18

AutoTrain - Hugging Face 开源的无代码模型训练平台

AIプロジェクト2025/12/18

CAMPHOR - 苹果推出的端侧小语言模型多智能体框架

AIプロジェクト2025/12/18

ACE - 阿里通义实验室推出的全能图像生成和编辑模型

ACE（All-round Creator and Editor）是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元（LCU）和统一条件格...

AIプロジェクト2025/12/18

ViewExtrapolator - 南洋理工联合UCAS团队推出的新型视图合成方法

ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法，基于稳定视频扩散（Stable Video Diffusion, SVD）的生成先验合成远超出训练视图范...

AIプロジェクト2025/12/18

OpenScholar - 华盛顿大学联合艾伦研究所开源的学术搜索工具

AIプロジェクト2025/12/18

SmolVLM - Hugging Face推出的轻量级视觉语言模型

AIプロジェクト2025/12/18

OneDiffusion - 无缝支持双向图像合成和理解的开源扩散模型

AIプロジェクト2025/12/18

LongAlign - 港大推出的提升文本到图像扩散模型处理长文本对齐方法

AIプロジェクト2025/12/18

ebook2audiobookXTTS - 开源电子书转有声书 AI 工具，支持16种语言

ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式，如epub、pdf、mobi等，用Coqui XTTS技术实现高质量的...

AIプロジェクト2025/12/18

Optima - 清华联合北邮推出优化通信效率和任务有效性的训练框架

AIプロジェクト2025/12/18

MuCodec - 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

AIプロジェクト2025/12/18

Find3D - 加州理工学院推出的3D部件分割模型

AIプロジェクト2025/12/18

Sketch2Lineart - AI绘画工具，自动将手绘草图转换成清晰的线条画

AIプロジェクト2025/12/18

Fancy123 - 华中科技和华南理工推出的3D网格生成技术

AIプロジェクト2025/12/18

Mooncake - 月之暗面Kimi联合清华等机构推出的大模型推理架构

AIプロジェクト2025/12/18

QwQ-32B-Preview - 阿里开源的AI推理模型，基准测试超越 o1 模型

QwQ-32B-Preview（QwQ-32B）是阿里推出的开源AI推理模型，在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数，能处理长达32000个tokens的提示词。在多...

AIプロジェクト2025/12/18

InfiMM-WebMath-40B - 字节联合中科院开源的超大规模多模态数据集

AIプロジェクト2025/12/18

SAM 2.1 - Meta 开源的视觉分割模型

SAM 2.1（全称Segment Anything Model 2.1）是Meta（Facebook的母公司）推出的先进视觉分割模型，用于图像和视频。基于简单的Transformer架构和流式记忆设计...

AIプロジェクト2025/12/18

Qwen2vl-Flux - 开源的多模态图像生成模型，支持多种生成模式

AIプロジェクト2025/12/18

ShowUI - 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

AIプロジェクト2025/12/18

NVLM - 英伟达推出的多模态大型语言模型

AIプロジェクト2025/12/18

Promptriever - 信息检索模型，支持自然语言提示响应用户搜索需求

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Takin AudioLLM - 喜马拉雅推出的系列零样本语音生成模型

AutoTrain - Hugging Face 开源的无代码模型训练平台

CAMPHOR - 苹果推出的端侧小语言模型多智能体框架

ACE - 阿里通义实验室推出的全能图像生成和编辑模型

ViewExtrapolator - 南洋理工联合UCAS团队推出的新型视图合成方法

OpenScholar - 华盛顿大学联合艾伦研究所开源的学术搜索工具

SmolVLM - Hugging Face推出的轻量级视觉语言模型

OneDiffusion - 无缝支持双向图像合成和理解的开源扩散模型

LongAlign - 港大推出的提升文本到图像扩散模型处理长文本对齐方法

ebook2audiobookXTTS - 开源电子书转有声书 AI 工具，支持16种语言

Optima - 清华联合北邮推出优化通信效率和任务有效性的训练框架

MuCodec - 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

Find3D - 加州理工学院推出的3D部件分割模型

Sketch2Lineart - AI绘画工具，自动将手绘草图转换成清晰的线条画

Fancy123 - 华中科技和华南理工推出的3D网格生成技术

Mooncake - 月之暗面Kimi联合清华等机构推出的大模型推理架构

QwQ-32B-Preview - 阿里开源的AI推理模型，基准测试超越 o1 模型

InfiMM-WebMath-40B - 字节联合中科院开源的超大规模多模态数据集

SAM 2.1 - Meta 开源的视觉分割模型

Qwen2vl-Flux - 开源的多模态图像生成模型，支持多种生成模式

ShowUI - 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

NVLM - 英伟达推出的多模态大型语言模型

Promptriever - 信息检索模型，支持自然语言提示响应用户搜索需求

LongLLaVA - 香港中文大学推出的多模态上下文混合架构大语言模型

AIニュース

Takin AudioLLM - 喜马拉雅推出的系列零样本语音生成模型

AutoTrain - Hugging Face 开源的无代码模型训练平台

CAMPHOR - 苹果推出的端侧小语言模型多智能体框架

ACE - 阿里通义实验室推出的全能图像生成和编辑模型

ViewExtrapolator - 南洋理工联合UCAS团队推出的新型视图合成方法

OpenScholar - 华盛顿大学联合艾伦研究所开源的学术搜索工具

SmolVLM - Hugging Face推出的轻量级视觉语言模型

OneDiffusion - 无缝支持双向图像合成和理解的开源扩散模型

LongAlign - 港大推出的提升文本到图像扩散模型处理长文本对齐方法

ebook2audiobookXTTS - 开源电子书转有声书 AI 工具，支持16种语言

Optima - 清华联合北邮推出优化通信效率和任务有效性的训练框架

MuCodec - 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器

Find3D - 加州理工学院推出的3D部件分割模型

Sketch2Lineart - AI绘画工具，自动将手绘草图转换成清晰的线条画

Fancy123 - 华中科技和华南理工推出的3D网格生成技术

Mooncake - 月之暗面Kimi联合清华等机构推出的大模型推理架构

QwQ-32B-Preview - 阿里开源的AI推理模型，基准测试超越 o1 模型

InfiMM-WebMath-40B - 字节联合中科院开源的超大规模多模态数据集

SAM 2.1 - Meta 开源的视觉分割模型

Qwen2vl-Flux - 开源的多模态图像生成模型，支持多种生成模式

ShowUI - 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

NVLM - 英伟达推出的多模态大型语言模型

Promptriever - 信息检索模型，支持自然语言提示响应用户搜索需求

LongLLaVA - 香港中文大学推出的多模态上下文混合架构大语言模型