AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Qwen2.5 - 阿里通义千问团队最新开源的最强AI大模型

Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型，具有多种参数规模的模型，包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规...

AIプロジェクト2025/12/18

abab-video-1 - MiniMax推出的首款AI高清视频生成模型

abab-video-1是MiniMax公司推出的首款AI高清视频生成模型，模型支持生成最高1280x720分辨率、25fps的高清视频，具备电影感的镜头移动效果，能根据文本描述快...

AIプロジェクト2025/12/18

abab-music-1 - MiniMax 推出端到端 AI 音乐生成大模型

abab-music-1 是 MiniMax 推出的一款端到端 AI 音乐生成大模型。支持多功能端到端音乐生成，能合成多种音乐形式，包括纯音乐和清唱作品，同时满足伴奏和人声...

AIプロジェクト2025/12/18

FineVideo - Hugging Face推出的大型多模态视频数据集

FineVideo是由Hugging Face推出的一个大型多模态视频数据集，专注于视频理解领域中的复杂任务，如情绪分析、故事叙述和媒体编辑。FineVideo包含超过43,000个Y...

AIプロジェクト2025/12/18

Void - 开源的AI辅助编程工具，代码自动补全和智能建议

Void 是基于 Visual Studio Code 构建的开源文本编辑器，集成AI技术增强编程体验。Void支持代码自动补全、内联编辑、AI 驱动的代码搜索，直接与大型语言模型...

AIプロジェクト2025/12/18

Draw an Audio - 中科院联合美团推出的视频生成音频系统

Draw an Audio 是中国科学院自动化研究所和美团点评的研究人员推出的视频生成音频系统。根据视频内容自动生成匹配的声音效果，类似于电影制作中的 Foley 艺术...

AIプロジェクト2025/12/18

CogVideoX-5B-I2V - 智谱 AI 开源的图生视频生成模型

CogVideoX-5B-I2V 是智谱 AI 开源的一款图生视频模型，通过一张图片和文本提示词生成视频。模型采用了3D 因果变分自编码器和专家自适应 LayerNorm 技术，能输...

AIプロジェクト2025/12/18

RapidPages - AI驱动的集成开放环境，实时生成UI组件和CSS代码

RapidPages 是一个开源的集成开发环境（IDE），专注于基于AI技术快速生成 React 和 Tailwind CSS 的 UI 组件。基于自然语言处理，支持用户仅通过描述所需界面...

AIプロジェクト2025/12/18

Ovis1.6 - 阿里国际AI团队推出的多模态大模型，超过闭源GPT-4o-mini

Ovis1.6是阿里国际AI团队推出的多模态大模型，在多模态权威综合评测基准OpenCompass上取得了优异的成绩，特别是在30亿参数以下的模型中综合得分排名第一，超...

AIプロジェクト2025/12/18

Gummy - 通义推出的端到端语音翻译大模型，能实时流式生成结果

Gummy是通义实验室在2024年云栖大会上推出的端到端语音翻译大模型。模型能实时流式生成语音识别与翻译结果，支持包括中文、英语、粤语、日语、韩语、法语、德...

AIプロジェクト2025/12/18

cogvlm2-llama3-caption - 智普AI开源的视频标注模型，生成文本描述

cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容，自动生成描述视频内容的文本标题或字幕。

AIプロジェクト2025/12/18

书生·物华2.0（3DTopia 2.0）- 上海AI实验室联合南洋理工推出三维物体生成大模型

书生·物华2.0（3DTopia 2.0）是由上海人工智能实验室与南洋理工大学联合开发的三维物体生成大模型。模型采用创新的原语（primitive-based）三维表示方法PrimX...

AIプロジェクト2025/12/18

StoryMaker - 小红书开源的文本到图像实现角色一致的生成模型

StoryMaker 是小红书开源的一款文本到图像生成工具，专注于帮助创作者在连续图像内容中保持角色的一致性。基于 Stable Diffusion XL 模型和 LoRA 技术，确保...

AIプロジェクト2025/12/18

CogVideoX-Fun - 基于CogVideoX的整合包，支持生成无限长度的视频

CogVideoX-Fun是一个基于CogVideoX结合EasyAnimate修改的AI视频生成整合包，提供了更自由的生成条件，支持文字生成视频、图片生成视频以及视频生成视频。工具...

AIプロジェクト2025/12/18

ItiNera - 港大与MIT联合推出的AI城市行程规划（OUIP）系统

ItiNera 是港大和MIT联合开发的智能城市行程规划系统。基于大型语言模型（LLM）和空间优化技术，根据用户的个性化需求，如情侣酒吧、二次元圣地等，一键生成C...

AIプロジェクト2025/12/18

华知大模型5.0 - 知网联合华为云推出的多模态AI大模型

华知大模型5.0是同方知网与华为云联合推出的AI大模型，具备多模态理解和生成能力。华知大模型5.0的最大亮点在于多维模型的构建能力，涵盖从7B到135B不等的多...

AIプロジェクト2025/12/18

LVCD - 腾讯联合香港城市大学推出为动漫视频线稿上色的AI框架

LVCD（Large Video Color Diffusion）是一个专为动画视频线稿上色设计的视频扩散框架，能将黑白线稿自动转化为彩色动画视频。LVCD使用了一种先进的扩散模型，...

AIプロジェクト2025/12/18

LLaMA-Omni - 中科院推出的低延迟高质量的语音交互模型

LLaMA-Omni 是中国科学院计算技术研究所和中国科学院大学研究者推出的新型模型架构，用于实现与大型语言模型（LLM）的低延迟、高质量语音交互。通过集成预训...

AIプロジェクト2025/12/18

SCoRe - 谷歌DeepMind推出的多轮强化学习方法

SCoRe（Self-Correction via Reinforcement Learning）是谷歌DeepMind推出的一种创新的多轮强化学习方法，旨在提高大型语言模型（LLM）的自我纠错能力。通过...

AIプロジェクト2025/12/18

AiNiee - AI翻译工具，游戏爱好者和小说迷的翻译神器

AiNiee 是一款AI翻译工具，能一键自动翻译RPG、SLG游戏、Epub、TXT格式的小说、Srt、Lrc字幕文件等。工具支持多格式文件，接入多个主流AI接口平台，如OpenAI...

AIプロジェクト2025/12/18

ANTO - 开源的Windows桌面字幕翻译工具

ANTO是一款开源的Windows桌面字幕翻译工具，用于翻译SRT格式的视频字幕文件。集成多种翻译引擎，如谷歌翻译、DeepL、微软翻译、百度翻译和有道翻译等，用户根...

AIプロジェクト2025/12/18

OpenMusic - 基于 QA-MDT 的开源高质量文生音乐模型

OpenMusic 是一款基于 QA-MDT（Quality-aware Masked Diffusion Transformer）技术的高质量文生音乐模型。基于先进的AI算法，根据文本描述生成高质量的音乐作...

AIプロジェクト2025/12/18

SFR-RAG - 专注于上下文理解和检索增强生成的语言模型

SFR-RAG是由Salesforce AI Research推出的一款大型语言模型，专注于提升机器在理解和生成文本方面的应用能力。模型特别强调对上下文的忠实理解，在检索增强生...

AIプロジェクト2025/12/18

onewebot2 - 微信AI机器人一键运行包，双击exe直接使用

oneWebot2是一款微信AI机器人一键运行软件包，用户下载exe文件后，双击即可启动，无需复杂的Python环境配置。有图形化界面，简化配置流程，非技术用户轻松设...

←1...40 41 42 43 44 45 46...137 →

AIニュース

AIプロジェクト2025/12/18

Qwen2.5 - 阿里通义千问团队最新开源的最强AI大模型

AIプロジェクト2025/12/18

abab-video-1 - MiniMax推出的首款AI高清视频生成模型

AIプロジェクト2025/12/18

abab-music-1 - MiniMax 推出端到端 AI 音乐生成大模型

AIプロジェクト2025/12/18

FineVideo - Hugging Face推出的大型多模态视频数据集

AIプロジェクト2025/12/18

Void - 开源的AI辅助编程工具，代码自动补全和智能建议

AIプロジェクト2025/12/18

Draw an Audio - 中科院联合美团推出的视频生成音频系统

AIプロジェクト2025/12/18

CogVideoX-5B-I2V - 智谱 AI 开源的图生视频生成模型

AIプロジェクト2025/12/18

RapidPages - AI驱动的集成开放环境，实时生成UI组件和CSS代码

AIプロジェクト2025/12/18

Ovis1.6 - 阿里国际AI团队推出的多模态大模型，超过闭源GPT-4o-mini

AIプロジェクト2025/12/18

Gummy - 通义推出的端到端语音翻译大模型，能实时流式生成结果

AIプロジェクト2025/12/18

cogvlm2-llama3-caption - 智普AI开源的视频标注模型，生成文本描述

cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容，自动生成描述视频内容的文本标题或字幕。

AIプロジェクト2025/12/18

书生·物华2.0（3DTopia 2.0）- 上海AI实验室联合南洋理工推出三维物体生成大模型

AIプロジェクト2025/12/18

StoryMaker - 小红书开源的文本到图像实现角色一致的生成模型

AIプロジェクト2025/12/18

CogVideoX-Fun - 基于CogVideoX的整合包，支持生成无限长度的视频

AIプロジェクト2025/12/18

ItiNera - 港大与MIT联合推出的AI城市行程规划（OUIP）系统

AIプロジェクト2025/12/18

华知大模型5.0 - 知网联合华为云推出的多模态AI大模型

AIプロジェクト2025/12/18

LVCD - 腾讯联合香港城市大学推出为动漫视频线稿上色的AI框架

AIプロジェクト2025/12/18

LLaMA-Omni - 中科院推出的低延迟高质量的语音交互模型

AIプロジェクト2025/12/18

SCoRe - 谷歌DeepMind推出的多轮强化学习方法

SCoRe（Self-Correction via Reinforcement Learning）是谷歌DeepMind推出的一种创新的多轮强化学习方法，旨在提高大型语言模型（LLM）的自我纠错能力。通过...

AIプロジェクト2025/12/18

AiNiee - AI翻译工具，游戏爱好者和小说迷的翻译神器

AIプロジェクト2025/12/18

ANTO - 开源的Windows桌面字幕翻译工具

AIプロジェクト2025/12/18

OpenMusic - 基于 QA-MDT 的开源高质量文生音乐模型

OpenMusic 是一款基于 QA-MDT（Quality-aware Masked Diffusion Transformer）技术的高质量文生音乐模型。基于先进的AI算法，根据文本描述生成高质量的音乐作...

AIプロジェクト2025/12/18

SFR-RAG - 专注于上下文理解和检索增强生成的语言模型

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Qwen2.5 - 阿里通义千问团队最新开源的最强AI大模型

abab-video-1 - MiniMax推出的首款AI高清视频生成模型

abab-music-1 - MiniMax 推出端到端 AI 音乐生成大模型

FineVideo - Hugging Face推出的大型多模态视频数据集

Void - 开源的AI辅助编程工具，代码自动补全和智能建议

Draw an Audio - 中科院联合美团推出的视频生成音频系统

CogVideoX-5B-I2V - 智谱 AI 开源的图生视频生成模型

RapidPages - AI驱动的集成开放环境，实时生成UI组件和CSS代码

Ovis1.6 - 阿里国际AI团队推出的多模态大模型，超过闭源GPT-4o-mini

Gummy - 通义推出的端到端语音翻译大模型，能实时流式生成结果

cogvlm2-llama3-caption - 智普AI开源的视频标注模型，生成文本描述

书生·物华2.0（3DTopia 2.0）- 上海AI实验室联合南洋理工推出三维物体生成大模型

StoryMaker - 小红书开源的文本到图像实现角色一致的生成模型

CogVideoX-Fun - 基于CogVideoX的整合包，支持生成无限长度的视频

ItiNera - 港大与MIT联合推出的AI城市行程规划（OUIP）系统

华知大模型5.0 - 知网联合华为云推出的多模态AI大模型

LVCD - 腾讯联合香港城市大学推出为动漫视频线稿上色的AI框架

LLaMA-Omni - 中科院推出的低延迟高质量的语音交互模型

SCoRe - 谷歌DeepMind推出的多轮强化学习方法

AiNiee - AI翻译工具，游戏爱好者和小说迷的翻译神器

ANTO - 开源的Windows桌面字幕翻译工具

OpenMusic - 基于 QA-MDT 的开源高质量文生音乐模型

SFR-RAG - 专注于上下文理解和检索增强生成的语言模型

onewebot2 - 微信AI机器人一键运行包，双击exe直接使用

AIニュース

Qwen2.5 - 阿里通义千问团队最新开源的最强AI大模型

abab-video-1 - MiniMax推出的首款AI高清视频生成模型

abab-music-1 - MiniMax 推出端到端 AI 音乐生成大模型

FineVideo - Hugging Face推出的大型多模态视频数据集

Void - 开源的AI辅助编程工具，代码自动补全和智能建议

Draw an Audio - 中科院联合美团推出的视频生成音频系统

CogVideoX-5B-I2V - 智谱 AI 开源的图生视频生成模型

RapidPages - AI驱动的集成开放环境，实时生成UI组件和CSS代码

Ovis1.6 - 阿里国际AI团队推出的多模态大模型，超过闭源GPT-4o-mini

Gummy - 通义推出的端到端语音翻译大模型，能实时流式生成结果

cogvlm2-llama3-caption - 智普AI开源的视频标注模型，生成文本描述

书生·物华2.0（3DTopia 2.0）- 上海AI实验室联合南洋理工推出三维物体生成大模型

StoryMaker - 小红书开源的文本到图像实现角色一致的生成模型

CogVideoX-Fun - 基于CogVideoX的整合包，支持生成无限长度的视频

ItiNera - 港大与MIT联合推出的AI城市行程规划（OUIP）系统

华知大模型5.0 - 知网联合华为云推出的多模态AI大模型

LVCD - 腾讯联合香港城市大学推出为动漫视频线稿上色的AI框架

LLaMA-Omni - 中科院推出的低延迟高质量的语音交互模型

SCoRe - 谷歌DeepMind推出的多轮强化学习方法

AiNiee - AI翻译工具，游戏爱好者和小说迷的翻译神器

ANTO - 开源的Windows桌面字幕翻译工具

OpenMusic - 基于 QA-MDT 的开源高质量文生音乐模型

SFR-RAG - 专注于上下文理解和检索增强生成的语言模型

onewebot2 - 微信AI机器人一键运行包，双击exe直接使用