AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

Mochi 1是Genmo公司推出的开源视频生成模型，在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apache 2.0许可证发布，支持个人和商业用途的免费使用。模型...

AIプロジェクト2025/12/18

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型，保持与前代 Claude 3 Haiku 相近的速度和成本的同时，实现了在各项能力上的提升，在多项基...

AIプロジェクト2025/12/18

PUMA - 多粒度策略统一的多模态大语言模型

PUMA是一个先进的多模态大型语言模型（MLLM），旨在基于集成多粒度视觉特征统一和增强视觉生成和理解任务。PUMA能处理从文本到图像的生成、详细的图像编辑及...

AIプロジェクト2025/12/18

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

Janus是一个由DeepSeek AI推出的自回归框架，旨在统一多模态理解和生成任务。将视觉编码分离成不同的路径解决以往方法的局限性，且用单一的变换器架构进行处...

AIプロジェクト2025/12/18

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

PaddleOCR 2.9是由百度飞桨（PaddlePaddle）推出的一款开源光学字符识别（OCR）工具库。提供丰富的算法和模型，支持多种语言识别，提供数据标注和合成工具。P...

AIプロジェクト2025/12/18

Mellum - JetBrains 推出专为开发者设计的大语言模型

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型（LLM），旨在提升 AI 驱动的开发工具。通过深度集成 JetBrains IDE，提供低延迟、高准确度的代...

AIプロジェクト2025/12/18

easegen - AI数字人课程制作平台，智能课件自动批量生成

easegen是一个开源的AI+数字人课程制作项目，集成课程制作、视频管理、智能课件生成到智能出题的全套方案。项目支持PPT课件的批量自动生成、数字人克隆、声音...

AIプロジェクト2025/12/18

sCM - OpenAI推出连续时间一致性模型，两步采样生成高质量图像

sCM是OpenAI推出的连续时间一致性模型，基于扩散模型原理进行改进。sCM简化理论框架和优化采样过程，实现图像生成速度的显著提升。sCM模型仅需两步采样能生成...

AIプロジェクト2025/12/18

Moonshine - 实时转录场景、低延时高准确的语音识别模型

Moonshine是专为资源受限设备优化的语音识别模型，提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景，例如现场转录和语音命令识别。Moonshin...

AIプロジェクト2025/12/18

Time-MoE - 基于MoE架构的时间序列基础模型

Time-MoE是创新的时间序列基础模型，基于混合专家（Mixture of Experts, MoE）架构，将时间序列预训练模型的参数规模扩展至十亿级别。模型用稀疏激活机制，在...

AIプロジェクト2025/12/18

SynthID - DeepMind推出能嵌入数字水印和检测AI生成内容的工具

SynthID 是 DeepMind 推出的技术工具，基于在 AI 生成的内容中嵌入数字水印帮助识别内容。水印对人类是不可感知的，但能被机器检测到，促进信息的信任度。Syn...

AIプロジェクト2025/12/18

Whispo - AI语音转录工具，一键录音与转写

Whispo是AI驱动的语音转录工具，支持用户按住Ctrl键录制语音，在释放键时自动将转录的文本插入到正在用的任何支持文本输入的应用程序中。工具的数据处理完全...

AIプロジェクト2025/12/18

AutoGLM-Web - AI浏览器助手，模拟用户进行网页浏览与交互

AutoGLM-Web是模拟用户操作的智能浏览器助手，基于大型语言模型构建，能执行网页访问、信息检索、内容总结等任务。基于简单的文字或语音指令，AutoGLM-Web能...

AIプロジェクト2025/12/18

OmniGen - 统一图像生成的扩散模型，支持多模态输入

OmniGen是用于统一图像生成的新扩散模型，能在单一框架内处理多种图像生成任务，如文本到图像的生成、图像编辑、主题驱动生成和视觉条件生成等。OmniGen涉及...

AIプロジェクト2025/12/18

CogAgent - 清华与智谱AI联合推出的多模态视觉大模型

CogAgent是清华大学与智谱AI联合推出的多模态视觉大模型，专注于图形用户界面（GUI）的理解和导航。通过视觉模态对GUI界面进行感知，非传统的文本模态，更符...

AIプロジェクト2025/12/18

OMNE Multiagent - 天桥脑科学研究院推出的大模型多智能体框架

OMNE Multiagent是天桥脑科学研究院（Tianqiao and Chrissy Chen Institute，TCCI）推出的大模型多智能体框架。基于长期记忆（Long Term Memory, LTM）构建，...

AIプロジェクト2025/12/18

DuoAttention - 提高LLMs处理长上下文推理效率的AI框架

DuoAttention是新型的框架，由MIT韩松团队提出，用在提高大型语言模型（LLMs）在处理长上下文时的推理效率。基于区分“检索头”和“流式头”两种注意力头，优化模...

AIプロジェクト2025/12/18

HuggingChat macOS - Hugging Face开源的macOS聊天应用程序

HuggingChat macOS是Hugging Face推出的开源聊天应用程序，专为macOS用户设计，基于强大的开源语言模型，将先进的AI对话能力直接带到用户的桌面上。应用支持...

AIプロジェクト2025/12/18

OmniParser - 微软推出的屏幕解析工具，将UI截图转换为结构化数据

OmniParser是微软研究院推出的屏幕解析工具，将用户界面的屏幕截图转换成结构化数据。工具专门设计用在提高基于大型语言模型（如GPT-4V）的UI代理系统的性能...

AIプロジェクト2025/12/18

Ditto - AI应用程序生成器，零编码自动规划和构建应用

Ditto是基于Flask的应用程序生成器，用户基于简单的自然语言描述创建多文件的Web应用程序。工具用一个简单的LLM循环和一些辅助工具自动化编码过程，将用户的...

AIプロジェクト2025/12/18

Flux.1 Lite - Freepik推出的轻量级AI模型

Flux.1 Lite是Freepik团队推出的轻量级AI模型，目前处于alpha版本。Flux.1 Lite是基于80亿参数的transformer架构，从FLUX.1-dev模型中提取而来。Flux.1 Lite...

AIプロジェクト2025/12/18

Phidata - 创建具有记忆、知识、工具和推理能力的AI智能体框架

Phidata是开源的AI智能体框架，帮助开发者构建具有记忆、知识、工具和推理能力的智能代理系统。支持创建能够协同工作的代理团队，提供用户界面实现与代理的交...

AIプロジェクト2025/12/18

Allegro - Rhymes AI推出文本生成高质量视频内容的模型

Allegro是由Rhymes AI推出的先进的文本到视频生成模型，能将简单的文本输入转换成高达720p分辨率、每秒15帧、长度达6秒的高质量视频内容。模型在视频生成领域...

AIプロジェクト2025/12/18

FakeShield - 北大推出检测图像伪造的多模态大语言模型框架

FakeShield是北京大学研究人员推出的多模态大型语言模型框架，能检测和定位图像伪造。框架能评估图像的真实性，生成被篡改区域的掩码，提供基于像素级和图像...

←1...47 48 49 50 51 52 53...137 →

AIニュース

AIプロジェクト2025/12/18

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

AIプロジェクト2025/12/18

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型，保持与前代 Claude 3 Haiku 相近的速度和成本的同时，实现了在各项能力上的提升，在多项基...

AIプロジェクト2025/12/18

PUMA - 多粒度策略统一的多模态大语言模型

AIプロジェクト2025/12/18

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

AIプロジェクト2025/12/18

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

AIプロジェクト2025/12/18

Mellum - JetBrains 推出专为开发者设计的大语言模型

AIプロジェクト2025/12/18

easegen - AI数字人课程制作平台，智能课件自动批量生成

AIプロジェクト2025/12/18

sCM - OpenAI推出连续时间一致性模型，两步采样生成高质量图像

AIプロジェクト2025/12/18

Moonshine - 实时转录场景、低延时高准确的语音识别模型

AIプロジェクト2025/12/18

Time-MoE - 基于MoE架构的时间序列基础模型

AIプロジェクト2025/12/18

SynthID - DeepMind推出能嵌入数字水印和检测AI生成内容的工具

AIプロジェクト2025/12/18

Whispo - AI语音转录工具，一键录音与转写

AIプロジェクト2025/12/18

AutoGLM-Web - AI浏览器助手，模拟用户进行网页浏览与交互

AIプロジェクト2025/12/18

OmniGen - 统一图像生成的扩散模型，支持多模态输入

AIプロジェクト2025/12/18

CogAgent - 清华与智谱AI联合推出的多模态视觉大模型

AIプロジェクト2025/12/18

OMNE Multiagent - 天桥脑科学研究院推出的大模型多智能体框架

OMNE Multiagent是天桥脑科学研究院（Tianqiao and Chrissy Chen Institute，TCCI）推出的大模型多智能体框架。基于长期记忆（Long Term Memory, LTM）构建，...

AIプロジェクト2025/12/18

DuoAttention - 提高LLMs处理长上下文推理效率的AI框架

AIプロジェクト2025/12/18

HuggingChat macOS - Hugging Face开源的macOS聊天应用程序

AIプロジェクト2025/12/18

OmniParser - 微软推出的屏幕解析工具，将UI截图转换为结构化数据

AIプロジェクト2025/12/18

Ditto - AI应用程序生成器，零编码自动规划和构建应用

AIプロジェクト2025/12/18

Flux.1 Lite - Freepik推出的轻量级AI模型

Flux.1 Lite是Freepik团队推出的轻量级AI模型，目前处于alpha版本。Flux.1 Lite是基于80亿参数的transformer架构，从FLUX.1-dev模型中提取而来。Flux.1 Lite...

AIプロジェクト2025/12/18

Phidata - 创建具有记忆、知识、工具和推理能力的AI智能体框架

AIプロジェクト2025/12/18

Allegro - Rhymes AI推出文本生成高质量视频内容的模型

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

PUMA - 多粒度策略统一的多模态大语言模型

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

Mellum - JetBrains 推出专为开发者设计的大语言模型

easegen - AI数字人课程制作平台，智能课件自动批量生成

sCM - OpenAI推出连续时间一致性模型，两步采样生成高质量图像

Moonshine - 实时转录场景、低延时高准确的语音识别模型

Time-MoE - 基于MoE架构的时间序列基础模型

SynthID - DeepMind推出能嵌入数字水印和检测AI生成内容的工具

Whispo - AI语音转录工具，一键录音与转写

AutoGLM-Web - AI浏览器助手，模拟用户进行网页浏览与交互

OmniGen - 统一图像生成的扩散模型，支持多模态输入

CogAgent - 清华与智谱AI联合推出的多模态视觉大模型

OMNE Multiagent - 天桥脑科学研究院推出的大模型多智能体框架

DuoAttention - 提高LLMs处理长上下文推理效率的AI框架

HuggingChat macOS - Hugging Face开源的macOS聊天应用程序

OmniParser - 微软推出的屏幕解析工具，将UI截图转换为结构化数据

Ditto - AI应用程序生成器，零编码自动规划和构建应用

Flux.1 Lite - Freepik推出的轻量级AI模型

Phidata - 创建具有记忆、知识、工具和推理能力的AI智能体框架

Allegro - Rhymes AI推出文本生成高质量视频内容的模型

FakeShield - 北大推出检测图像伪造的多模态大语言模型框架

AIニュース

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

PUMA - 多粒度策略统一的多模态大语言模型

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

Mellum - JetBrains 推出专为开发者设计的大语言模型

easegen - AI数字人课程制作平台，智能课件自动批量生成

sCM - OpenAI推出连续时间一致性模型，两步采样生成高质量图像

Moonshine - 实时转录场景、低延时高准确的语音识别模型

Time-MoE - 基于MoE架构的时间序列基础模型

SynthID - DeepMind推出能嵌入数字水印和检测AI生成内容的工具

Whispo - AI语音转录工具，一键录音与转写

AutoGLM-Web - AI浏览器助手，模拟用户进行网页浏览与交互

OmniGen - 统一图像生成的扩散模型，支持多模态输入

CogAgent - 清华与智谱AI联合推出的多模态视觉大模型

OMNE Multiagent - 天桥脑科学研究院推出的大模型多智能体框架

DuoAttention - 提高LLMs处理长上下文推理效率的AI框架

HuggingChat macOS - Hugging Face开源的macOS聊天应用程序

OmniParser - 微软推出的屏幕解析工具，将UI截图转换为结构化数据

Ditto - AI应用程序生成器，零编码自动规划和构建应用

Flux.1 Lite - Freepik推出的轻量级AI模型

Phidata - 创建具有记忆、知识、工具和推理能力的AI智能体框架

Allegro - Rhymes AI推出文本生成高质量视频内容的模型

FakeShield - 北大推出检测图像伪造的多模态大语言模型框架