AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

ComfyGen - 英伟达联合特拉维夫推出的文本到图像生成系统

ComfyGen是由NVIDIA和特拉维夫大学研究人员推出的一种文本到图像生成系统，基于大型语言模型（LLM）自动创建与用户文本提示相匹配的工作流，提升图像生成的质...

AI Projects12/18/2025

restorePhotos.io - 开源的AI照片修复项目，高质量修复老旧照片

restorePhotos.io 是一个开源的AI项目，专注于修复老旧和模糊的人脸照片。用GFPGAN机器学习模型，基于Next.js API路由处理上传的照片，再返回修复后的照片。...

AI Projects12/18/2025

PDFtoChat - AI驱动的与PDF互动提取关键信息的开源项目

PDFtoChat 是一个开源的创新AI项目，支持用户基于自然语言对话的方式与 PDF 文件互动。工具基于最新的 AI 技术，包括 Together AI 和 Mixtral，理解用户的查...

AI Projects12/18/2025

Self-Taught Evaluators - Meta推出的新型模型评估方法

Self-Taught Evaluators是一种新型的模型评估方法，基于自我训练的方式提高大型语言模型（LLM）的评估能力，无需人工标注数据。从未经标记的指令开始，用迭代...

AI Projects12/18/2025

TurboSeek - AI驱动的开源的智能搜索引擎

TurboSeek是一个开源的AI搜索引擎，由Together.ai提供技术支持。基于现代化的技术栈，包括Next.js、Tailwind、Bing搜索API及先进的语言模型Mixtral 8x7B和Lla...

AI Projects12/18/2025

Napkins.dev - AI驱动的支持截图或线框图快速生成网页应用的开源项目

Napkins.dev是一个创新的开源项目，基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...

AI Projects12/18/2025

MDM - 苹果推出开源的新型扩散模型框架

Matryoshka Diffusion Models（MDM）是由苹果公司研究人员推出的一种新型扩散模型框架，旨在解决生成高分辨率图像和视频时面临的计算和优化挑战。MDM基于在多...

AI Projects12/18/2025

mPLUG-DocOwl 1.5 - 阿里开源的多模态大型语言模型

mPLUG-DocOwl 1.5是由阿里巴巴集团推出的多模态大型语言模型，专注于OCR-free（无需光学字符识别）的文档理解。模型基于统一结构学习，强化对文本丰富图像如...

AI Projects12/18/2025

Fluid - 谷歌联合MIT推出文本到图像的自回归生成模型

Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型，基于连续标记和随机生成顺序的方法，在视觉质量和评估性能上取得突破性进展。模型在扩...

AI Projects12/18/2025

SaRA - 上海交大联合腾讯推出的预训练扩散模型微调方法

SaRA是一种新型的预训练扩散模型微调方法，由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数，让模型能适应新任务。SaRA基...

AI Projects12/18/2025

Quanta Quest - 开源的AI个人数据库产品，多平台数据整合

Quanta Quest是一款面向个人用户的开源AI时代智能数据库产品，基于将个人数据如Gmail、Dropbox、Notion等整合到一个平台上，用RAG技术提供AI搜索功能，帮助用...

AI Projects12/18/2025

BiGR - 统一条件生成图像的模型框架，增强生成质量和表示能力

BiGR是一种新型的条件图像生成模型，用紧凑的二进制潜在代码进行生成训练，增强图像的生成质量和表示能力。作为首个在同一框架内统一生成和判别任务的模型，B...

AI Projects12/18/2025

MoE++ - 昆仑万维和北大联合推出的混合专家架构

MoE++是一种新型的混合专家（Mixture-of-Experts）架构，由昆仑万维2050研究院与北大袁粒团队联合推出。基于引入零计算量专家，即零专家、复制专家和常数专家...

AI Projects12/18/2025

Granite 3.0 - IBM推出用于企业级应用的系列AI模型

Granite 3.0 是 IBM 推出的一系列先进的AI模型，能在多个学术和企业基准测试中展现出卓越的性能。模型设计用在企业级应用，能执行各种任务，包括文本生成、分...

AI Projects12/18/2025

Project Turntable - Adobe推出可旋转操作2D矢量图像的AI工具

Project Turntable是Adobe在2024年MAX大会上推出的一款创新AI工具。工具能让用户像操作3D对象一样旋转2D矢量图像，即时生成图像所需的隐藏部分。用AI模型填充...

AI Projects12/18/2025

OmniAI - AI文档处理平台，支持多格式批量处理和信息提取

OmniAI是一个强大的AI文档处理平台，基于先进的OCR技术，支持对PDF、DOCX、图片等多种文件格式进行快速处理和数据提取。平台支持用户轻松创建文档处理管道，...

AI Projects12/18/2025

TaskWeaver - 微软推出代码优先的AI智能体框架

TaskWeaver是由微软推出的一个代码优先的AI智能体框架，专注于无缝规划和执行数据分析任务。基于代码片段解释用户请求，高效协调各种插件（以函数形式）执行...

AI Projects12/18/2025

Stable Diffusion 3.5 - Stability AI最新开源的图像生成模型

Stable Diffusion 3.5是Stability AI公司最新推出的一系列先进的AI图像生成模型，包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo和即将...

AI Projects12/18/2025

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

Mochi 1是Genmo公司推出的开源视频生成模型，在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apache 2.0许可证发布，支持个人和商业用途的免费使用。模型...

AI Projects12/18/2025

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型，保持与前代 Claude 3 Haiku 相近的速度和成本的同时，实现了在各项能力上的提升，在多项基...

AI Projects12/18/2025

PUMA - 多粒度策略统一的多模态大语言模型

PUMA是一个先进的多模态大型语言模型（MLLM），旨在基于集成多粒度视觉特征统一和增强视觉生成和理解任务。PUMA能处理从文本到图像的生成、详细的图像编辑及...

AI Projects12/18/2025

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

Janus是一个由DeepSeek AI推出的自回归框架，旨在统一多模态理解和生成任务。将视觉编码分离成不同的路径解决以往方法的局限性，且用单一的变换器架构进行处...

AI Projects12/18/2025

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

PaddleOCR 2.9是由百度飞桨（PaddlePaddle）推出的一款开源光学字符识别（OCR）工具库。提供丰富的算法和模型，支持多种语言识别，提供数据标注和合成工具。P...

AI Projects12/18/2025

Mellum - JetBrains 推出专为开发者设计的大语言模型

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型（LLM），旨在提升 AI 驱动的开发工具。通过深度集成 JetBrains IDE，提供低延迟、高准确度的代...

←1...46 47 48 49 50 51 52...137 →

AI News

AI Projects12/18/2025

ComfyGen - 英伟达联合特拉维夫推出的文本到图像生成系统

AI Projects12/18/2025

restorePhotos.io - 开源的AI照片修复项目，高质量修复老旧照片

AI Projects12/18/2025

PDFtoChat - AI驱动的与PDF互动提取关键信息的开源项目

AI Projects12/18/2025

Self-Taught Evaluators - Meta推出的新型模型评估方法

AI Projects12/18/2025

TurboSeek - AI驱动的开源的智能搜索引擎

TurboSeek是一个开源的AI搜索引擎，由Together.ai提供技术支持。基于现代化的技术栈，包括Next.js、Tailwind、Bing搜索API及先进的语言模型Mixtral 8x7B和Lla...

AI Projects12/18/2025

Napkins.dev - AI驱动的支持截图或线框图快速生成网页应用的开源项目

AI Projects12/18/2025

MDM - 苹果推出开源的新型扩散模型框架

AI Projects12/18/2025

mPLUG-DocOwl 1.5 - 阿里开源的多模态大型语言模型

AI Projects12/18/2025

Fluid - 谷歌联合MIT推出文本到图像的自回归生成模型

AI Projects12/18/2025

SaRA - 上海交大联合腾讯推出的预训练扩散模型微调方法

AI Projects12/18/2025

Quanta Quest - 开源的AI个人数据库产品，多平台数据整合

AI Projects12/18/2025

BiGR - 统一条件生成图像的模型框架，增强生成质量和表示能力

AI Projects12/18/2025

MoE++ - 昆仑万维和北大联合推出的混合专家架构

AI Projects12/18/2025

Granite 3.0 - IBM推出用于企业级应用的系列AI模型

AI Projects12/18/2025

Project Turntable - Adobe推出可旋转操作2D矢量图像的AI工具

AI Projects12/18/2025

OmniAI - AI文档处理平台，支持多格式批量处理和信息提取

AI Projects12/18/2025

TaskWeaver - 微软推出代码优先的AI智能体框架

AI Projects12/18/2025

Stable Diffusion 3.5 - Stability AI最新开源的图像生成模型

Stable Diffusion 3.5是Stability AI公司最新推出的一系列先进的AI图像生成模型，包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo和即将...

AI Projects12/18/2025

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

AI Projects12/18/2025

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型，保持与前代 Claude 3 Haiku 相近的速度和成本的同时，实现了在各项能力上的提升，在多项基...

AI Projects12/18/2025

PUMA - 多粒度策略统一的多模态大语言模型

AI Projects12/18/2025

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

AI Projects12/18/2025

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

AI Projects12/18/2025

All Categories

AI News

ComfyGen - 英伟达联合特拉维夫推出的文本到图像生成系统

restorePhotos.io - 开源的AI照片修复项目，高质量修复老旧照片

PDFtoChat - AI驱动的与PDF互动提取关键信息的开源项目

Self-Taught Evaluators - Meta推出的新型模型评估方法

TurboSeek - AI驱动的开源的智能搜索引擎

Napkins.dev - AI驱动的支持截图或线框图快速生成网页应用的开源项目

MDM - 苹果推出开源的新型扩散模型框架

mPLUG-DocOwl 1.5 - 阿里开源的多模态大型语言模型

Fluid - 谷歌联合MIT推出文本到图像的自回归生成模型

SaRA - 上海交大联合腾讯推出的预训练扩散模型微调方法

Quanta Quest - 开源的AI个人数据库产品，多平台数据整合

BiGR - 统一条件生成图像的模型框架，增强生成质量和表示能力

MoE++ - 昆仑万维和北大联合推出的混合专家架构

Granite 3.0 - IBM推出用于企业级应用的系列AI模型

Project Turntable - Adobe推出可旋转操作2D矢量图像的AI工具

OmniAI - AI文档处理平台，支持多格式批量处理和信息提取

TaskWeaver - 微软推出代码优先的AI智能体框架

Stable Diffusion 3.5 - Stability AI最新开源的图像生成模型

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

PUMA - 多粒度策略统一的多模态大语言模型

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

Mellum - JetBrains 推出专为开发者设计的大语言模型

AI News

ComfyGen - 英伟达联合特拉维夫推出的文本到图像生成系统

restorePhotos.io - 开源的AI照片修复项目，高质量修复老旧照片

PDFtoChat - AI驱动的与PDF互动提取关键信息的开源项目

Self-Taught Evaluators - Meta推出的新型模型评估方法

TurboSeek - AI驱动的开源的智能搜索引擎

Napkins.dev - AI驱动的支持截图或线框图快速生成网页应用的开源项目

MDM - 苹果推出开源的新型扩散模型框架

mPLUG-DocOwl 1.5 - 阿里开源的多模态大型语言模型

Fluid - 谷歌联合MIT推出文本到图像的自回归生成模型

SaRA - 上海交大联合腾讯推出的预训练扩散模型微调方法

Quanta Quest - 开源的AI个人数据库产品，多平台数据整合

BiGR - 统一条件生成图像的模型框架，增强生成质量和表示能力

MoE++ - 昆仑万维和北大联合推出的混合专家架构

Granite 3.0 - IBM推出用于企业级应用的系列AI模型

Project Turntable - Adobe推出可旋转操作2D矢量图像的AI工具

OmniAI - AI文档处理平台，支持多格式批量处理和信息提取

TaskWeaver - 微软推出代码优先的AI智能体框架

Stable Diffusion 3.5 - Stability AI最新开源的图像生成模型

Mochi 1 - Genmo推出的开源高质量AI视频生成模型

Claude 3.5 Haiku - Anthropic推出的响应最快的AI模型

PUMA - 多粒度策略统一的多模态大语言模型

Janus - DeepSeek推出的自回归框架，统一多模态理解和生成任务

PaddleOCR 2.9 - 百度飞桨推出的新版开源光学字符识别（OCR）工具库

Mellum - JetBrains 推出专为开发者设计的大语言模型