AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

HeadGAP - 字节跳动推出的3D头像生成模型

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型，仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架，基于大规模多视角动态...

AI Projects12/18/2025

LeRobot - HuggingFace推出的开源AI聊天机器人项目

LeRobot是由HuggingFace推出的开源AI聊天机器人项目，由前特斯拉研究员Remi Cadene领导开发。LeRobot致力于降低机器人技术的入门门槛，提供预训练模型、数据...

AI Projects12/18/2025

LMMs-Eval - 专为多模态AI模型设计的统一评估框架

LMMs-Eval 是一个专为多模态AI模型设计的统一评估框架，提供标准化、广泛覆盖且成本效益高的模型性能评估解决方案。包含超过50个任务和10多个模型，通过透明...

AI Projects12/18/2025

OmniCorpus - 百亿级多模态数据集，支持中英双语

OmniCorpus是一个大规模多模态数据集，包含86亿张图像和16960亿个文本标记，支持中英双语。由上海人工智能实验室联合多所知名高校及研究机构共同构建。OmniCo...

AI Projects12/18/2025

MooER - 摩尔线程推出的业界首个音频理解大模型

MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别，还具备中译英的语音翻译能力。

AI Projects12/18/2025

EasyOCR - 支持超80种语言的开源OCR项目

EasyOCR 是一个功能强大的开源OCR（光学字符识别）项目，支持80多种语言和多种书写系统，包括中文、阿拉伯文和西里尔文。基于深度学习技术，提供高精度的文字...

AI Projects12/18/2025

StockBot - 基于Llama3的AI金融Agent，提升股票投资效率

StockBot 是一个基于Llama3的AI金融Agent，提供实时股票信息、财务数据、新闻和互动图表。支持多资产市场，包括股票、外汇、债券和加密货币。用户可通过自然...

AI Projects12/18/2025

GPTEngineer - 文本驱动生成Web网页的开源工具，AI自动写代码

GptEngineer 是一个基于 AI 技术通过简单的文本提示快速生成网页应用原型的开源工具。用户只需描述需求，AI 能自动编写并执行代码，支持与 GitHub 同步和一键...

AI Projects12/18/2025

Imagine Yourself - Meta公司推出的个性化AI图像生成模型

Imagine Yourself 是Meta公司推出的个性化AI图像生成模型，突破了传统方法的局限，无需对每个用户进行单独调整，通过单一模式即可满足不同用户需求。模型采用...

AI Projects12/18/2025

STranslate - 多功能免费AI翻译工具，支持离线OCR识别

STranslate是专为Windows用户设计的多功能翻译和OCR工具。支持多种语言翻译，具备划词、截图、监听剪贴板等多种翻译方式，并提供多家翻译服务接口。还拥有基...

AI Projects12/18/2025

Bark - Suno AI 推出的开源文本到音频模型

Bark是Suno AI 推出的开源文本到音频模型，能生成逼真的多语言语音和多种音频类型，包括音乐、背景噪音等，同时支持非语言交流如笑声和哭泣。Bark提供预训练...

AI Projects12/18/2025

LTM-2-mini - Magic公司推出的支持1亿token上下文AI模型

LTM-2-mini是Magic公司推出的支持1亿token上下文AI模型，能处理相当于1000万行代码或750本小说的内容。LTM-2-mini采用序列维度算法，计算效率比Llama 3.1 405...

AI Projects12/18/2025

eSearch - 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

eSearch是一款开源的跨平台AI桌面应用，集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发，适用于Linux、Windo...

AI Projects12/18/2025

VectorVein - 开源的无代码AI工作流工具，简单拖拽定制AI应用

VectorVein 是一款开源的无代码AI工作流工具，通过简化的拖拽操作，让用户无需编程知识即可构建智能工作流，实现日常任务的自动化。它支持数据处理、分析和知...

AI Projects12/18/2025

Sapiens - Meta推出的AI视觉模型，能理解图片和视频中的人类动作

Sapiens是Meta实验室推出的AI视觉模型，专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务，采用视觉转换...

AI Projects12/18/2025

OpenCity - AI交通预测模型，卓越的零样本预测和情境适应能力

OpenCity是由香港大学联合华南理工大学和百度共同研发的交通预测模型。OpenCity采用Transformer架构和图神经网络，通过大规模预训练学习交通数据的时空依赖关...

AI Projects12/18/2025

Eagle - 英伟达推出的多模态大模型，擅长高分辨率图像处理

Eagle是英伟达推出的多模态大模型，擅长处理高达1024×1024像素的图像，显著提升视觉问答和文档理解能力。Eagle模型采用多专家视觉编码器架构，通过简单高效的...

AI Projects12/18/2025

PGTFormer - 先进的AI视频人脸修复框架

PGTFormer是先进的视频人脸修复框架，通过解析引导的时间一致性变换器来恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，基于语义解析选择最...

AI Projects12/18/2025

HivisionIDPhotos - 免费开源的AI证件照制作工具

HivisionIDPhoto 是一款基于 AI 的轻量级证件照制作工具，它能智能识别和抠图，快速生成符合多种规格的证件照。支持自定义背景色和尺寸，未来还将推出美颜和...

AI Projects12/18/2025

Step-1X - 阶跃星辰推出的AI图像生成大模型

Step-1X 是阶跃星辰推出的AI图像生成大模型，采用自研的 DiT 架构，擅长深度语义理解和细节生成。Step-1X支持长达2000字符的复杂指令，能精准匹配图文，适用...

AI Projects12/18/2025

Melty - 开源的AI编程助手，大幅提升编码效率和质量

Melty是一款开源AI编程助手，专为提升开发者的编码效率和代码质量而设计。Melty通过实时理解开发者的编程活动，从终端操作到 GitHub 交互，提供智能协作和代...

AI Projects12/18/2025

Yi-Coder - 零一万物开源的AI编程助手模型，提供1.5B和9B两种参数

Yi-Coder是零一万物推出的开源编程助手系列模型，专为提升代码生成、理解、调试和补全等任务的效率而设计。Yi-Coder系列模型包含1.5B和9B两种参数规模的版本...

AI Projects12/18/2025

VideoGameBunny - 专为视频游戏设计的开源多模态大模型

VideoGameBunny（VGB）是一个专为视频游戏设计的开源大型多模态模型，由加拿大阿尔伯塔大学研究团队开发。它能理解和生成多种语言的游戏相关内容，支持高度定...

AI Projects12/18/2025

LanceDB - 为AI应用设计的无服务器向量数据库，降低运维成本

LanceDB 是一款专为人工智能应用设计的无服务器向量数据库，支持向量搜索、全文搜索和SQL查询，优化了多模态数据处理。它采用向量索引技术，实现高效相似度搜...

←1...36 37 38 39 40 41 42...137 →

AI News

AI Projects12/18/2025

HeadGAP - 字节跳动推出的3D头像生成模型

AI Projects12/18/2025

LeRobot - HuggingFace推出的开源AI聊天机器人项目

AI Projects12/18/2025

LMMs-Eval - 专为多模态AI模型设计的统一评估框架

AI Projects12/18/2025

OmniCorpus - 百亿级多模态数据集，支持中英双语

AI Projects12/18/2025

MooER - 摩尔线程推出的业界首个音频理解大模型

MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别，还具备中译英的语音翻译能力。

AI Projects12/18/2025

EasyOCR - 支持超80种语言的开源OCR项目

AI Projects12/18/2025

StockBot - 基于Llama3的AI金融Agent，提升股票投资效率

AI Projects12/18/2025

GPTEngineer - 文本驱动生成Web网页的开源工具，AI自动写代码

AI Projects12/18/2025

Imagine Yourself - Meta公司推出的个性化AI图像生成模型

AI Projects12/18/2025

STranslate - 多功能免费AI翻译工具，支持离线OCR识别

AI Projects12/18/2025

Bark - Suno AI 推出的开源文本到音频模型

AI Projects12/18/2025

LTM-2-mini - Magic公司推出的支持1亿token上下文AI模型

LTM-2-mini是Magic公司推出的支持1亿token上下文AI模型，能处理相当于1000万行代码或750本小说的内容。LTM-2-mini采用序列维度算法，计算效率比Llama 3.1 405...

AI Projects12/18/2025

eSearch - 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

AI Projects12/18/2025

VectorVein - 开源的无代码AI工作流工具，简单拖拽定制AI应用

AI Projects12/18/2025

Sapiens - Meta推出的AI视觉模型，能理解图片和视频中的人类动作

AI Projects12/18/2025

OpenCity - AI交通预测模型，卓越的零样本预测和情境适应能力

AI Projects12/18/2025

Eagle - 英伟达推出的多模态大模型，擅长高分辨率图像处理

AI Projects12/18/2025

PGTFormer - 先进的AI视频人脸修复框架

AI Projects12/18/2025

HivisionIDPhotos - 免费开源的AI证件照制作工具

AI Projects12/18/2025

Step-1X - 阶跃星辰推出的AI图像生成大模型

AI Projects12/18/2025

Melty - 开源的AI编程助手，大幅提升编码效率和质量

AI Projects12/18/2025

Yi-Coder - 零一万物开源的AI编程助手模型，提供1.5B和9B两种参数

AI Projects12/18/2025

VideoGameBunny - 专为视频游戏设计的开源多模态大模型

AI Projects12/18/2025

All Categories

AI News

HeadGAP - 字节跳动推出的3D头像生成模型

LeRobot - HuggingFace推出的开源AI聊天机器人项目

LMMs-Eval - 专为多模态AI模型设计的统一评估框架

OmniCorpus - 百亿级多模态数据集，支持中英双语

MooER - 摩尔线程推出的业界首个音频理解大模型

EasyOCR - 支持超80种语言的开源OCR项目

StockBot - 基于Llama3的AI金融Agent，提升股票投资效率

GPTEngineer - 文本驱动生成Web网页的开源工具，AI自动写代码

Imagine Yourself - Meta公司推出的个性化AI图像生成模型

STranslate - 多功能免费AI翻译工具，支持离线OCR识别

Bark - Suno AI 推出的开源文本到音频模型

LTM-2-mini - Magic公司推出的支持1亿token上下文AI模型

eSearch - 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

VectorVein - 开源的无代码AI工作流工具，简单拖拽定制AI应用

Sapiens - Meta推出的AI视觉模型，能理解图片和视频中的人类动作

OpenCity - AI交通预测模型，卓越的零样本预测和情境适应能力

Eagle - 英伟达推出的多模态大模型，擅长高分辨率图像处理

PGTFormer - 先进的AI视频人脸修复框架

HivisionIDPhotos - 免费开源的AI证件照制作工具

Step-1X - 阶跃星辰推出的AI图像生成大模型

Melty - 开源的AI编程助手，大幅提升编码效率和质量

Yi-Coder - 零一万物开源的AI编程助手模型，提供1.5B和9B两种参数

VideoGameBunny - 专为视频游戏设计的开源多模态大模型

LanceDB - 为AI应用设计的无服务器向量数据库，降低运维成本

AI News

HeadGAP - 字节跳动推出的3D头像生成模型

LeRobot - HuggingFace推出的开源AI聊天机器人项目

LMMs-Eval - 专为多模态AI模型设计的统一评估框架

OmniCorpus - 百亿级多模态数据集，支持中英双语

MooER - 摩尔线程推出的业界首个音频理解大模型

EasyOCR - 支持超80种语言的开源OCR项目

StockBot - 基于Llama3的AI金融Agent，提升股票投资效率

GPTEngineer - 文本驱动生成Web网页的开源工具，AI自动写代码

Imagine Yourself - Meta公司推出的个性化AI图像生成模型

STranslate - 多功能免费AI翻译工具，支持离线OCR识别

Bark - Suno AI 推出的开源文本到音频模型

LTM-2-mini - Magic公司推出的支持1亿token上下文AI模型

eSearch - 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

VectorVein - 开源的无代码AI工作流工具，简单拖拽定制AI应用

Sapiens - Meta推出的AI视觉模型，能理解图片和视频中的人类动作

OpenCity - AI交通预测模型，卓越的零样本预测和情境适应能力

Eagle - 英伟达推出的多模态大模型，擅长高分辨率图像处理

PGTFormer - 先进的AI视频人脸修复框架

HivisionIDPhotos - 免费开源的AI证件照制作工具

Step-1X - 阶跃星辰推出的AI图像生成大模型

Melty - 开源的AI编程助手，大幅提升编码效率和质量

Yi-Coder - 零一万物开源的AI编程助手模型，提供1.5B和9B两种参数

VideoGameBunny - 专为视频游戏设计的开源多模态大模型

LanceDB - 为AI应用设计的无服务器向量数据库，降低运维成本