AI News

All News Tutorials Wiki AI Projects AI Apps

AI Projects12/18/2025

video-analyzer - AI 视频分析工具，提取视频关键帧、生成视频详细描述

video-analyzer是开源的视频分析工具，结合Llama的11B视觉模型和OpenAI的Whisper模型来提取视频关键帧、转录音频内容，并生成视频的详细描述。工具支持完全本...

AI Projects12/18/2025

SPAR - 智谱团队推出的自我博弈训练框架

SPAR是智谱团队推出的自我博弈框架，能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动，生成者执行指令生成回复，完...

AI Projects12/18/2025

LowCodeEngine - 阿里开源的低代码开发框架

LowCodeEngine是阿里巴巴开源的低代码开发框架，基于提供拖拽、配置等简单操作，让开发者快速构建复杂的系统页面。框架以强大的定制能力、优雅的开发体验、丰...

AI Projects12/18/2025

Qwen-Agent - 阿里通义开源的 Agent 应用开发框架

Qwen-Agent是基于通义千问模型（Qwen）的开源Agent开发框架，支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agent支持函...

AI Projects12/18/2025

Mind GPT-3o - 理想汽车推出的多模态端到端大模型

Mind GPT-3o是理想汽车推出的多模态端到端大模型，融合语音、视觉和语言理解技术，实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力，能提...

AI Projects12/18/2025

琅琊 - 中国科学院海洋研究所自主研发的海洋大模型1.0版本

琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本，专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科学知识，能实...

AI Projects12/18/2025

DynamicControl - 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架

DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型（MLLM）推理能力的文本生成图像（T2I）任务新框架。DynamicControl通过自...

AI Projects12/18/2025

VideoPhy - UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试

VideoPhy是UCLA和谷歌研究研究院联合推出的，首个评估视频生成模型物理常识能力的基准测试，能衡量模型生成的视频是否遵循现实世界的物理规则。VideoPhy基准...

AI Projects12/18/2025

Large Motion Model - 商汤科技联合南洋理工推出的统一多模态运动生成模型

Large Motion Model（LMM）是统一的多模态运动生成模型，是新加坡南洋理工大学S-Lab和商汤科技研究团队共同推出的。LMM能处理包括文本到运动、音乐到舞蹈等多...

AI Projects12/18/2025

StereoCrafter - 腾讯开源将任意2D视频转为立体3D视频的框架

StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架，能将单目视频（2D视频）转换为立体3D视频，满足日益增长的3D内容需求。StereoCrafter基于深度估计、...

AI Projects12/18/2025

AgiBot World - 智元机器人开源的百万真机数据集

AgiBot World是智元机器人开源的百万真机数据集，旨在推动具身智能的发展。数据集包含八十余种日常技能，覆盖家居、餐饮、工业等五大核心场景，数据规模和质...

AI Projects12/18/2025

GraphAgent - 港大联合港科大开源的智能图形语言助手

GraphAgent是香港大学和香港科技大学（广州）联合推出的智能图形语言助手，能处理现实世界中结构化（如图连接）和非结构化（如文本、视觉信息）格式的数据，...

AI Projects12/18/2025

DeepSeek Engineer - 开源AI编程助手，处理用户对话生成结构化JSON

DeepSeek Engineer 是集成DeepSeek API 的AI编程助手，基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 ...

AI Projects12/18/2025

Psi R0 - 灵初智能推出的端到端具身模型

Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作，能够将多个技能串联混训，生成具有推理能力的智能体，完成并闭环...

AI Projects12/18/2025

FireCrawl - 开源 AI 网络爬虫工具，擅长处理动态网页内容、自动爬取网站及子页面

FireCrawl是开源的AI爬虫工具，专门用在Web数据提取，转换为Markdown或其他结构化数据。FireCrawl具备强大的抓取能力，支持动态网页内容处理，提供智能爬取状...

AI Projects12/18/2025

VideoVAE+ - 香港科技大学推出的先进跨模态视频变分自编码器

VideoVAE+（VideoVAE Plus）是香港科技大学团队推出的先进的跨模态视频变分自编码器（Video VAE），通过引入新的时空分离压缩机制和文本指导，实现了对大幅运...

AI Projects12/18/2025

Languine - 面向开发者自动化应用程序的多语言翻译 AI 工具

Languine 是 AI 驱动的翻译工具，能帮助开发者简化应用程序的开发过程。Languine 基于智能检测、AI 翻译、自动化工作流程和开发者友好的设计，让翻译管理变得...

AI Projects12/18/2025

Figma-Low-Code - 将Figma设计转换为Vue.js应用程序的开源项目

Figma-Low-Code是开源的项目，基于Luisa框架，支持开发者直接将Figma设计转换为Vue.js应用程序。大幅减少设计师与开发者之间的交接时间，减少前端编码工作，...

AI Projects12/18/2025

AI Dev Gallery - 微软推出面向Windows开发者本地运行AI模型的开源工具

AI Dev Gallery是微软推出的开源AI工具包和示例库，集成在Visual Studio中，帮助Windows开发者轻松集成端侧AI功能。AI Dev Gallery提供超过25个交互式示例，...

AI Projects12/18/2025

OpenEMMA - 德克萨斯联合多伦多等大学开源的端到端自动驾驶多模态模型

OpenEMMA是德州农工大学、密歇根大学和多伦多大学共同开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型（MLLMs）处理视觉数据和复杂驾驶...

AI Projects12/18/2025

RAG Logger - 专为检索增强生成应用设计的开源日志工具

RAG Logger是开源的日志记录工具，专为检索增强生成（RAG）应用设计。作为LangSmith的轻量级替代品，专注于满足RAG应用的日志记录需求。RAG Logger提供查询跟...

AI Projects12/18/2025

GLM-Zero - 智谱AI推出的深度推理模型

GLM-Zero是智谱AI基于扩展强化学习技术的推理模型，专注于提升模型的深度推理能力。擅长处理数理逻辑、代码编写和复杂问题解决，在AIME 2024、MATH500和LiveC...

AI Projects12/18/2025

AutoRAG - 中科院开源的自主迭代检索模型

AutoRAG是中国科学院计算技术研究所（ICT/CAS）、中国科学院的人工智能安全重点实验室及中国科学院大学的研究人员共同推出的新型自主迭代检索模型，专为大型...

AI Projects12/18/2025

MarS - 微软亚洲研究院开源的金融市场模拟预测引擎

MARS（Market Simulation）是微软亚洲研究院推出的金融市场模拟预测引擎，基于生成型基础模型LMM（Large Market Model）模拟金融市场中的订单流和市场动态。M...

←1...66 67 68 69 70 71 72...137 →

AI News

AI Projects12/18/2025

video-analyzer - AI 视频分析工具，提取视频关键帧、生成视频详细描述

AI Projects12/18/2025

SPAR - 智谱团队推出的自我博弈训练框架

AI Projects12/18/2025

LowCodeEngine - 阿里开源的低代码开发框架

AI Projects12/18/2025

Qwen-Agent - 阿里通义开源的 Agent 应用开发框架

AI Projects12/18/2025

Mind GPT-3o - 理想汽车推出的多模态端到端大模型

AI Projects12/18/2025

琅琊 - 中国科学院海洋研究所自主研发的海洋大模型1.0版本

AI Projects12/18/2025

DynamicControl - 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架

AI Projects12/18/2025

VideoPhy - UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试

AI Projects12/18/2025

Large Motion Model - 商汤科技联合南洋理工推出的统一多模态运动生成模型

AI Projects12/18/2025

StereoCrafter - 腾讯开源将任意2D视频转为立体3D视频的框架

StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架，能将单目视频（2D视频）转换为立体3D视频，满足日益增长的3D内容需求。StereoCrafter基于深度估计、...

AI Projects12/18/2025

AgiBot World - 智元机器人开源的百万真机数据集

AI Projects12/18/2025

GraphAgent - 港大联合港科大开源的智能图形语言助手

AI Projects12/18/2025

DeepSeek Engineer - 开源AI编程助手，处理用户对话生成结构化JSON

DeepSeek Engineer 是集成DeepSeek API 的AI编程助手，基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 ...

AI Projects12/18/2025

Psi R0 - 灵初智能推出的端到端具身模型

AI Projects12/18/2025

FireCrawl - 开源 AI 网络爬虫工具，擅长处理动态网页内容、自动爬取网站及子页面

AI Projects12/18/2025

VideoVAE+ - 香港科技大学推出的先进跨模态视频变分自编码器

AI Projects12/18/2025

Languine - 面向开发者自动化应用程序的多语言翻译 AI 工具

AI Projects12/18/2025

Figma-Low-Code - 将Figma设计转换为Vue.js应用程序的开源项目

AI Projects12/18/2025

AI Dev Gallery - 微软推出面向Windows开发者本地运行AI模型的开源工具

AI Dev Gallery是微软推出的开源AI工具包和示例库，集成在Visual Studio中，帮助Windows开发者轻松集成端侧AI功能。AI Dev Gallery提供超过25个交互式示例，...

AI Projects12/18/2025

OpenEMMA - 德克萨斯联合多伦多等大学开源的端到端自动驾驶多模态模型

AI Projects12/18/2025

RAG Logger - 专为检索增强生成应用设计的开源日志工具

AI Projects12/18/2025

GLM-Zero - 智谱AI推出的深度推理模型

AI Projects12/18/2025

AutoRAG - 中科院开源的自主迭代检索模型

AI Projects12/18/2025

All Categories

AI News

video-analyzer - AI 视频分析工具，提取视频关键帧、生成视频详细描述

SPAR - 智谱团队推出的自我博弈训练框架

LowCodeEngine - 阿里开源的低代码开发框架

Qwen-Agent - 阿里通义开源的 Agent 应用开发框架

Mind GPT-3o - 理想汽车推出的多模态端到端大模型

琅琊 - 中国科学院海洋研究所自主研发的海洋大模型1.0版本

DynamicControl - 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架

VideoPhy - UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试

Large Motion Model - 商汤科技联合南洋理工推出的统一多模态运动生成模型

StereoCrafter - 腾讯开源将任意2D视频转为立体3D视频的框架

AgiBot World - 智元机器人开源的百万真机数据集

GraphAgent - 港大联合港科大开源的智能图形语言助手

DeepSeek Engineer - 开源AI编程助手，处理用户对话生成结构化JSON

Psi R0 - 灵初智能推出的端到端具身模型

FireCrawl - 开源 AI 网络爬虫工具，擅长处理动态网页内容、自动爬取网站及子页面

VideoVAE+ - 香港科技大学推出的先进跨模态视频变分自编码器

Languine - 面向开发者自动化应用程序的多语言翻译 AI 工具

Figma-Low-Code - 将Figma设计转换为Vue.js应用程序的开源项目

AI Dev Gallery - 微软推出面向Windows开发者本地运行AI模型的开源工具

OpenEMMA - 德克萨斯联合多伦多等大学开源的端到端自动驾驶多模态模型

RAG Logger - 专为检索增强生成应用设计的开源日志工具

GLM-Zero - 智谱AI推出的深度推理模型

AutoRAG - 中科院开源的自主迭代检索模型

MarS - 微软亚洲研究院开源的金融市场模拟预测引擎

AI News

video-analyzer - AI 视频分析工具，提取视频关键帧、生成视频详细描述

SPAR - 智谱团队推出的自我博弈训练框架

LowCodeEngine - 阿里开源的低代码开发框架

Qwen-Agent - 阿里通义开源的 Agent 应用开发框架

Mind GPT-3o - 理想汽车推出的多模态端到端大模型

琅琊 - 中国科学院海洋研究所自主研发的海洋大模型1.0版本

DynamicControl - 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架

VideoPhy - UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试

Large Motion Model - 商汤科技联合南洋理工推出的统一多模态运动生成模型

StereoCrafter - 腾讯开源将任意2D视频转为立体3D视频的框架

AgiBot World - 智元机器人开源的百万真机数据集

GraphAgent - 港大联合港科大开源的智能图形语言助手

DeepSeek Engineer - 开源AI编程助手，处理用户对话生成结构化JSON

Psi R0 - 灵初智能推出的端到端具身模型

FireCrawl - 开源 AI 网络爬虫工具，擅长处理动态网页内容、自动爬取网站及子页面

VideoVAE+ - 香港科技大学推出的先进跨模态视频变分自编码器

Languine - 面向开发者自动化应用程序的多语言翻译 AI 工具

Figma-Low-Code - 将Figma设计转换为Vue.js应用程序的开源项目

AI Dev Gallery - 微软推出面向Windows开发者本地运行AI模型的开源工具

OpenEMMA - 德克萨斯联合多伦多等大学开源的端到端自动驾驶多模态模型

RAG Logger - 专为检索增强生成应用设计的开源日志工具

GLM-Zero - 智谱AI推出的深度推理模型

AutoRAG - 中科院开源的自主迭代检索模型

MarS - 微软亚洲研究院开源的金融市场模拟预测引擎