AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

StoryDiffusion - 生成一致性图像和视频序列的开源AI框架

StoryDiffusion是一个先进的AI图像和视频生成框架，用于从文本描述生成具有一致性的图像和视频序列。基于Consistent Self-Attention机制增强图像间的一致性，...

AIプロジェクト2025/12/18

Crawl4AI - 基于Python的异步爬虫框架，高效同时处理多个网页

Crawl4AI是一款用 Python 开发的异步爬虫框架，专为大型语言模型（LLMs）和人工智能（AI）应用设计，简化网络爬虫和数据提取流程。基于异步架构，高效地处理...

AIプロジェクト2025/12/18

Wren AI - 开源文本驱动的SQL数据库查询解决方案

Wren AI 是一个开源的文本到 SQL 解决方案，基于自然语言处理技术，支持用户通过自然语言提问执行数据库查询，无需编写复杂的 SQL 代码。支持多种数据库和数...

AIプロジェクト2025/12/18

Podcastfy - AI文本转语音工具，支持多源文本转多种语言音频

Podcastfy 是一个开源的 Python 软件包，能将网络内容、PDF 文档及文本转换成多语言的音频对话形式。这款工具采用了先进的生成式人工智能（GenAI）技术，类似...

AIプロジェクト2025/12/18

Gradio - 开源的Python库，快速创建机器学习模型的交互式网页

Gradio 是一个开源的 Python 库，简化机器学习模型的演示和共享过程。支持开发者基于简单的代码快速创建出友好的网页界面，任何人、任何地点能轻松使用机器学...

AIプロジェクト2025/12/18

LosslessCut - 开源的AI视频编辑工具，无损精准剪辑与合并音视频文件

LosslessCut是一款开源的视频编辑工具，用于快速且无损地剪切和合并视频和音频文件。基于强大的FFmpeg库构建，提供一个直观的图形用户界面，用户轻松地进行剪...

AIプロジェクト2025/12/18

Future You - MIT推出与60岁时虚拟形象对话的AI产品

Future You是麻省理工学院（MIT）推出的AI对话聊天产品，支持用户与60岁时的虚拟形象进行互动对话。Future You基于先进的AI技术，结合用户当前的生活目标和个...

AIプロジェクト2025/12/18

PixWizard - 开源的AI图像视觉助手，多功能图像生成、编辑、翻译

PixWizard是一个多功能的图像到图像视觉助手，基于自然语言指令执行图像生成、编辑和翻译等任务。系统通过统一的图像-文本到图像生成框架，将多种视觉任务整...

AIプロジェクト2025/12/18

screenpipe - 搭建个性化AI助手的软件，捕捉屏幕和音频录音

screenpipe是一款基于AI技术，全天候监控用户电脑屏幕和麦克风的开源软件。通过捕捉屏幕活动和音频，用AI进行智能分析，提升工作效率和保障数据隐私。screenp...

AIプロジェクト2025/12/18

Pyramid-Flow - 北大、快手、北邮联合开源的AI视频生成模型

Pyramid-Flow是一种先进的视频生成模型，由北京大学、快手科技和北京邮电大学的研究人员联合推出。模型根据文本提示生成长达10秒、分辨率高达1280x768、帧率2...

AIプロジェクト2025/12/18

Aria - Rhymes AI开源的多模态原生混合专家（MoE）模型

Aria是由Rhymes AI团队推出全球首个开源多模态原生混合专家（MoE）模型，能理解和处理文本、代码、图像和视频等多种输入模态。模型在多模态和语言任务上展现...

AIプロジェクト2025/12/18

Swarm - OpenA推出的轻量级多智能体编排框架

Swarm是由OpenAI推出的一个实验性框架，旨在构建、编排和部署多智能体系统。基于轻量级的Agent和handoff机制，简化智能体之间的协调和执行过程，让控制更加精...

AIプロジェクト2025/12/18

百度智能云一见 - 百度推出的AI视觉大模型平台

百度智能云一见是百度智能云推出的视觉大模型平台，旨在基于领先的视觉大模型技术和丰富的场景化算法方案，实现专业级视觉AI应用的平民化。平台打通从模型生...

AIプロジェクト2025/12/18

libcom - 上海交大推出开源的图像合成问题解决工具

libcom 是一个由上海交通大学 (BCMI) 实验室推出的图像合成工具箱。旨在解决前景和背景之间的不一致性问题，如外观、几何和语义上的不匹配，生成逼真的合成图...

AIプロジェクト2025/12/18

F5-TTS - 上海交大推出开源的文本到语音（TTS）合成系统

F5-TTS是由上海交通大学开源的一款高性能文本到语音（TTS）系统，基于流匹配的非自回归生成方法，结合扩散变换器（DiT）技术。系统在没有额外监督的情况下，...

AIプロジェクト2025/12/18

CursorCore - 程序员的AI编程辅助框架，对话形式交互理解上下文

CursorCore是一个基于大型语言模型（LLMs）的编程辅助框架，用对话式交互帮助程序员更高效地编写和修改代码。框架整合编程过程中的各种信息，包括代码历史、...

AIプロジェクト2025/12/18

MM1.5 - 苹果推出的升级版多模态大模型

MM1.5是苹果公司推出的多模态大型语言模型，旨在增强文本丰富图像理解、视觉指代和定位以及多图像推理能力。模型基于数据为中心的训练方法，在大规模预训练、...

AIプロジェクト2025/12/18

Surya - 开源的OCR工具包，支持90+语言、布局分析等识别

Surya是一款功能强大的开源OCR（光学字符识别）工具包，专门设计用在文档识别，支持超过90种语言的识别。Surya能准确识别出文档中的文本，分析文本的阅读顺序...

AIプロジェクト2025/12/18

Illuminate - 谷歌推出将学术论文转化为音频讨论的AI项目

Illuminate 是一个由谷歌开发的项目，能将学术论文转化为人工智能生成的音频讨论。项目基于谷歌强大的语言模型 Gemini，将论文内容转换成引人入胜的对话，使...

AIプロジェクト2025/12/18

Loong - 港大和字节联合推出的长视频生成模型

Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型，能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型（LLM...

AIプロジェクト2025/12/18

ScriptViz - 斯坦福大学推出的剧本可视化AI辅助工具

ScriptViz是由斯坦福大学研究人员推出的一款剧本可视化辅助工具，基于大型电影数据库MovieNet，根据剧本文本和对话检索出相匹配的电影画面，将编剧的文字描述...

AIプロジェクト2025/12/18

MLE-bench - OpenAI推出AI代理性能评估的基准测试工具

MLE-bench 是 OpenAI 推出的一个基准测试工具，旨在衡量AI代理（AI Agent）在机器学习工程任务中的表现。测试包含75个来自 Kaggle 的竞赛任务，覆盖自然语言...

AIプロジェクト2025/12/18

GTSinger - 浙大开源的大型多语言高质量歌声数据集

GTSinger是由浙江大学研究团队推出的大型开源高质量歌声数据集，旨在支持多样化的歌声任务。GTSinger包含80.59小时的专业录音棚录制的歌声，涵盖九种不同语言...

AIプロジェクト2025/12/18

LightRAG - 香港大学推出的开源检索增强生成系统

LightRAG是由香港大学研究团队推出的一种检索增强生成（Retrieval-Augmented Generation, RAG）系统，基于整合图结构索引和双层检索机制，提升大型语言模型在...

←1...44 45 46 47 48 49 50...137 →

AIニュース

AIプロジェクト2025/12/18

StoryDiffusion - 生成一致性图像和视频序列的开源AI框架

AIプロジェクト2025/12/18

Crawl4AI - 基于Python的异步爬虫框架，高效同时处理多个网页

AIプロジェクト2025/12/18

Wren AI - 开源文本驱动的SQL数据库查询解决方案

AIプロジェクト2025/12/18

Podcastfy - AI文本转语音工具，支持多源文本转多种语言音频

AIプロジェクト2025/12/18

Gradio - 开源的Python库，快速创建机器学习模型的交互式网页

AIプロジェクト2025/12/18

LosslessCut - 开源的AI视频编辑工具，无损精准剪辑与合并音视频文件

AIプロジェクト2025/12/18

Future You - MIT推出与60岁时虚拟形象对话的AI产品

AIプロジェクト2025/12/18

PixWizard - 开源的AI图像视觉助手，多功能图像生成、编辑、翻译

AIプロジェクト2025/12/18

screenpipe - 搭建个性化AI助手的软件，捕捉屏幕和音频录音

AIプロジェクト2025/12/18

Pyramid-Flow - 北大、快手、北邮联合开源的AI视频生成模型

AIプロジェクト2025/12/18

Aria - Rhymes AI开源的多模态原生混合专家（MoE）模型

AIプロジェクト2025/12/18

Swarm - OpenA推出的轻量级多智能体编排框架

AIプロジェクト2025/12/18

百度智能云一见 - 百度推出的AI视觉大模型平台

AIプロジェクト2025/12/18

libcom - 上海交大推出开源的图像合成问题解决工具

AIプロジェクト2025/12/18

F5-TTS - 上海交大推出开源的文本到语音（TTS）合成系统

AIプロジェクト2025/12/18

CursorCore - 程序员的AI编程辅助框架，对话形式交互理解上下文

AIプロジェクト2025/12/18

MM1.5 - 苹果推出的升级版多模态大模型

AIプロジェクト2025/12/18

Surya - 开源的OCR工具包，支持90+语言、布局分析等识别

AIプロジェクト2025/12/18

Illuminate - 谷歌推出将学术论文转化为音频讨论的AI项目

AIプロジェクト2025/12/18

Loong - 港大和字节联合推出的长视频生成模型

AIプロジェクト2025/12/18

ScriptViz - 斯坦福大学推出的剧本可视化AI辅助工具

AIプロジェクト2025/12/18

MLE-bench - OpenAI推出AI代理性能评估的基准测试工具

AIプロジェクト2025/12/18

GTSinger - 浙大开源的大型多语言高质量歌声数据集

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

StoryDiffusion - 生成一致性图像和视频序列的开源AI框架

Crawl4AI - 基于Python的异步爬虫框架，高效同时处理多个网页

Wren AI - 开源文本驱动的SQL数据库查询解决方案

Podcastfy - AI文本转语音工具，支持多源文本转多种语言音频

Gradio - 开源的Python库，快速创建机器学习模型的交互式网页

LosslessCut - 开源的AI视频编辑工具，无损精准剪辑与合并音视频文件

Future You - MIT推出与60岁时虚拟形象对话的AI产品

PixWizard - 开源的AI图像视觉助手，多功能图像生成、编辑、翻译

screenpipe - 搭建个性化AI助手的软件，捕捉屏幕和音频录音

Pyramid-Flow - 北大、快手、北邮联合开源的AI视频生成模型

Aria - Rhymes AI开源的多模态原生混合专家（MoE）模型

Swarm - OpenA推出的轻量级多智能体编排框架

百度智能云一见 - 百度推出的AI视觉大模型平台

libcom - 上海交大推出开源的图像合成问题解决工具

F5-TTS - 上海交大推出开源的文本到语音（TTS）合成系统

CursorCore - 程序员的AI编程辅助框架，对话形式交互理解上下文

MM1.5 - 苹果推出的升级版多模态大模型

Surya - 开源的OCR工具包，支持90+语言、布局分析等识别

Illuminate - 谷歌推出将学术论文转化为音频讨论的AI项目

Loong - 港大和字节联合推出的长视频生成模型

ScriptViz - 斯坦福大学推出的剧本可视化AI辅助工具

MLE-bench - OpenAI推出AI代理性能评估的基准测试工具

GTSinger - 浙大开源的大型多语言高质量歌声数据集

LightRAG - 香港大学推出的开源检索增强生成系统

AIニュース

StoryDiffusion - 生成一致性图像和视频序列的开源AI框架

Crawl4AI - 基于Python的异步爬虫框架，高效同时处理多个网页

Wren AI - 开源文本驱动的SQL数据库查询解决方案

Podcastfy - AI文本转语音工具，支持多源文本转多种语言音频

Gradio - 开源的Python库，快速创建机器学习模型的交互式网页

LosslessCut - 开源的AI视频编辑工具，无损精准剪辑与合并音视频文件

Future You - MIT推出与60岁时虚拟形象对话的AI产品

PixWizard - 开源的AI图像视觉助手，多功能图像生成、编辑、翻译

screenpipe - 搭建个性化AI助手的软件，捕捉屏幕和音频录音

Pyramid-Flow - 北大、快手、北邮联合开源的AI视频生成模型

Aria - Rhymes AI开源的多模态原生混合专家（MoE）模型

Swarm - OpenA推出的轻量级多智能体编排框架

百度智能云一见 - 百度推出的AI视觉大模型平台

libcom - 上海交大推出开源的图像合成问题解决工具

F5-TTS - 上海交大推出开源的文本到语音（TTS）合成系统

CursorCore - 程序员的AI编程辅助框架，对话形式交互理解上下文

MM1.5 - 苹果推出的升级版多模态大模型

Surya - 开源的OCR工具包，支持90+语言、布局分析等识别

Illuminate - 谷歌推出将学术论文转化为音频讨论的AI项目

Loong - 港大和字节联合推出的长视频生成模型

ScriptViz - 斯坦福大学推出的剧本可视化AI辅助工具

MLE-bench - OpenAI推出AI代理性能评估的基准测试工具

GTSinger - 浙大开源的大型多语言高质量歌声数据集

LightRAG - 香港大学推出的开源检索增强生成系统