VerseCrafter - 复旦联合腾讯开源的动态真实视频世界模型
VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型,具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练...
VerseCrafter 是复旦大学与腾讯 PCG ARC Lab 等机构推出的动态真实视频世界模型,具备 4D 几何控制能力。模型基于大规模真实世界数据集 VerseControl4D 训练...
NovaSR 是开源的音频超分辨率模型,仅有 52KB 能将 16kHz 的低采样率音频(如电话音质)提升到 48kHz 的高采样率音频(如录音室级音质)。模型通过神经网络预...
Playwriter 是开源的 Chrome 插件,基于微软 Playwright 打造,专为 AI 操作浏览器设计。工具通过插件形式无缝接入 Chrome,将 AI 的能力直接嵌入用户的浏览...
Prompt Manager (PromptX)是高效管理 AI 提示词的工具,专为提升 AI 工作效率设计。工具支持个人提示词的创建、编辑、分类和版本管理。通过智能分类和全局...
FrogBoss 是微软研究院推出的系列编程模型。模型通过创新的复杂漏洞生成方法(BugPilot)进行训练,该方法通过让语言模型代理(LLM)在代码库中添加新功能来...
OpenWork 是开源的桌面应用程序,为知识工作者提供类似 “Claude Cowork” 风格的工作流程。OpenWork 基于 OpenCode构建,提供简洁的引导式操作界面。
TranslateGemma 是谷歌推出的基于 Gemma 3 的新一代开源系列翻译模型。模型通过监督微调和强化学习相结合的方式,支持 55 种语言的高质量翻译,显著提升翻译...
FLUX.2 [klein] 是 Black Forest Labs 开源的高效图像生成与编辑模型。模型具备亚秒级推理速度,能在 0.5 秒内完成高质量图像生成和编辑,支持文生图、图生图...
AgentCPM-Explore 是清华大学、中国人民大学、面壁智能和 OpenBMB 开源社区联合推出的开源智能体模型。模型基于仅 4B 参数,在多个长程任务评测基准上超越同...
ArenaRL 是通义 DeepResearch 团队联合高德开源的,面向开放域智能体的对比式强化学习方法。ArenaRL通过引入锦标赛机制,将传统的绝对打分转变为组内相对排序...
Step-Audio-R1.1 是阶跃星辰推出的全球首个开源原生语音推理模型。模型以96.4%的准确率登顶全球权威语音推理榜单,超越众多一线模型。模型具备深度语音推理、...
司农(司农大语言模型)是南京农业大学推出的面向农业领域的垂直大模型。模型依托南农的学科优势,收集了涵盖多农业学科的超40亿token数据,包括书籍、论文、...
OctoCodingBench是MiniMax开源的针对Coding Agent的指令遵循能力的评测集。OctoCodingBench通过模拟真实软件开发场景,从系统约束、用户指令、项目规范、技能...
MedGemma 1.5 是谷歌开源的多模态AI医学模型,专为处理医学影像和文本数据设计。模型支持高维医学影像(如CT和MRI)、全切片病理影像、纵向影像分析、解剖定...
GLM-Image 是智谱联合华为开源的新一代多模态图像生成模型,基于昇腾 Atlas 800T A2 设备和昇思 MindSpore 框架训练,是首个全流程国产芯片训练的 SOTA 模型。
VidBee 是开源的视频下载工具,基于强大的 yt-dlp 引擎开发。工具能帮助用户轻松下载全球 1000 多个网站的音视频内容,包含热门的 YouTube、Bilibili,和小众...
BabyVision是 UniPat AI团队推出的多模态理解评测集,评估多模态语言模型(MLLMs)和图像生成模型在视觉推理任务上的表现。包含两个主要赛道:MLLM评估和生成...
PixVerse R1 是爱诗科技(PixVerse)推出的全球首个通用实时世界模型,标志着AI视频生成从“预录制”迈向“实时动态生成”的重大突破。R1通过三大核心技术实现创...
Engram 是DeepSeek团队联合北京大学推出的条件记忆模块,能提升大语言模型(LLM)的性能。Engram通过引入现代化的 -gram 嵌入表,将静态知识存储在独立的内存...
Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型。模型在问诊能力、医疗幻觉控制以及Healthbench和Healthbench Hard评测中均排名第一,超越了O...
女娲智能体OS(Nuwax Agent OS)是全球首个产品级开源的通用智能体操作系统。女娲智能体OS支持将AI从单纯的对话工具转变为企业的智能执行者,通过自主执行引...
Oh My OpenCode 是为 AI 编程助手设计的开源增强插件,能让 AI (如OpenCode )像真正的开发团队一样高效协作,提升编程体验。工具通过集成多种 AI 模型(如 ...
Spirit-v1.5 是千寻智能推出的具身智能基础模型。模型采用多样化、开放式的数据采集方式,摒弃传统“干净数据”的限制,让模型在预训练阶段接触更丰富的动作和...
Obsidian-skills 是 Obsidian 团队开发的一组开源工具,帮助用户更好地将 AI 工具(如 Claude Code)与 Obsidian 笔记系统结合使用。包含三大核心技能:obsid...