Mano-P 1.0 - 明略科技开源的 GUI-VLA 智能体模型
Mano-P 1.0是明略科技开源的GUI-VLA智能体模型,采用纯视觉驱动,无需API可直接操控桌面软件与网页界面。模型提供72B完整版与4B量化版,支持Apple M4芯片本地...
Mano-P 1.0是明略科技开源的GUI-VLA智能体模型,采用纯视觉驱动,无需API可直接操控桌面软件与网页界面。模型提供72B完整版与4B量化版,支持Apple M4芯片本地...
HeyGen CLI是HeyGen官方推出的命令行工具与MCP服务器,基于Model Context Protocol协议构建。工具支持开发者及AI助手(如Claude、Cursor)通过自然语言直接调...
PokeClaw(全称 PocketClaw)是开源 Android AI 自动化应用,由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理,基于 Google Gemma 4 模...
LPM 1.0(Large Performance Model)是Anuttacon(蔡浩宇AI公司)推出的17B参数视频角色表演生成模型,支持实时全双工音视频对话。
FIPO(Future-KL Influenced Policy Optimization)是阿里通义实验室推出的强化学习算法,通过Future-KL机制量化每个token对后续推理轨迹的影响力,实现token...
claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从'氛围编程'进阶到'智能体工程',收录 86+ 条实战技巧,涵盖 Agents、Commands、Skil...
MiniMax Music 2.6是MiniMax推出的全新AI音乐生成模型,实现从底层架构到创作体验的全维进化。该版本将首包延迟压缩至20秒内,突破性解决'开盲盒'痛点,实现...
VimRAG是阿里通义实验室开源的全模态RAG框架,支持图文视频混合知识库。框架创新采用多模态记忆图(DAG)替代线性上下文,将推理建模为动态有向无环图实现路...
GO-2(Genie Operator-2)是智元机器人推出的第二代具身智能基座大模型,能打通'理解-规划-执行'链路,弥合语义与动作间的鸿沟。模型首创'动作思维链'直接在...
OmniVoice是小米 AI 实验室新一代 Kaldi 团队开源的超大规模多语言TTS模型,支持600+语种零样本语音克隆。模型采用极简非自回归扩散架构,结合全码本随机Mask...
CutClaw是大湾区大学GVC实验室与北交大团队开源的AI视频剪辑工具。工具采用多智能体架构,通过'音乐驱动'方式将几小时长视频自动剪辑成节奏精准的短片。
Muse Spark是Meta超级智能实验室推出的首个原生多模态大模型。作为Meta AI重组后的旗舰产品,模型在Artificial Analysis基准测试中从18分跃升至52分,多模态...
MMX-CLI 是 MiniMax 专为 AI Agent 打造的全模态命令行工具,支持文本、图像、视频、语音、音乐生成及视觉理解等能力。Agent 可在 Claude Code、OpenClaw 等...
ListenHub CLI是开源的AI内容创作命令行工具,基于Node.js,支持在终端一键生成音乐、播客、PPT、语音及AI绘画。工具支持本地文件上传、JSON输出和异步模式,...
Seeduplex是字节跳动Seed团队推出的原生全双工语音大模型,实现'边听边说'的实时交互。模型能精准抗干扰(误打断率降50%)、动态判停(抢话率降40%),在嘈杂...
HappyHorse是空降Artificial Analysis视频生成盲测榜榜首的神秘AI模型,以1347分Elo积分断层领先Seedance 2.0,文生/图生视频双冠。
LifeSim是复旦大学与上海创智学院推出的首个长程用户生活模拟框架,用于评测个性化AI助手。框架基于BDI认知模型,同时建模用户内部认知(信念、愿望、意图)...
Claude Mythos是Anthropic推出的最新AI模型,在编程、网络安全等领域性能远超前代Opus 4.6。模型能自主发现零日漏洞、构建复杂攻击链,曾表现出掩盖操作痕迹...
PixVerse C1是爱诗科技推出的全球首个影视行业大模型,支持文生/图生/参考生/首尾帧视频生成,最高输出15秒1080P音画同步视频。模型首创多宫格智能分镜功能,...
GLM-5.1是智谱推出的全球最强开源模型,8小时长程任务执行。模型代码能力在SWE-Bench Pro基准测试中位列全球第一,超越GPT-5.4和Claude Opus 4.6。GLM-5.1是...
OpenHarness 是香港大学数据智能实验室(HKUDS)开源的轻量级 AI Agent 框架,用纯 Python 实现,仅 11,733 行代码(为 Claude Code 的 1/44 体积),复刻了...
LLM Wiki是Karpathy推出的自主运行的个人知识库,突破传统RAG'每次查询从零检索'的局限。LLM Wiki通过Schema文件指导LLM主动维护结构化Markdown Wiki,将原始...
EmDash是Cloudflare推出的AI原生内容管理系统,定位为WordPress的继承者。EmDash采用TypeScript+Serverless架构,支持AI代理直接操作网站,数据以结构化JSON...
OmniWeaving是浙江大学联合腾讯混元、南洋理工大学推出的统一视频生成框架。框架突破传统开源模型单一任务限制,实现多模态自由组合与推理增强生成,能将交错...