ChatDev 2.0 - 清华联合面壁智能开源的零代码多智能体工具
ChatDev 2.0 是清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具。工具通过可视化交互,让用户通过“拖拽 + 配置”快速构建多智能...
ChatDev 2.0 是清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具。工具通过可视化交互,让用户通过“拖拽 + 配置”快速构建多智能...
EvoCUA(Evolving Computer Use Agent)是美团开源的多模态模型,专注于计算机使用自动化任务。EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、Power...
MMSI-Video-Bench 是用于评估多模态大语言模型(MLLMs)在视频空间智能方面能力的基准测试工具。由上海人工智能实验室等多所高校联合推出,全面评估模型在真...
Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型,参数规模为 19.6 亿。专为智能体任务设计,具备强大的“原生智能体能力”,在多项任务中超越同规模甚至更大...
OS-Copilot是开源的操作系统智能助手项目,为构建能与操作系统中各种元素(如网络、代码终端、文件、多媒体和第三方应用)交互的通用计算机智能体。核心是FRI...
10Kh RealOmni-Open是Gen Robot.AI团队开源的具身智能数据集,是目前行业内规模最大的开源数据集之一。包含超过10000小时的数据、100万+任务剪辑,存储总量达...
UI-TARS Desktop 是字节跳动开源的基于视觉语言模型的桌面自动化工具。支持通过自然语言指令控制电脑操作,如打开文件、浏览网页、操作软件等,能精准识别屏...
Open Interpreter 是开源的AI终端助手项目,为大型语言模型(LLM)提供本地代码运行能力。通过自然语言交互界面,用户可以通过类似 ChatGPT 的方式在终端中与...
TeleChat3是中国电信人工智能研究院(TeleAI)自主研发的千亿参数细粒度MoE语义大模型,采用国产算力训练,支持多轮对话、文本创作、代码生成等任务。模型包...
openPangu-VL-7B 是华为推出的开源多模态模型,专为昇腾硬件优化。模型结合语言和视觉能力,具备强大的视觉定位和OCR功能,能高效处理图像、文档和视频任务。
MiroThinker v1.5 是 MiroMind 团队开源的搜索智能体模型。模型通过交互式扩展技术,将推理与外部环境深度耦合,打破传统大模型依赖庞大参数的局限。
TuriX-CUA 是基于 Python 开源的 AI 智能体,能通过 AI 技术实现桌面自动化操作。TuriX-CUA 通过截屏“看”屏幕,用多模态大模型“思考”下一步操作,完成用户指...
DLCM(Dynamic Large Concept Models)是字节Seed团队推出的新型大语言模型架构。框架将模型的推理单位从传统的token(词)提升到concept(概念)层级,通过...
Paper2Any是北京大学DCAI课题组推出的开源多模态AI辅助平台,基于自动化数据治理Agent框架DataFlow-Agent,能将科研论文自动转化为可编辑的PPT和SVG文件。支...
OpenCode 是开源的 AI 编程助手,能提升开发效率和代码质量。工具以终端界面、桌面应用或 IDE 插件的形式存在,通过与多种语言模型(LLM)提供商集成,为开发...
StoryMem 是字节跳动与南洋理工大学联合发布的开源视频生成框架,解决 AI 视频生成中长期存在的跨镜头一致性问题。通过显式视觉记忆机制,将单镜头视频扩散模...
Voquill是开源的语音输入工具,通过语音输入替代传统键盘打字,提升写作和记录效率。支持macOS、Windows和Linux系统,可在任何文本框和应用程序中使用,实现...
XVERSE-Ent是元象科技开源的专为泛娱乐领域设计的中英双语底座大模型,包含中文模型XVERSE-Ent-A4.2B和英文模型XVERSE-Ent-A5.7B。模型在角色一致性、长剧情...
Vibe Kanban 是开源的看板工具,帮助开发者高效管理 AI 编码Agent,如 Claude Code、Gemini CLI 和 Codex 等。通过可视化看板,让用户能轻松切换和编排多个编...
ClipSketch AI 是开源的 AI 驱动内容创作工具,专为视频创作者、社交媒体运营者和二创爱好者设计。能解析 Bilibili 和小红书的视频链接,自动提取关键帧并转...
IQuest-Coder-V1是IQuestLab推出的专注于代码生成、理解和优化的先进人工智能模型。具备多种参数规模(7B、14B、40B)和版本(Instruct、Thinking、Loop),...
RedInk(红墨)是开源的AI小红书图文生成工具,致力于简化内容创作流程。用户输入主题后,工具能快速生成吸睛标题、优质正文和精美配图,实现“一句话生成一套...
mHC(Manifold-Constrained Hyper-Connections)是DeepSeek团队推出的新型的神经网络架构设计方法,解决传统超连接(Hyper-Connections, HC)架构在大规模训...
AutoMV 是M-A-P、北京邮电大学、南京大学NJU-LINK实验室等机构开发的自动化多智能体系统,支持将歌曲转化为连贯、与节奏对齐的音乐视频。系统通过音乐信息检...