DeepEyesV2 - 小红书开源的多模态智能体模型
DeepEyesV2 是小红书团队推出的多模态智能体模型,通过两阶段训练法实现强大的工具调用和多模态推理能力。模型能理解图文信息,支持主动调用代码执行、网络搜...
DeepEyesV2 是小红书团队推出的多模态智能体模型,通过两阶段训练法实现强大的工具调用和多模态推理能力。模型能理解图文信息,支持主动调用代码执行、网络搜...
Doubao-Seed-Code 是字节跳动推出的 AI 编程模型,专为 Agentic 编程任务优化。模型支持 256K 长上下文,可处理复杂代码场景,具备视觉理解能力,能根据设计...
LazyCraft 是开源的 AI Agent 应用开发与管理平台,由商汤基于其开源框架 LazyLLM 构建。帮助开发者以低门槛、低成本快速构建和发布大模型应用。平台提供从应...
Kosong 是月之暗面(Moonshot AI)开源的全新AI Agent开发框架,为开发者提供一个轻量、灵活且高度可扩展的底层支持,以构建下一代智能体应用。通过异步工具...
ERNIE-4.5-VL是百度文心开源的新一代多模态AI模型,基于ERNIE-4.5-VL-28B-A3B架构,激活参数3B,主打视觉语言理解与跨模态推理。模型通过海量视觉-语言数据训...
KaLM-Embedding 是腾讯团队推出的一系列高性能文本嵌入模型,通过先进的训练技术和高质量数据提升文本嵌入的性能。最新版本 KaLM-Embedding-V2 在架构和训练...
GPT-5.1 是 OpenAI 对 GPT-5 系列的升级版本,能提升智能性和沟通能力。GPT-5.1包含两个版本,GPT-5.1 Instant 和 GPT-5.1 Thinking。
BestBlogs是 AI 驱动的内容聚合平台,基于 400 多个 RSS 订阅源,整合全球顶级编程、人工智能、产品设计和商业科技领域的优质内容。平台用大语言模型进行智能...
文心大模型5.0(文心5.0)是百度推出的原生全模态大模型,参数量达2.4万亿。模型采用统一自回归架构,实现文本、图像、音频、视频等多模态数据的理解与生成一...
Astron Agent 是企业级、商业友好的智能工作流开发平台,基于科大讯飞的核心技术打造。平台集成 AI 流程编排、模型管理、智能 RPA 自动化等功能,支持高可用...
OpenNof1 是 AI 自主交易系统,支持为用户提供自动化交易决策和风险管理。OpenNof1支持多种 AI 提供商(如 OpenAI、DeepSeek 等),能通过实时市场数据处理和...
Koina 是开源的去中心化机器学习平台,专为蛋白质组学研究设计。平台通过标准化接口和在线模型库,让研究人员能轻松上传、共享和调用机器学习模型,无需本地...
SIMA 2是谷歌DeepMind开发的最新一代AI智能体,在虚拟3D世界中展现出强大的交互、推理和学习能力。SIMA 2基于Gemini技术构建,采用“Gemini-SIMA Fusion”三层...
SmartResume 是阿里巴巴开源的智能简历解析工具。SmartResume通过 OCR 文本提取、PDF 元数据解析、版面检测和 LLM 智能结构化处理,将 PDF、图片、Word 等格...
Bee是清华大学和腾讯混元团队联合推出的高质量多模态大语言模型(MLLM)项目,解决开源模型因数据质量不足导致的性能瓶颈。项目的核心贡献包括:Honey-Data-1...
InfinityStar 是字节跳动推出的高效视频生成模型,通过统一的时空自回归框架,实现了高分辨率图像和动态视频的快速合成。模型采用时空金字塔结构,将视频分解...
Lumine是字节跳动推出的在3D开放世界游戏中实时感知、推理和行动的通用AI智能体。Lumine基于Qwen2-VL-7B-Base模型,通过类人交互范式,将感知、思考和行动整...
EverMemOS 是陈天桥领导的盛大团队推出的开源长期记忆操作系统,为 AI 助手提供持久、可检索的记忆能力。受人脑记忆机制启发,采用四层架构设计,包括代理层...
DPAI Arena 是 JetBrains 与 Linux 基金会合作推出的开放式 AI 编码智能体基准测试平台,能衡量 AI 工具在多语言、多框架和多工作流中的实际开发效率,基于多...
ChatTutor是全新一代的可视化交互式AI教师系统,通过实时同步画板实现“边讲解、边绘制、边推演”的类人教学体验。覆盖数学、物理、逻辑电路、编程和思维导图等...
WeatherNext 2是谷歌旗下DeepMind与Google Research联合推出了新一代AI天气预报模型。模型采用Functional Generative Network(FGN)架构,运算速度较前代提...
Skywork R1V4-Lite 是昆仑万维推出的轻量级多模态智能体。Skywork R1V4-Lite 集成视觉操作、深度推理与任务规划三大能力,能通过主动图像操作(如裁切、放大...
Gemini 3 是谷歌最新推出的AI模型,被誉为全球最先进的多模态理解与推理模型。模型具备强大的推理能力,刷新多项基准测试记录,如在 LMArena Leaderboard 上...
Generative UI 是谷歌推出的创新 AI 技术,能让 AI 根据用户的自然语言提示即时生成完整的、可交互的用户界面。界面可以是网页、工具、游戏或教育应用,完全...