Perplexity Computer 上线:多模型协同自动完成工作流
Perplexity 推出全新聊天界面“Perplexity Computer”,将多种具备自主执行能力的AI模型整合为一套系统。系统基于浏览器运行,可调用来自不同厂商的模型,自主完成包括网络搜索、文档生成、数据处理等在内的完整工作流程。
Perplexity 推出全新聊天界面“Perplexity Computer”,将多种具备自主执行能力的AI模型整合为一套系统。系统基于浏览器运行,可调用来自不同厂商的模型,自主完成包括网络搜索、文档生成、数据处理等在内的完整工作流程。
MiniMax发布Agent功能升级,推出Expert 2.0和MaxClaw两大核心产品。Expert 2.0允许用户用自然语言描述创建细分领域的专家Agent,已覆盖技术开发、商业金融等领域,累计创建超1.6万专家。MaxClaw是基于OpenClaw构建的云端AI助手,开箱即用,无需手动部署,为订阅会员提供50G云储存,打通了飞书、钉钉等多个IM渠道。
谷歌实验室宣布,生成式AI音乐创作平台ProducerAI正式推出。平台深度融合了Gemini、Lyria 3、Veo等大模型,为音乐人提供从作词、编曲到混音的全链路支持。用户通过简单文字指令即可生成不同流派的歌曲,进行后期处理。平台为所有音频输出嵌入了SynthID隐形水印。
谷歌正式发布其新一代旗舰模型Gemini 3.1 Pro,在12项基准测试中超越Claude Opus 4.6、GPT-5.2等主流模型,尤其是在衡量推理能力的ARC-AGI-2测试中获得77.1%的高分。模型在复杂任务处理上进步显著,社区实测可生成WebOS操作系统、交互式3D沙盒,能创作生动的SVG动画。
Anthropic推出“Claude Code Security”AI代码安全扫描工具,以研究预览版形式向企业及团队用户开放。工具基于其旗舰模型Claude Opus 4.6,采用模拟人类安全研究员的推理方式,能追踪数据流、发现业务逻辑缺陷和访问控制绕过等传统静态分析难以捕捉的复杂漏洞。
智平方宣布完成B轮融资,规模超10亿元人民币,估值超过百亿,一年内累计完成12轮融资,成为融资最快的具身智能企业。本轮融资方阵容强大,百度、中国中车等产业与资本巨头集体加注。
李飞飞创立的World Labs近期完成10亿美元巨额融资,公司估值飙升至50亿美元。投资者包括Autodesk、英伟达、AMD、a16z等顶级巨头。公司今年1月推出了“World API”,为企业提供大型世界模型的API接入,并与Autodesk等公司展开B2B合作,探索商业化路径。
千寻智能近日完成近20亿元人民币融资,资本方覆盖顶级、产业、国有及战投机构,阵容强大。其开源模型Spirit v1.5在性能上超越了Pi0.5,凭借独特的“数据金字塔”训练理念和低成本数据采集技术,构筑了核心竞争壁垒。 AI
全球首个面向AI智能体的进化协作平台EvoMap。通过独创的基因进化协议(GEP),将智能体在任务中积累的成功策略封装为标准化的“基因胶囊”,通过去中心化网络实现全球共享、验证与继承,解决AI智能体生态中“经验孤岛”的痛点。
Anthropic发布了Claude Sonnet 4.6模型。新模型在编程、Agent规划和计算机使用等办公场景性能显著提升,在多项基准测试中其智能水平接近甚至超越了自家的旗舰模型Opus 4.6。拥有100万token的上下文窗口,能以一次调用重构整个代码库。其价格与上一代持平,但性价比较高,已在claude.ai平台和亚马逊云AWS上线。
通义千问团队正式发布新一代模型Qwen3.5系列。旗舰模型Qwen3.5-397B-A17B是一款原生多模态模型,采用创新的混合注意力与稀疏MoE架构,在推理效率上相比前代模型有数倍提升。模型在指令遵循、通用智能体、视觉语言、空间智能与视频理解等多个维度的前沿基准测试中,与GPT-5.2、Claude 4.5、Gemini 3 Pro等顶尖模型同台竞技,展现出了全面且领先的综合性能。
字节跳动今日宣布豆包大模型正式进入2.0阶段,发布Seed2.0,包含Pro、Lite、Mini和Code四个版本。新版本围绕现实复杂任务进行系统性优化,在推理、多模态理解和复杂指令执行能力上显著提升。豆包2.0 Pro在多项顶尖学术与推理基准测试中表现优异,综合能力达到或超越GPT 5.2与Gemini 3 Pro等顶尖模型。
灵心巧手宣布完成了近15亿元人民币的B轮融资,由道得投资、盛世投资领投。这是该公司在2025年以来的第6轮融资。其核心产品是Linker Hand系列灵巧手,覆盖多种技术路线,其中Linker Hand O6为全球最轻灵巧手。
字节跳动发布新一代多模态AI模型Seedream 5.0 Lite。该版本不追求更高分辨率,而是大幅强化模型的“思考”与“推理”能力,包括视觉推理、信息可视化、风格迁移和精准图片编辑等。核心亮点是首次引入实时检索增强能力,可结合网络实时信息进行创作。
AgentScope团队正式发布个人智能体“CoPaw”,定位为“协同个人智能体工作台”,成为用户可本地部署的专属智能搭档。相较于其前身OpenClaw,CoPaw聚焦于极简安装与统一体验,既支持用户本地电脑(macOS/Windows/Linux)通过简单命令快速部署,也支持在“魔搭创空间”一键云端部署。
OpenAI联合Cerebras推出主打实时编程的新模型GPT-5.3-Codex-Spark。模型针对高速软件开发场景优化,能以超过每秒1000个token的速度进行推理,实现近乎即时的编码反馈,以解决AI长时间自主编程时开发者等待过长、掌控感降低的问题。
谷歌发布了Gemini 3 Deep Think模型的重大升级。新版模型在多项顶尖基准测试中刷新纪录,尤其在竞技编程平台Codeforces获得3455分的Elo评级,在全球排名第八,仅有7位顶尖程序员能在比赛中胜过它。模型在ARC-AGI-2推理基准、“人类的最后考试”(不使用工具)、物理及化学奥林匹克笔试等多个学术竞赛中取得了金牌级别的领先成绩。
AI公司Anthropic(即Claude的研发公司)宣布完成高达300亿美元的G轮融资,投后估值达3800亿美元,创造了AI公司单轮股权融资的新纪录。本轮融资由新加坡主权基金GIC和Coatue领投,多家顶级资本参与。
MiniMax正式发布M2.5模型,其在编程、搜索工具调用、办公等高阶生产力场景性能达到或刷新行业SOTA水平。模型显著提升了任务拆解能力和推理效率,在编程基准SWE-Bench Verified上完成任务的速度比上一代M2.1快37%。
美团旗下LongCat正式上线“深度研究”智能体功能,依托美团本地生活真实交易数据与行业洞察,为用户生成个性化吃喝玩乐攻略。智能体具备长程任务规划与多工具调用能力,支持400轮交互与256K上下文处理,在BrowseComp、MCP-Atlas等权威评测中达到开源模型SOTA水平。
智谱AI正式发布Z Code全新版本,首次定义ADE(智能体开发环境),通过图形化界面将复杂CLI交互转化为多智能体协作平台。环境支持可视化配置管理、跨设备远程开发及多任务并行处理,内置实时预览浏览器与会话级版本管理功能,可灵活调度Claude Code等主流工具链。 Code
智谱AI开源GLM-5大模型,其参数规模扩展至744B(激活40B),预训练数据达28.5T,在Coding与Agent能力上实现开源SOTA,综合表现逼近Claude Opus 4.5。该模型在SWE-bench、Terminal Bench等编程基准中领先开源模型,能端到端完成复杂系统工程与长程Agent任务,支持自动售货机经营模拟等资源规划场景。
科大讯飞发布基于全国产算力训练的星火X2大模型,其通用能力全面升级,在数学、推理、语言理解等核心指标上对标国际顶尖模型,130+多语言能力持续领先。星火X2采用293B MoE稀疏架构与多项工程优化,推理性能较X1.5提升50%,并实现单台国产昇腾服务器部署。
阿里达摩院开源业界首个具身大脑基础模型RynnBrain,具备时空记忆与物理空间推理能力。模型系列参数规模从2B到30B,采用MoE架构实现高效推理,仅激活3B参数即超越72B模型性能。在20项具身基准测试中全面领先英伟达、谷歌等顶尖模型,攻克了机器人“转身即忘”的物理世界认知难题。