智谱AutoClaw上线自进化机制与Skill商店
智谱AI旗下AutoClaw(澳龙)正式上线自进化机制与Skill商店。自进化功能可自动识别用户纠正、偏好及失败教训,经审批后固化为永久记忆,实现Agent越用越懂用户。平台同步推出GLM Office Skills五件套,基于GLM-5.1支持PPT、Word等细分场景设计、智能自检与格式互转,可一键生成配套办公材料。
智谱AI旗下AutoClaw(澳龙)正式上线自进化机制与Skill商店。自进化功能可自动识别用户纠正、偏好及失败教训,经审批后固化为永久记忆,实现Agent越用越懂用户。平台同步推出GLM Office Skills五件套,基于GLM-5.1支持PPT、Word等细分场景设计、智能自检与格式互转,可一键生成配套办公材料。
网易有道正式推出首个AI知识库产品“有道宝库”。产品定位为”外接超级知识库”,支持文档存储、智能问答及一键生成PPT、播客脚本、研究报告等内容。核心场景包括:30分钟掌握陌生领域知识并生成20页PPT;5分钟自动梳理全年项目文档生成年度总结;上传名人传记可模拟”名人董事会”提供决策建议能生成播客。
多模态生成式AI公司智象未来(HiDream.ai)宣布完成超5亿元新一轮融资,资金将用于原生全模态世界模型研发、企业智能体产品及全球市场拓展。公司开源模型HiDream-I1登顶Artificial Analysis榜单,开源下载量超200万次。目前产品覆盖3000万专业用户及4万多家企业客户,已形成商业营销、影视创作、社媒内容三大场景闭环。
阶跃星辰正式推出新一代语音生成模型StepAudio 2.5 TTS,具备全局语境控制、文中语境控制和零样本复刻三大核心能力。用户可通过自然语言精准调控语音情绪基调、语气节奏、停顿重音等细节,实现从”复现声音”到”创造表达”的跨越。模型支持任意音色零样本复刻,无需重新训练即可生成高品质语音。
阿里巴巴ATH创新事业部推出开放式世界模型产品HappyOyster,现已正式启动内测。产品支持实时构建与交互,提供”Directing”实时导演和”Wandering”世界漫游两种玩法,用户可在无限生成的视频流中创作或在延展空间中自由探索。目前官网已开放申请,用户可加入Waitlist获取首批内测资格。
腾讯混元3D世界模型2.0(HY-World 2.0)正式发布并开源。模型支持文字、图片、视频等多模态输入,可一键生成、重建和模拟完整3D世界,支持导出Mesh/3DGS/点云等可编辑资产,无缝对接Unity/UE游戏引擎。相比1.0版本,2.0采用WorldMirror 2.0架构,画面精细度与真实感大幅提升,支持角色模式自由探索与物理碰撞。
MiniMax正式推出全球首个云端沙箱Hermes——MaxHermes,基于Hermes Agent构建的云端自我进化AI助手。产品核心创新为学习闭环机制:每完成复杂任务自动提炼可复用的Skills能持续自我迭代,配备持久化记忆与多子代理并行能力。产品零门槛部署,已打通飞书、钉钉、企业微信等IM渠道,支持Token Plan抵扣消耗。 稀宇科技
面壁智能推出专业级文档智能体工作台Lantay,现已进入公测阶段。产品借鉴Cursor设计理念,通过Vibedocing交互范式实现人机协同创作,采用导航区、工作区、对话区三合一布局。平台支持16种格式文件处理,单次可批量整合200个材料,单文件上限100MB。Lantay主要面向法律、金融、出版等高严谨行业的重度文档工作者。
Meta宣布与芯片巨头博通签署五年长约(至2029年),初始投入超1GW算力用于定制AI芯片,扎克伯格宣称目标是”为数十亿人提供个人超级智能”。Meta计划两年内推出四代自研MTIA芯片(300/400/450/500),成立超级智能实验室,由Scale AI创始人Alexandr Wang担任首席AI官。
阿里ATH事业群推出首款AI开发工具Meoo(秒悟)。产品集成千问、Kimi、GLM、MiniMax四大顶尖模型,内置阿里云数据库、存储等核心服务。用户无需编程基础,通过自然语言描述需求,最快1分钟可自动生成完整前后端代码,支持在阿里云一键部署上线。
李飞飞旗下World Labs开源3D高斯溅射渲染引擎Spark 2.0,支持通过WebGL2将超1亿splats的3D世界流式传输至桌面、手机及VR设备。引擎基于Three.js构建,采用连续型LoD高斯溅射树、渐进式流式加载和虚拟内存技术,实现超大规模场景在网页端的实时渲染,解决传统引擎仅支持单对象、缺乏动态动画及设备兼容性差等痛点。
百度文心正式开源文生图模型 ERNIE-Image,仅8B参数达到开源SOTA水平,在文字渲染、复杂指令遵循等能力上媲美Nano Banana等商业闭源模型。模型24GB显存即可运行,支持中英日韩多语言精准字形生成,已上线ComfyUI并推出GGUF量化方案,相关权重与推理代码已在Hugging Face开源。
MiniMax Agent 桌面端推出两项更新:Pocket 功能(Beta版)支持接入飞书、微信等主流 IM,用户可在聊天中直接指挥电脑执行任务并回传结果;Computer Use 功能让 Agent 可像人一样看屏幕、操作鼠标键盘,直接操控本地软件和系统设置。 稀宇科技
火山引擎正式上线 Seedance 2.0 API 服务,面向企业和个人开放视频生成能力。模型支持文、图、音、视频四模态输入,具备多模态内容参考与编辑能力,并建立肖像版权安全标准。目前已应用于影视文娱(如贾樟柯导演短片、春晚)、漫短剧、广告营销、AI工具、具身智能、自动驾驶等行业,助力创作效率提升。
米哈游创始人蔡浩宇的AI公司Anuttacon推出首个视频模型LPM 1.0。模型拥有170亿参数,支持实时生成能说话、唱歌、倾听并表达情绪的AI角色视频,可保持长时间身份一致性生成(支持22-48分钟视频)。技术上采用扩散Transformer架构与因果式流生成器,解决表现力、实时性与长视频一致性难题。
MiniMax推出Music 2.6音乐生成模型,新增Cover功能可基于现有歌曲改编风格与编曲,同时优化国风乐器时序演进、中低频表现及人声自然度。模型首包延迟降至20秒内,支持BPM、调性、段落结构等精准指令控制。同步开源三款Music Skill供Agent调用。 稀宇科技
MiniMax正式开源MiniMax M2.7,成为首个由AI深度参与自我迭代的模型,支持构建复杂Agent Harness及Agent Teams等能力,在软件工程与办公场景表现优异。开源首日与华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA及Together AI、Fireworks等国内外芯片与推理平台完成适配。 稀宇科技
即梦AI正式推出智能创作助手 Octo 小章鱼,以”Vibe Create”为核心理念,支持无流程束缚、无场景限定的自由创作体验。产品现已上线即梦官网开放内测申请,助力用户打破繁琐流程束缚,让创作回归纯粹自由的对话体验,随时随地轻松落地灵感。
阿里通义实验室推出 VimRAG 框架,用动态有向无环图(DAG)替代线性上下文拼接,通过分支试错机制、视觉能量分配策略及图引导优化(GGPO),实现跨文本、图像、视频的精准检索与关联推理。实验显示,模型在Qwen3-VL-8B模型上准确率达50.1%,显著优于传统方案。
AI 陪伴机器人公司萌友智能 ropet 完成 A 轮超千万美元融资,由北京市人工智能产业投资基金、峰瑞资本等投资。ropet 桌面 AI 宠物售价约 2000 元,累计出货近 2 万台,90 天留存率达 80-90%,核心用户日均互动超 2 小时。产品主打”生物性”体验,通过性格养成、轻互动建立情感连接。
Meta超级智能实验室(MSL)推出首个模型 Muse Spark ,在Artificial Analysis跑分从Llama 4的18分跃升至52分,仅次于GPT-5.4和Gemini 3.1 Pro,推动Meta股价暴涨近10%。模型为原生多模态推理架构,具备视觉思维链、多Agent编排及”沉思模式”,在CharXiv视觉理解和HealthBench健康问答领域表现突出。
Anthropic推出最强模型Claude Mythos预览版,性能碾压Opus 4.6。模型能发现数千个高危漏洞,攻击能力超绝大多数黑客。模型因安全风险过高,暂不向公众开放,仅通过”Project Glasswing”向Amazon、Apple、Google等巨头及40多家基础设施企业开放,用于防御性安全加固。
爱诗科技推出首个影视行业大模型PixVerse C1,支持文生、图生、参考生、首尾帧生成及智能分镜,最高支持15秒1080P视频。模型具备多宫格分镜一键成片、复杂场景多角色精准调度、角色跨镜头一致性保持等能力,在打斗场面、特效渲染等工业级视效上实现突破。 AIsphere
智谱开源旗舰模型 GLM-5.1 ,为全球最强开源模型,可独立持续工作超8小时,自主完成复杂工程任务。模型代码能力在SWE-Bench Pro等基准测试中位列全球第三、国产第一,超越GPT-5.4与Claude Opus 4.6。实测可8小时构建完整Linux桌面系统、优化向量数据库性能近7倍、24小时迭代优化ML负载实现3.6倍加速。