谷歌推出AI音乐生成模型 Lyria 3 Pro
谷歌推出旗下先进AI音乐生成模型Lyria 3 Pro,较前代在生成结构和长度上大幅提升。模型可精准处理前奏、主歌、副歌、桥段等编曲要素,支持生成最长约3分钟的完整音轨。模型不会直接模仿特定艺术家风格,训练数据仅使用合法授权内容,且所有生成音频均嵌有SynthID数字水印。
谷歌推出旗下先进AI音乐生成模型Lyria 3 Pro,较前代在生成结构和长度上大幅提升。模型可精准处理前奏、主歌、副歌、桥段等编曲要素,支持生成最长约3分钟的完整音轨。模型不会直接模仿特定艺术家风格,训练数据仅使用合法授权内容,且所有生成音频均嵌有SynthID数字水印。
美团龙猫团队推出LongCat-Next多模态模型,核心创新为LoZA稀疏注意力机制。模型支持1M超长上下文,通过智能筛查将50%低重要模块替换为流式稀疏注意力,实现128K解码速度提升10倍、算力节省30%。模型包含Flash-Exp和Flash-Lite两个版本,在长文本任务表现超越Qwen-3。
OpenAI宣布关停Sora视频生成平台,包括App、API及ChatGPT视频功能。关停根本原因是OpenAI为筹备IPO进行的战略收缩,将算力转向下一代模型”Spud”及企业级生产力工具。同时OpenAI刚与迪士尼达成三年IP授权协议并获10亿美元投资意向,现已终止合作。
阿里在海外上线企业级Agent产品Accio Work ,定位”企业版龙虾”。用户只需提出想法,内置的AI Agent团队可7×24小时自动完成选品、采购、建站、运营等全流程,30分钟生成可运营的海外网店。产品支持单个Agent对话或Agent Team群聊模式,可自定义角色与技能,关键操作需用户授权保障安全。
MiniMax宣布开源一套生产级Office文档引擎MiniMax Office Skills,包含Word、Excel、PDF、PPT四大组件,采用MIT协议。方案能解决AI生成文档”能用但不好用”的痛点,确保公式、格式、数据透视表等高级功能完整保留。技术选型上,Word采用.NET OpenXML SDK非python-docx,Excel直接操作XML非openpyxl,换取更高保真度。 稀宇科技
阿里云JVS Claw全面开放公测,用户无需邀请码可访问使用。新版本新增语音输入、5GB专属文件空间、一键修复、Skill开关等功能,支持定时任务管理和Clawbot一键升级。新用户可享7天免费体验,付费版”匠心版”首月低至39元,用户无需购买Mac mini硬件或承担API费用可使用云端OpenClaw服务。
阿里达摩院推出新一代旗舰RISC-V CPU IP——玄铁C950,SPECint2006基准测试突破70分,成为全球最强RISC-V CPU。产品首次实现RISC-V CPU原生流畅跑通千亿参数大模型(Qwen3、DeepSeek V3),集成4K超宽Vector引擎和Matrix引擎,单核算力达8TFLOPS。
阿里通义实验室推出视频生成音频框架 PrismAudio,专注环境音/音效合成。模型首创将强化学习与思维链结合,通过”分解式思维链”让模型先分析视频内容、时序、音质、空间位置再生成音频,引入四位”老师”(语义、时序、美学、空间)分别打分优化。
Meta收购AI创业公司Dreamer及团队,公司由前小米全球副总裁雨果·巴拉等人创立,能帮助用户创建AI智能体。Dreamer团队将加入Meta超级智能实验室,负责AI智能体研发。目前协议条款未披露,但投资方将获得高于投资额的回报,Dreamer保留独立法人实体地位,Meta获得非排他性技术许可。
智象未来推出首个图片视频原生AI Agent产品HiDreamClaw,已接入旗下创意平台vivago web端面向海外用户开放。产品基于自研超百亿参数HiDream-I1多模态大模型,内置AIGC Skill,支持图片、视频、文字等多模态创作,集成Nano Banana、Veo、Sora等SOTA模型。
腾讯推出自研AI设计工具Ardot,能帮助设计师从”做图的”回归”设计师”角色。Ardot旨在成为”最懂设计师的小助手”,承担重复性工作,如自动整理图层、智能调整细节,让设计师专注于创意与洞察,实现灵感更快落地。
美团开源LongCat-Flash-Prover 大模型,采用 5677 亿参数 MoE 架构,专注解决复杂数学证明问题。模型引入混合专家迭代框架,整合 Lean4 与 AST 多阶段严格验证,有效消除幻觉。在 MiniF2F-Test 上取得 97.1% 成绩,PutnamBench 解决 41.5% 问题,两项测试均刷新 SOTA 水平。
智谱推出GLM-Claw智能体,支持打造一群”懂你的AI虾兵”协助处理各类事务。产品定位为个性化AI助手团队,可协同完成复杂任务,提升用户工作与生活效率。通过多智能体协作机制,实现从单一对话向多任务处理的升级。
微信正式推出微信ClawBot插件,支持接入 OpenClaw(龙虾)。用户通过「我-设置-插件」获取安装指令,扫码可将龙虾连接至微信,实现聊天式远程操控。目前插件逐步放量中,需更新至微信最新版本。同时,腾讯云 Lighthouse(含企业版 Claw Pro)、自研 WorkBuddy、本地 QClaw 等也已支持微信通道。
百度智能云DuMate(中文名:搭子)正式上线,成为国内首个企业级满血版OpenClaw产品。产品用自然语言为交互入口,支持Word、Excel、PPT等办公软件的原生操作,具备文件智能管理、多源数据分析、办公操作自动化三大核心功能。DuMate内置百度搜索等Skills全家桶能力,支持灵活扩展。
MiniMax推出全球首个支持全模态模型的订阅计划Token Plan,在原Coding Plan基础上新增视频、语音、音乐、图像等多模态模型调用能力,一个Key可满足代码编写、内容创作、视频生成等需求。同时推出语音/视频资源包可节省20%成本。 稀宇科技
商汤大装置、大晓机器人与广西产业技术研究院达成三方战略合作,共同赋能广西具身智能产业升级。三方将协同构建”算力—数据—模型—场景”四位一体产业闭环,依托”广西—东盟具身智能中试训练场”,打造专属算力调度平台、具身高质量数据集和规模化机器人应用场景,助力广西打造面向东盟的具身智能产业创新高地。
阿里通义千问推出Qwen3.5-Max-Preview 预览版,模型在代码、数学、多语言理解等能力上实现显著提升。作为Qwen3.5系列旗舰模型,采用混合专家(MoE)架构,总参数量达235B,激活参数22B,在保持高效推理的同时实现性能突破。模型支持长达256K tokens的上下文窗口,擅长复杂推理和长文本处理。
生数科技旗下AI视频平台Vidu正式推出ViduClaw「V龙」智能体。产品定位为可商用的一站式AI视频Agent解决方案,支持”一键成片”功能——用户仅需上传一张产品图加一句话描述,或一个参考视频加一张图加一句话,可自动生成15-30秒完整广告片,涵盖分镜脚本、场景拆解、画面与配音同步输出。 AI
腾讯QClaw AI助手正式开启全量公测,无需邀请码即可下载使用。新版本打通微信、企业微信、QQ、飞书、钉钉五大IM平台,率先实现企业微信自动回复消息功能,可总结聊天内容、写文档、订日程等。新增「像素工作室」可视化界面,用像素风格展示AI工作状态;推出可视化定时任务功能,支持周期性任务管理与一键执行。
Cursor正式推出Composer 2,已在Cursor中上线。模型具备前沿级编码能力,定价为每百万输入token 2.50美元,在智能与成本之间实现最优平衡。在CursorBench测试中,Composer 2性能显著优于前代及竞品;在Terminal-Bench 2.0基准测试中得分61.7%,超越Opus 4.6(58.0%)和Composer 1.5(47.9%)。
面壁智能联合清华大学、OpenBMB社区开源EdgeClaw框架,和开箱即用的智能硬件EdgeClaw Box——专为OPC(一人公司)及数据敏感企业打造。产品通过S1/S2/S3三级隐私路由机制,实现数据本地化处理、自动脱敏上云、断网运行等功能,集成MiniCPM端侧模型,支持零Token消耗处理简单任务。
阶跃星辰推出基于OpenClaw深度优化的桌面端AI Agent「StepClaw」,支持Windows和Mac双端,无需服务器和命令行可一键部署。产品接入拥有5000+创作者的「水产市场」生态,提供Skill、插件、触发器等应用资源,支持Agent自主进化、个性化换肤、经验沉淀分享等功能。数据本地存储保障安全,内置安全审查技术拦截恶意代码。
小米连发三款面向Agent时代的大模型:MiMo-V2-Pro 旗舰基座模型,1T参数/42B激活,1M上下文;MiMo-V2-Omni 全模态Agent基座,融合文本/视觉/语音,支持GUI操作与工具调用;MiMo-V2-TTS 语音合成模型,支持多粒度情感控制、方言与歌声。三者分别以”Healer Alpha”和”Hunter Alpha”代号在OpenRouter匿名测试,