面壁智能推出专业级文档智能体工作台 Lantay
面壁智能推出专业级文档智能体工作台Lantay,现已进入公测阶段。产品借鉴Cursor设计理念,通过Vibedocing交互范式实现人机协同创作,采用导航区、工作区、对话区三合一布局。平台支持16种格式文件处理,单次可批量整合200个材料,单文件上限100MB。Lantay主要面向法律、金融、出版等高严谨行业的重度文档工作者。
面壁智能推出专业级文档智能体工作台Lantay,现已进入公测阶段。产品借鉴Cursor设计理念,通过Vibedocing交互范式实现人机协同创作,采用导航区、工作区、对话区三合一布局。平台支持16种格式文件处理,单次可批量整合200个材料,单文件上限100MB。Lantay主要面向法律、金融、出版等高严谨行业的重度文档工作者。
Meta宣布与芯片巨头博通签署五年长约(至2029年),初始投入超1GW算力用于定制AI芯片,扎克伯格宣称目标是”为数十亿人提供个人超级智能”。Meta计划两年内推出四代自研MTIA芯片(300/400/450/500),成立超级智能实验室,由Scale AI创始人Alexandr Wang担任首席AI官。
阿里ATH事业群推出首款AI开发工具Meoo(秒悟)。产品集成千问、Kimi、GLM、MiniMax四大顶尖模型,内置阿里云数据库、存储等核心服务。用户无需编程基础,通过自然语言描述需求,最快1分钟可自动生成完整前后端代码,支持在阿里云一键部署上线。
李飞飞旗下World Labs开源3D高斯溅射渲染引擎Spark 2.0,支持通过WebGL2将超1亿splats的3D世界流式传输至桌面、手机及VR设备。引擎基于Three.js构建,采用连续型LoD高斯溅射树、渐进式流式加载和虚拟内存技术,实现超大规模场景在网页端的实时渲染,解决传统引擎仅支持单对象、缺乏动态动画及设备兼容性差等痛点。
百度文心正式开源文生图模型 ERNIE-Image,仅8B参数达到开源SOTA水平,在文字渲染、复杂指令遵循等能力上媲美Nano Banana等商业闭源模型。模型24GB显存即可运行,支持中英日韩多语言精准字形生成,已上线ComfyUI并推出GGUF量化方案,相关权重与推理代码已在Hugging Face开源。
MiniMax Agent 桌面端推出两项更新:Pocket 功能(Beta版)支持接入飞书、微信等主流 IM,用户可在聊天中直接指挥电脑执行任务并回传结果;Computer Use 功能让 Agent 可像人一样看屏幕、操作鼠标键盘,直接操控本地软件和系统设置。 稀宇科技
火山引擎正式上线 Seedance 2.0 API 服务,面向企业和个人开放视频生成能力。模型支持文、图、音、视频四模态输入,具备多模态内容参考与编辑能力,并建立肖像版权安全标准。目前已应用于影视文娱(如贾樟柯导演短片、春晚)、漫短剧、广告营销、AI工具、具身智能、自动驾驶等行业,助力创作效率提升。
米哈游创始人蔡浩宇的AI公司Anuttacon推出首个视频模型LPM 1.0。模型拥有170亿参数,支持实时生成能说话、唱歌、倾听并表达情绪的AI角色视频,可保持长时间身份一致性生成(支持22-48分钟视频)。技术上采用扩散Transformer架构与因果式流生成器,解决表现力、实时性与长视频一致性难题。
MiniMax推出Music 2.6音乐生成模型,新增Cover功能可基于现有歌曲改编风格与编曲,同时优化国风乐器时序演进、中低频表现及人声自然度。模型首包延迟降至20秒内,支持BPM、调性、段落结构等精准指令控制。同步开源三款Music Skill供Agent调用。 稀宇科技
MiniMax正式开源MiniMax M2.7,成为首个由AI深度参与自我迭代的模型,支持构建复杂Agent Harness及Agent Teams等能力,在软件工程与办公场景表现优异。开源首日与华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA及Together AI、Fireworks等国内外芯片与推理平台完成适配。 稀宇科技
即梦AI正式推出智能创作助手 Octo 小章鱼,以”Vibe Create”为核心理念,支持无流程束缚、无场景限定的自由创作体验。产品现已上线即梦官网开放内测申请,助力用户打破繁琐流程束缚,让创作回归纯粹自由的对话体验,随时随地轻松落地灵感。
阿里通义实验室推出 VimRAG 框架,用动态有向无环图(DAG)替代线性上下文拼接,通过分支试错机制、视觉能量分配策略及图引导优化(GGPO),实现跨文本、图像、视频的精准检索与关联推理。实验显示,模型在Qwen3-VL-8B模型上准确率达50.1%,显著优于传统方案。
AI 陪伴机器人公司萌友智能 ropet 完成 A 轮超千万美元融资,由北京市人工智能产业投资基金、峰瑞资本等投资。ropet 桌面 AI 宠物售价约 2000 元,累计出货近 2 万台,90 天留存率达 80-90%,核心用户日均互动超 2 小时。产品主打”生物性”体验,通过性格养成、轻互动建立情感连接。
Meta超级智能实验室(MSL)推出首个模型 Muse Spark ,在Artificial Analysis跑分从Llama 4的18分跃升至52分,仅次于GPT-5.4和Gemini 3.1 Pro,推动Meta股价暴涨近10%。模型为原生多模态推理架构,具备视觉思维链、多Agent编排及”沉思模式”,在CharXiv视觉理解和HealthBench健康问答领域表现突出。
Anthropic推出最强模型Claude Mythos预览版,性能碾压Opus 4.6。模型能发现数千个高危漏洞,攻击能力超绝大多数黑客。模型因安全风险过高,暂不向公众开放,仅通过”Project Glasswing”向Amazon、Apple、Google等巨头及40多家基础设施企业开放,用于防御性安全加固。
爱诗科技推出首个影视行业大模型PixVerse C1,支持文生、图生、参考生、首尾帧生成及智能分镜,最高支持15秒1080P视频。模型具备多宫格分镜一键成片、复杂场景多角色精准调度、角色跨镜头一致性保持等能力,在打斗场面、特效渲染等工业级视效上实现突破。 AIsphere
智谱开源旗舰模型 GLM-5.1 ,为全球最强开源模型,可独立持续工作超8小时,自主完成复杂工程任务。模型代码能力在SWE-Bench Pro等基准测试中位列全球第三、国产第一,超越GPT-5.4与Claude Opus 4.6。实测可8小时构建完整Linux桌面系统、优化向量数据库性能近7倍、24小时迭代优化ML负载实现3.6倍加速。
OpenBMB开源2B参数语音合成模型 VoxCPM2,采用无分词器扩散自回归架构,支持30种语言及中文方言,输出48kHz录音室级音质。模型首创Voice Design功能,可通过文字描述凭空创造声音;支持可控声音克隆与终极克隆模式。模型训练数据达236万小时,实时率低至0.13,采用Apache-2.0协议可商用。
面壁智能完成新一轮数亿元人民币融资,由深创投与汇川产投联合领投,获评2026年中国独角兽企业。公司专注端侧大模型,践行”密度法则”,MiniCPM系列下载量突破2400万,已在长安马自达、吉利银河等汽车及智能手机、智能家居领域规模化落地。
微软推出AI转录模型 MAI-Transcribe-1,在FLEURS基准测试中以3.9%字错误率宣称全球最精准,支持25种主要语言,在11种核心语言上登顶,性能超越Whisper-large-v3和Gemini 3.1 Flash。模型批量转录速度达Azure Fast服务2.5倍,定价每小时0.36美元,已在Microsoft Foundry平台开放使用,暂不支持实时转录和说话人分离功能。
字节跳动旗下扣子2.5正式上线,推出”Agent World”生态。新版本为 AI Agent 配备独立云电脑与云手机,支持 7×24 小时后台自主运行任务;集成视频创作、编程 CLI 及法律金融等行业专家技能;引入长期记忆系统,实现跨平台个性化协作。
前OpenAI科学家Andrej Karpathy推出 LLM Wiki 知识库构建方案,引发社区热议。LLM Wiki提出在Agent时代只需分享”想法文件”,由Claude、Codex等Agent自动构建个人知识库。系统分原始数据、Wiki、Schema三层,通过数据摄取、查询、质量检查形成闭环,支持知识持续积累与自我增强,适用于研究、阅读、企业知识管理等场景。
阿里通义实验室推出视频生成大模型Wan2.7-Video,支持全模态输入与”指令P视频”式编辑,可精准增删改视频元素、修改台词动作及机位。Wan2.7-Video支持最多5个主体特征一致性控制、故事板分镜、创意复刻与剧情续写。模型以”戏核”为驱动,实现智能剧情设计、40+种表情演绎及专业运镜。
小米推出 Xiaomi MiMo Token Plan 订阅方案,采用统一Credit点数计费,取消5小时token使用限额。Token Plan提供Lite(¥39/月)、Standard(¥99/月)、Pro(¥329/月)、Max(¥659/月)四档套餐。方案适配Claude Code、OpenClaw等主流AI开发工具,用户可按需选择不同档位。 MiMo