AI 资讯

快讯2026/7/15

小米开源多模态自回归具身生成基础模型 Xiaomi-Robotics-U0

小米开源 Xiaomi-Robotics-U0，380亿参数多模态自回归具身生成基础模型。模型是具身领域首个统一覆盖场景生成、轨迹迁移、交互视频及通用图像编辑四类任务的生成模型。模型通过五维解耦结构化控制实现精准可控生成，搭载 FlashAR+ 推理加速方案，效率提升近83倍。

快讯2026/7/15

高德推出通用世界模型工坊 ABot-World Studio

高德推出通用世界模型工坊 ABot-World Studio。产品首次将交互式视频生成与 3DGS 场景生成统一，用户输入文字或图片可创建可实时交互、任意分享的 AI 世界。ABot-World Studio 支持单张 5090 本地部署，单次连续推理可稳定运行超 1 小时，内置时空任意门实现跨场景跃迁。

快讯2026/7/15

支付宝与OPPO达成智能体跨端互联合作

支付宝与OPPO宣布达成智能体跨端互联合作，支付宝AI智能体「阿宝」正式接入OPPO AI助手「小布」。即日起，OPPO用户无需打开App，仅通过语音对话可让小布调用阿宝完成充话费、购票、查询公积金等近 200 项生活服务，实现一句话办事。

快讯2026/7/15

阿里通义开源音乐驱动人像舞蹈视频生成模型 Wan-Dancer

阿里通义万相开源音乐驱动人像舞蹈视频生成模型 Wan-Dancer。用户上传人物照片与音乐，可生成节拍精准、动作流畅的舞蹈视频。模型突破分钟级时序瓶颈，支持 15 秒至 3 分钟 720p 高清连贯输出，覆盖多种舞蹈风格。Wan-Dancer采用全局关键帧规划与局部时序细化的分层架构，有效解决长序列动作漂移难题。

快讯2026/7/14

LibTV 推出专业视频创作智能体 LibTV Agent

哩布哩布AI旗下LibTV正式推出LibTV Agent，定位全球首个专业视频创作智能体。产品围绕成片能力构建，推出高基线全能视频Agent、全球最大专业视频Skill Hub、双视图创作与Agent驱动剪辑四大核心能力。首批上线超百个导演级Video Skill，覆盖影视广告、短剧、自媒体等领域，3分钟以内视频成功率超80%。

快讯2026/7/14

Looki 完成数亿元 A1 轮融资

Looki（光智时空）完成数亿元A1轮融资，元生资本领投，BAI资本等老股东加注。公司定位个人智能可穿戴赛道，通过PIE主动式AI引擎2.0实现从”被动响应”到”主动预测”的升级，结合场景理解与长期记忆预判用户下一步需求。其首款可穿戴多模态AI硬件Looki L1出货量预计达10万台。 Park

快讯2026/7/14

爱诗科技推出首个实时视频游戏引擎 PixVerse Game

爱诗科技亮相联合国AI for Good全球峰会，联合创始人谢旭璋展示实时视频、世界模型与AI互动娱乐最新探索，发布首个实时视频游戏引擎PixVerse Game。引擎将完整游戏体验构建在实时互动视频流之上，创作者仅需定义规则与玩法，角色场景可实时生成。 AIsphere

快讯2026/7/14

阶跃星辰推出首款大模型原生智能体手机 STEPX Neo

阶跃星辰推出首款AI智能体手机STEPX Neo，搭载自研智能体原生操作系统Step AOS，内置系统级个人智能体Amoo。用户可通过自然语言指令实现跨应用自主调度。系统具备长期记忆、端云协同能力，支持”能端则端、需云则云”的灵活任务路由。首批生态合作伙伴包括支付宝、美团、高德、滴滴、京东、百度等主流应用。

快讯2026/7/14

爱诗科技完成 29.8 亿元 C 轮融资

爱诗科技宣布完成整体C轮融资，累计金额29.8亿元，C+轮由阿里巴巴领投，十余家国内外机构参投。资金将用于视频生成基础模型、实时世界模型研发及全球化产品增长。公司旗下PixVerse全球用户超1.5亿，年初推出全球首个支持1080P的通用实时世界模型PixVerse R1，并与芒果传媒、阿里巴巴等产业伙伴达成战略合作。 AIsphere

快讯2026/7/13

Agnes AI 推出新一代高性能文本模型 Agnes-2.5-Flash

Agnes AI推出新一代文本模型Agnes-2.5-Flash，Coding能力跻身全球第一梯队。同步上线Agnes Code桌面端，支持本地项目开发。实测中，模型3分钟定位修复隐藏Bug，可独立完成复杂网页应用，还能跨十几个文件联动改造大型项目。

快讯2026/7/13

OpenAI Codex、ChatGPT Work 暂时取消5小时使用限制

OpenAI Codex工程负责人Thibault Sottiaux宣布，Codex和ChatGPT Work已暂时取消Plus、Business及Pro订阅的5小时使用限制。同时，GPT-5.6 Sol模型将优化效率以减少用量消耗，使用用户在同等额度下能完成更多任务。

快讯2026/7/13

腾讯混元开源端到端 OCR 大模型 HyOCR-1.5

腾讯混元开源 HyOCR-1.5，业界首个训推全开源的端到端 OCR 专家大模型。模型引入 DFlash 投机解码，Transformers 下推理提速 6.37 倍，vLLM 下提速 2.14 倍；OmniDocBench v1.6 以 94.74 分登顶端到端第一。HyOCR-1.5 支持文档解析、古文字识别、图表解析、多页问答等 8 类任务，覆盖 331 种语言。

快讯2026/7/13

商汤开源理解生成统一视觉大模型 SenseNova-Vision

商汤正式开源日日新SenseNova-Vision理解生成统一视觉大模型，将检测、分割、深度预测、3D重建等经典视觉任务原生融入大模型体系。依托数据反哺与思维赋能的双向增益，模型在零样本泛化、超稠密分割及镜面反射理解等复杂场景展现强悍能力。

快讯2026/7/13

阶跃星辰推出端侧模型全家桶 Step Edge

阶跃星辰推出端侧模型全家桶 Step Edge，包含基础模型、Audio、GUI、Gen 四个方向，面向手机、汽车等终端场景。该系列支持 0.1 秒超低本地延迟，实现全模态隐私保护，采用原生端云协同架构。在 29 项核心评测中，Step Edge 覆盖文本视觉、音频、GUI、图像生成等方向均取得第一。

快讯2026/7/10

快手推出旗舰级 Agentic Coding 模型 KAT-Coder-Pro V2.5

快手KwaiKAT正式推出旗舰级Agentic Coding模型 KAT-Coder-Pro V2.5，在长程工程能力、通用Agentic能力及大规模强化学习三方面实现突破。通过AutoBuilder自动化流水线构建超10万个可运行仓库环境，采用多框架RL训练与多专家融合（MOPD）技术，模型在SWE-Bench Pro、PinchBench等评测中取得领先成绩。

快讯2026/7/10

蚂蚁灵波科推出行业首个具身原生世界动作模型 LingBot-VA 2.0

蚂蚁灵波科技推出行业首个具身原生世界动作模型 LingBot-VA 2.0。模型基于自回归架构从零预训练，采用语义视觉-动作分词器、因果预训练范式、MoE 架构及异步推理机制四大核心设计，实现单卡 150Hz 实时推理，让机器人具备边推演、边行动的通用控制能力。

快讯2026/7/10

OpenAI 推出 ChatGPT 智能体工作台 ChatGPT Work

OpenAI推出全新ChatGPT Work智能体。产品由Codex与GPT-5.6驱动，定位为可承担长时间、多步骤任务的智能体，支持跨网页、移动设备和桌面平台完成实际工作。用户只需通过单一指令描述目标，可让AI接管整个工作流程，利用应用和文件上下文创建文档、幻灯片、分析、网站和报告。

快讯2026/7/10

Meta 向开发者开放 Muse Spark AI 模型 API

Meta正式向开发者开放Muse Spark AI模型API，并发布升级版Muse Spark 1.1，标志着模型正式加入AI模型商业化竞争。模型是Meta迄今在编程与智能体任务上最强的模型，支持代码编写、工具调用及多模态理解。

快讯2026/7/10

OpenAI 正式推出最新一代大语言模型系列 GPT-5.6

OpenAI正式推出GPT-5.6系列模型，包含旗舰Sol、均衡Terra和性价比Luna三款，API价格梯度覆盖$1-$30/百万token。在Agents’ Last Exam评测中，Sol以53.6分超越Claude Fable 5达13.1分，编程智能体指数更创80分新高，且成本与耗时均大幅降低。

快讯2026/7/9

Mistral AI 推出具身智能导航模型 Robostral Navigate

Mistral AI推出具身智能导航模型Robostral Navigate，单RGB摄像头可让机器人在复杂环境自主导航。模型参数8B，在R2R-CE未知环境测试中成功率达76.6%，超越多传感器方案。模型采用指向预测目标位置策略，结合前缀缓存技术将训练周期从数月缩至数天，通过在线强化学习持续自我改进。

快讯2026/7/9

蚂蚁灵波开源面向具身智能的视频生成基础模型 LingBot-Video

蚂蚁灵波科技开源LingBot-Video，是全球首个基于MoE架构、面向具身智能的视频生成基础模型。模型总参数30B，推理时仅激活约3B，效率为同等Dense架构的3倍。团队构建了7万小时具身数据集，引入多维强化学习奖励系统，强化物理合理性与任务完成度。

快讯2026/7/9

阿里元境推出一站式AI大模型聚合平台 JellyToken

阿里元境正式推出JellyToken（智渲云）国内主流AI大模型一站式API聚合平台。用户仅需一个API Key可调用通义千问、DeepSeek、豆包、智谱、月之暗面等60余款国产模型，覆盖文本、图像、视频、音频四大场景。平台提供智能路由、负载均衡、Token级精准计费及正规发票等企业级能力，帮助开发者与企业降低多模型接入门槛与运维成本。

快讯2026/7/9

SpaceXAI推出新一代旗舰大语言模型 Grok 4.5

SpaceXAI推出旗舰模型Grok 4.5，采用1.5T参数MoE架构并与Cursor联合训练，性能对标Claude Opus。模型推理速度达80 TPS，编程能力在DeepSWE Bench上超越Opus 4.8，且Token效率提升4倍以上，支持50万上下文，下周将升级至百万，月底还将推出2T参数版本。

快讯2026/7/9

OpenAI 推出的新一代语音模型 GPT-Live

OpenAI推出全新语音交互模型GPT-Live，支持实时同声传译与全双工对话，用户可随时插话打断。模型支持自定义推理强度，并引入深度任务委托机制，前台保持流畅语音交互的同时，后台可并行处理联网搜索、复杂推理等任务。在对话中可实时弹出天气、赛事等可视化卡片。

1 2 3 4 5 6 7...35 →

AI 资讯

快讯2026/7/15

全部分类

AI 资讯

小米开源多模态自回归具身生成基础模型 Xiaomi-Robotics-U0

高德推出通用世界模型工坊 ABot-World Studio

支付宝与OPPO达成智能体跨端互联合作

阿里通义开源音乐驱动人像舞蹈视频生成模型 Wan-Dancer

LibTV 推出专业视频创作智能体 LibTV Agent

Looki 完成数亿元 A1 轮融资

爱诗科技推出首个实时视频游戏引擎 PixVerse Game

阶跃星辰推出首款大模型原生智能体手机 STEPX Neo

爱诗科技完成 29.8 亿元 C 轮融资

Agnes AI 推出新一代高性能文本模型 Agnes-2.5-Flash

OpenAI Codex、ChatGPT Work 暂时取消5小时使用限制

腾讯混元开源端到端 OCR 大模型 HyOCR-1.5

商汤开源理解生成统一视觉大模型 SenseNova-Vision

阶跃星辰推出端侧模型全家桶 Step Edge

快手推出旗舰级 Agentic Coding 模型 KAT-Coder-Pro V2.5

蚂蚁灵波科推出行业首个具身原生世界动作模型 LingBot-VA 2.0

OpenAI 推出 ChatGPT 智能体工作台 ChatGPT Work

Meta 向开发者开放 Muse Spark AI 模型 API

OpenAI 正式推出最新一代大语言模型系列 GPT-5.6

Mistral AI 推出具身智能导航模型 Robostral Navigate

蚂蚁灵波开源面向具身智能的视频生成基础模型 LingBot-Video

阿里元境推出一站式AI大模型聚合平台 JellyToken

SpaceXAI推出新一代旗舰大语言模型 Grok 4.5

OpenAI 推出的新一代语音模型 GPT-Live

AI 资讯

小米开源多模态自回归具身生成基础模型 Xiaomi-Robotics-U0

高德推出通用世界模型工坊 ABot-World Studio

支付宝与OPPO达成智能体跨端互联合作

阿里通义开源音乐驱动人像舞蹈视频生成模型 Wan-Dancer

LibTV 推出专业视频创作智能体 LibTV Agent

Looki 完成数亿元 A1 轮融资

爱诗科技推出首个实时视频游戏引擎 PixVerse Game

阶跃星辰推出首款大模型原生智能体手机 STEPX Neo

爱诗科技完成 29.8 亿元 C 轮融资

Agnes AI 推出新一代高性能文本模型 Agnes-2.5-Flash

OpenAI Codex、ChatGPT Work 暂时取消5小时使用限制

腾讯混元开源端到端 OCR 大模型 HyOCR-1.5

商汤开源理解生成统一视觉大模型 SenseNova-Vision

阶跃星辰推出端侧模型全家桶 Step Edge

快手推出旗舰级 Agentic Coding 模型 KAT-Coder-Pro V2.5

蚂蚁灵波科推出行业首个具身原生世界动作模型 LingBot-VA 2.0

OpenAI 推出 ChatGPT 智能体工作台 ChatGPT Work

Meta 向开发者开放 Muse Spark AI 模型 API

OpenAI 正式推出最新一代大语言模型系列 GPT-5.6

Mistral AI 推出具身智能导航模型 Robostral Navigate

蚂蚁灵波开源面向具身智能的视频生成基础模型 LingBot-Video

阿里元境推出一站式AI大模型聚合平台 JellyToken

SpaceXAI推出新一代旗舰大语言模型 Grok 4.5

OpenAI 推出的新一代语音模型 GPT-Live