OpenAI推出Codex Chrome扩展插件
OpenAI 正式推出Codex Chrome扩展插件,支持 Codex 直接操作用户已登录的 Chrome 浏览器,包括读取打开标签页、页面内容及已登录网站信息,支持导航、点击、输入和截图等交互操作。用户可随时停止任务并在设置中管理访问权限,与新网站交互前需经确认。
OpenAI 正式推出Codex Chrome扩展插件,支持 Codex 直接操作用户已登录的 Chrome 浏览器,包括读取打开标签页、页面内容及已登录网站信息,支持导航、点击、输入和截图等交互操作。用户可随时停止任务并在设置中管理访问权限,与新网站交互前需经确认。
360集团旗下360 AI办公平台推出 AI PPT 工具 JJT,支持一句话生成、文档/大纲转 PPT、长内容总结汇报等创作模式,兼容 PDF、DOC、PPTX 等十余种格式上传。工具智能编辑能力涵盖一键换风格、精准配图、电影级转场、数据转图表及 AI 撰写演讲稿,支持 PPTX、HTML、PDF 多格式导出。
商汤推出新一代轻量化多模态智能体模型SenseNova 6.7 Flash-Lite,采用原生多模态架构实现”看、想、做”一体化,Token 消耗较纯文本智能体直降 60%,在多项权威智能体基准测试中获同级别 SOTA。同时同步推出 SenseNova Token Plan 限时免费,支持每 5 小时 1500 次调用。
OpenAI推出三款实时语音模型:GPT-Realtime-2具备GPT-5级推理与工具调用能力;GPT-Realtime-Translate支持70多种语言实时互译,每分钟成本仅约0.25元,较人类同传降低百倍;GPT-Realtime-Whisper实现低延迟语音转录。三模型均通过Realtime API开放,端到端处理保留语调情感。
据IDC报告,2025年中国企业级MaaS市场规模达1944万亿Tokens,同比增长16倍。硅基流动作为唯一创业公司跻身公有云MaaS前四,与火山引擎、阿里云、百度智能云同处第一梯队,验证”第三类MaaS”模式价值。
像素绽放PixelBloom完成C轮融资,由国科投资与商汤国香资本联合领投。公司从AI视觉表达平台全面跃迁为”AI办公解决方案Agent”,推出全球首个营销方案Agent”小方同学”,实现从”生成内容”到”交付结果”的质变。C端产品AiPPT已覆盖3000万用户,B端深度嵌入联想、华为等硬件生态及中信证券、安利中国等头部企业。
OpenAI 联合 AMD、博通、英特尔、微软、英伟达五大巨头推出多路径可靠连接(MRC)协议,通过 OCP 向全行业开源。MRC 基于 RoCE 扩展,采用多平面网络设计与自适应数据包喷淋技术,将数据包分散至数百条路径并行传输,避免网络拥塞与热点,使故障恢复从秒级缩短至微秒级。
无问芯穹宣布再获超7亿元融资,由杭州高新金投集团和惠远资本联合领投,持续稳居中国AI原生基础设施公司融资规模之首。公司首发”AI生产力公式”,定位Token经济枢纽,其Agentic MaaS平台日均Token调用量较去年底增长超20倍。
字节跳动开源全球首个25B级统一多模态模型Mamoda2.5,基于Qwen3-VL-8B架构,总参数250亿每次仅激活约3亿。模型实现了文生图、文生视频、视频编辑等全任务SOTA,推理速度比阿里Wan2.2快12倍、比美团LongCat Video快18倍,视频编辑延迟仅9.2秒。模型在多项视频编辑基准测试中排名第一,性能接近闭源Sora和Kling。
月之暗面(Kimi)完成约20亿美元D轮融资,投后估值突破200亿美元,创中国大模型最大单笔融资纪录。本轮由美团龙珠领投,中国移动等参投,累计融资超44亿美元居国内大模型创业公司之首。公司4月年度经常性收入超2亿美元,并发布开源旗舰模型Kimi K2.6。
据《金融时报》报道,国家集成电路产业投资基金(大基金)正洽谈领投 DeepSeek,本轮估值接近 450 亿美元(约 3067 亿元),较半月前 200 亿美元翻倍。创始人梁文锋或亲自跟投,腾讯、阿里亦在洽谈参投。大基金此前从未投资 AI 大模型公司,DeepSeek 为首家。
Anthropic 在 Code with Claude 开发者大会连放数招:Claude Code 调用限额翻倍至 10 小时并取消高峰削减,Claude Opus API 速率限制大幅放宽;托管智能体新增多智能体编排、目标结果与自主推演三大能力;Claude Code 更新远程控制、无闪烁渲染等十余项功能,同时与 SpaceX 达成算力合作。
讯飞智文Vision Agent模式,重构AI在PPT生产链条中的角色。Vision Agent模式通过意图洞察、大纲构建、内容精炼与五步设计引擎,实现从被动生成到主动协同的转变,解决模板化、配图脱节等痛点。系统可联网搜索资料、自主推演页数结构、生成可编辑内容卡片,最终输出专业排版。
OpenAI 宣布推出ChatGPT广告主平台,推出更灵活的购买方式。广告主现可通过电通、WPP 等代理商及 Adobe、Criteo 等技术伙伴购买广告,也可用美国地区测试中的自助 Ads Manager 直接投放。同时ChatGPT广告新增 CPC 竞价模式,上线转化 API 与像素追踪等测量工具。
字节跳动旗下AI助手豆包推出付费订阅服务,分为标准版68元/月、加强版200元/月、专业版500元/月三档,同时保留免费基础版供日常使用。目前付费功能仍在测试阶段。据量子位智库数据,4月豆包APP日活突破1.4亿,环比增长21%,月下载量约5000万,稳居国内AI助手市场首位,断层领先千问、元宝等竞品。
美国开发者 Hunter Bown 推出的DeepSeek-TUI 近日在 GitHub 爆火,获 2.3k Star,被誉为”DeepSeek 版 Claude Code”。工具用 Rust 编写、支持MIT 开源,是专为 DeepSeek V4 优化的终端编程 Agent,支持文件操作、Shell 执行、Git 管理、MCP 接入等功能。
OpenAI 正式推出GPT-5.5 Instant ,取代 GPT-5.3 Instant 成为 ChatGPT 默认模型。模型主打更准确、更简洁、更懂你:医疗/法律/金融领域幻觉率下降 52.5%,数学竞赛得分大幅提升;回复更简短自然,减少格式堆砌。Plus/Pro 用户可调用历史对话和文件实现个性化回答,所有消费者版本将新增「记忆来源」功能供用户查看与管理。
美国国防部发布声明,已与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软和亚马逊云(AWS)7 家领先 AI 公司达成协议,加速美军转型为「人工智能主导」的作战力量,增强其在所有战争领域的决策优势。标志着美军正式将顶尖民用 AI 技术深度纳入国防体系,推动 AI 在军事指挥、情报分析与作战决策中的规模化应用。
阿里通义开源大模型可解释性工具套件Qwen-Scope,工具基于稀疏自编码器(SAE)技术,覆盖 Qwen3 及 Qwen3.5 系列共 7 个模型。Qwen-Scope可在推理阶段定向控制输出结果,用少量种子数据完成数据分类与长尾样本合成,支持定位异常特征优化语言混用和重复生成问题。
DeepSeek 在 GitHub 发布多模态大模型并公开技术报告,提出「基于视觉原语的思考」框架,将点、边界框等空间标记提升为推理「基本思维单元」,使模型具备精确空间指代与推演能力,突破传统链式思维在复杂空间参照任务中的瓶颈。模型架构紧凑、视觉标记效率高,在计数与空间推理基准测试中可与 GPT-5.4、Claude-Sonnet-4.6 等前沿模型匹敌。
百度智能云推出一站式 AI 短剧创作平台Hogee,用户上传剧本或输入灵感后,AI 可自动生成角色、场景与分镜视频,覆盖从文本到成片的完整链路。平台支持 .txt/.docx/.pdf 等五种格式剧本上传,内置 OpenClaw 数字员工矩阵,提供社媒运营、营销素材、数据分析等能力。
OpenAI编程工具Codex推出宠物模式,用户可在桌面养一只「赛博桌宠」。输入 /pet 可唤醒电子宠物,支持实时显示 Codex 工作状态(运行中/等待输入/可复核)及进度提示,无需打开应用可查看工作进展。用户可通过 hatch-pet 技能自定义专属宠物形象。
xAI 推出 Grok 4.3 模型,定位为务实过渡版本。模型 API 价格降低 40%-60%,输出速度达 196 Tokens/s,支持 100 万 Token 长上下文,在代理任务和办公辅助能力上提升明显,更擅长生成文档、表格和演示文稿。模型在 Intelligence Index落后于 GPT-5.5和 Claude Opus 4.7,复杂推理、事实核查稳定性不足,且幻觉率有所上升。
宇树科技发布双臂人形机器人,起售价 2.69万元。产品具备15-31个总自由度,支持固定底座与移动底盘两种部署方式,配备高性能电机、减速器及传感器,搭载视觉双目模组与语音交互系统,头部算力达10TOPS。产品面向多场景落地,支持全栈开放的底层二次开发,定位为超快速部署的高性能双臂机器人解决方案。