商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5
商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。
商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。
月之暗面(Moonshot AI)开源全新AI代理开发框架Kosong,以“简化复杂性、释放创造力”为核心理念,为下一代智能体应用提供轻量且高可扩展的底层支持。框架通过统一LLM抽象层,封装标准化组件并搭载异步工具编排引擎,有效解决工具碎片化、接口不兼容等开发痛点。
字节跳动正式推出Doubao-Seed-Code,专为复杂编程任务优化。模型支持256k长上下文,兼容Anthropic API与主流IDE,性能仅次于Claude Sonnet 4.5,综合使用成本降低62.7%,并登顶SWE-Bench Verified榜单。
OpenAI推出GPT-5-Codex-Mini,是GPT-5-Codex的“经济高效型”版本。开发者可获得约4倍的使用额度。在SWE-bench Verified测试中,GPT-5-Codex-Mini得分71.3%。版本适用于轻量级工程任务或接近速率上限的情况。
百度文心5.0 Preview在LMArena全球文本竞技场排名中以1432分并列第二、国内第一,与OpenAI GPT‑4.5、Anthropic Claude等顶尖模型实力相当。实测显示其在创意写作、长文本理解及复杂指令遵循方面表现卓越,生成内容兼具诗意与逻辑严谨性。
堆友AI反应堆正式上线AI创作全能画布,堆友用户可免费体验。堆友AI集成文生图、图生图、智能滤镜、矢量编辑、字体设计、高清放大、智能抠图、局部重绘等功能,提供一站式AI设计解决方案,实现从灵感到交付的全流程自动化。
AI视频初创公司Video Rebirth宣布完成5000万美元种子轮融资,投资方包括启明创投、韩国游戏公司Actoz Soft等。公司由前腾讯杰出科学家刘威创立,致力于打造“视频原生的世界模型”,计划于12月发布1.0版本产品,目标是为专业创作者提供高保真、高可控性的视频生成平台,挑战现有市场格局。
美团发布AI编程工具CatPaw,支持Python、Java等主流语言,具备实时代码补全、问答生码、预览调试及项目级分析功能,目前兼容macOS,Windows版将上线。新用户注册获500次免费对话额度,旨在提升开发效率。
阶跃星辰团队开发的首个开源大语言模型驱动的音频编辑工具Step-Audio-EditX,专注于通过迭代方式控制音频的情感、说话风格和副语言特征。核心技术采用大规模合成数据训练,无需依赖嵌入式先验或辅助模块,能实现零样本文本转语音功能。
科大讯飞在2025全球1024开发者节上发布讯飞星火X1.5深度推理大模型。模型基于全国产算力,攻克MoE模型全链路训练效率,端到端性能达国际竞品93%以上。其语言理解、文本生成等能力对标国际主流大模型,数学能力国际领先,多语言能力支持130多种语言,性能达GPT-5的95%以上。
美团 LongCat 团队推出全模态大模型评测基准UNO-Bench,精准衡量模型在图像、音频、视频和文本等单模态与全模态任务上的表现。基准通过高质量、多样化的数据构建,首次验证全模态大模型的“组合定律”,揭示单模态与全模态能力的复杂关系。
月之暗面公司最新发布的具备通用Agent能力和深度推理能力的AI模型Kimi-k2 Thinking,支持多轮工具调用和256k上下文长度。模型通过新增的reasoning_content字段展示思考过程,能自主规划任务并调用外部工具完成复杂操作,例如自动拆解指令、分析数据并生成报告。
即梦AI上线无限画布,提供更自由的创作空间。新功能包括无限空间、Agent共创、多会话并行和多模态创作。用户可自由延展画布,轻松处理复杂项目;通过对话即创作,一句话生成灵感;一个项目可开启多个会话并行创作;支持图片和视频等多类型素材混合创作,实现一体化完成。
软银集团与OpenAI宣布成立合资公司“SB OAI Japan”,计划于2026年推出企业级AI解决方案“Crystal Intelligence”。该方案将结合OpenAI技术与定制化服务,助力日本企业提升生产力和管理效率。软银将率先部署该技术,积累经验后向其他企业推广。
美国生成式AI医疗独角兽Hippocratic AI完成1.26亿美元C轮融资,估值达35亿美元,较年初翻超一倍。此轮融资由谷歌母公司Alphabet旗下CapitalG等参投,资金将用于并购、产品开发和拓展国际业务等。
银河通用联合多所高校推出全球首个跨本体全域环视导航基座大模型 NavFoM。支持全场景、多任务、跨本体,可适配多种机器人形态,如机器狗、轮式人形等。NavFoM 通过创新的 TVI Tokens 和 BATS 策略,实现时空理解与高效算力利用,基于庞大训练数据体系,其在多个国际基准上达 SOTA 水平,可直接部署于真实机器人,无需任务微调。
360 推出的 FG-CLIP2 模型在图文跨模态领域取得重大突破。模型在八大类任务、29 项测试中全面超越 Google 与 Meta,成为目前最强的图文跨模态 VLM 模型。FG-CLIP2 能实现像素级的图像理解,精准识别细节,如毛发、斑点、色彩等,具备强大的中英文细粒度理解能力。
零一万物与开源中国联合发布“Open AgentKit平台”(OAK),打造Agent世界的“生态适配器”。OAK平台支持多种开源大模型,提供一站式解决方案,助力开发者实现“Agent开发自由”。平台四大核心模块,包括OAK Framework、Builder、Runtime和Studio,将逐步推出并邀请社区共建。 01AI
OpenAI与亚马逊宣布达成合作,OpenAI将在未来7年向亚马逊采购价值380亿美元(约合人民币2704.6亿元)的云计算服务。亚马逊云科技将为OpenAI提供亚马逊弹性计算云超级服务器,预计明年年底前部署完毕。
昆仑万维旗下AI视频创作平台SkyReels焕新上线。其Web端与移动端APP全面登陆,聚合全球顶尖AI多模态模型,提供图片生成、视频生成、数字人、音乐生成等多种创作方式。SkyReels V3模型更新,新增无限画布、数字人、模板功能、专家Agent、视频延长和风格化等能力,让专业创作更简单。
阿里 Qwen 团队宣布 Qwen3-Max Thinking 在 Qwen Chat 上线。模型是万亿参数的 MoE 模型,曾在 AIME25、HMMT25 数学测试中获满分。用户可在 Qwen Chat 中选择该模型并开启 Thinking 模式,免费体验。
美团 LongCat 团队正式发布并开源 LongCat-Flash-Omni 模型。模型基于 LongCat-Flash 系列架构,集成多模态感知与语音重建模块,总参数达 5600 亿,激活参数 270 亿,实现低延迟实时音视频交互。
北京智源人工智能研究院发布“悟界·Emu3.5”,开启多模态世界大模型新纪元。Emu3.5是340亿参数的稠密自回归Transformer模型,将图像、文本和视频等多模态数据统一建模,实现从“下一Token预测”到“下一状态预测”的能力跃迁。
OpenAI 发布了由 GPT-5 驱动的Agent——Aardvark,能自动在大规模代码库中发现并修复安全漏洞。Aardvark 可识别 92% 的已知与人工注入漏洞,还能定位复杂条件下的问题。通过监控代码提交、分析、验证漏洞并生成修复建议,与 OpenAI Codex 深度集成,为漏洞生成修复补丁。