登顶!GLM-4.6获LMArena代码榜全球并列第一
全球权威 AI 评测平台 LMArena 更新 Code Arena (编程与代码生成) 专项榜单,智谱 GLM-4.6 与 Anthropic Claude、OpenAI GPT-5 等顶尖模型一同位列全球榜首。
全球权威 AI 评测平台 LMArena 更新 Code Arena (编程与代码生成) 专项榜单,智谱 GLM-4.6 与 Anthropic Claude、OpenAI GPT-5 等顶尖模型一同位列全球榜首。
“AI教母”李飞飞创立的World Labs公司正式推出首款商用多模态世界模型产品Marble,用户可通过文本、图像、视频或3D布局生成高保真、可编辑的3D虚拟世界,支持导出为高斯溅射、网格或视频格式。
字节旗下TRAE团队正式发布TRAE SOLO正式版。版本定位为“响应式编程智能体”,支持复杂项目开发,新增内置智能体SOLO CODER与SOLO BUILDER,具备上下文压缩、多任务并行、可视化工具调用等功能,可高效应对从0到1的项目搭建及从1到100的迭代优化,现面向全球用户开放,限时免费体验。
百度在世界大会上正式发布文心大模型5.0。模型参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多模态输入输出,在多模态理解、创意写作、指令遵循等方面表现突出,综合能力达全球领先水平。
OpenAI发布的AI升级版本GPT-5.1,重点优化了对话体验而非单纯性能指标。新版本包含Instant和Thinking两大模型,前者更注重人性化交流(如自适应思考、八种风格预设),后者强化专业推理能力(简化术语表达)。相比前代,GPT-5.1在情感互动、指令理解上显著改善。
AI设计平台Lovart正式上线“Edit Elements 元素拆分”功能,用户上传成品海报后,AI可自动拆解为文字、主体、背景等独立可编辑图层,支持修改文本、替换元素及实时预览
Chat2DB 团队创始人姬朋飞及其团队正式发布主打“Database-First”(数据库优先)的全栈应用构建平台 ZOER.AI ,专注于解决传统 AI 编程工具在后端能力上的短板,通过智能设计数据库结构、自动生成安全的后端逻辑和前端界面,实现从数据层到底层服务的全流程自动化。
极佳视界完成亿元级A1轮融资,由华为哈勃和华控基金联合投资,这是其在两个月内完成的第三轮融资。极佳视界的技术解决了物理AI领域数据稀缺和仿真误差等问题,其CEO预测“物理世界ChatGPT时刻”将在2-3年内到来。
OiiOii是革命性的动画创作工具,作为全球首个动画创作Agent系统,内置艺术总监、编剧、分镜师等7大智能体,用户只需输入创意或上传参考图,即可一键生成剧本、分镜、角色设计及完整动画短片,支持161种风格,涵盖剧情短片、MV、漫画转视频等多种场景,大幅降低动画创作门槛,现处于内测阶段,限时免费使用。
腾讯微信团队推出的KaLM-Embedding-Gemma3-12B-2511模型,在MTEB多语言通用Embedding模型权威评测中综合成绩位列全球第一。模型参数量达120亿,支持3840至64等多种向量维度,具备卓越的跨语言语义理解与检索能力,在多语言语义对齐、数据质量优化及训练策略创新方面表现突出,为多语言应用场景提供了强大的语义基础支持。
百度旗下小度AI眼镜Pro正式开售,售价2299元,是继阿里巴巴夸克AI眼镜S1后,国内第二家正式开售AI眼镜的互联网大厂,小度AI眼镜Pro是一款AI拍摄眼镜,与小米AI眼镜类型相同,并非当下更为“完全体”版本的AI+AR眼镜,融合多模态AI大模型,产品功能包括拍照、听歌识曲、智能匹配歌单、AI翻译、AI识物、AI备忘、AI录音等。
Meta AI团队推出Omnilingual ASR,是全球首个支持超1600种语言的自动语音识别系统,其中500种语言首次获得AI语音识别支持。系统通过大规模预训练模型和上下文学习技术,仅需少量音频-文本样本即可扩展新语言,字符错误率低于10%的语言占比达78%。
商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。
月之暗面(Moonshot AI)开源全新AI代理开发框架Kosong,以“简化复杂性、释放创造力”为核心理念,为下一代智能体应用提供轻量且高可扩展的底层支持。框架通过统一LLM抽象层,封装标准化组件并搭载异步工具编排引擎,有效解决工具碎片化、接口不兼容等开发痛点。
字节跳动正式推出Doubao-Seed-Code,专为复杂编程任务优化。模型支持256k长上下文,兼容Anthropic API与主流IDE,性能仅次于Claude Sonnet 4.5,综合使用成本降低62.7%,并登顶SWE-Bench Verified榜单。
OpenAI推出GPT-5-Codex-Mini,是GPT-5-Codex的“经济高效型”版本。开发者可获得约4倍的使用额度。在SWE-bench Verified测试中,GPT-5-Codex-Mini得分71.3%。版本适用于轻量级工程任务或接近速率上限的情况。
百度文心5.0 Preview在LMArena全球文本竞技场排名中以1432分并列第二、国内第一,与OpenAI GPT‑4.5、Anthropic Claude等顶尖模型实力相当。实测显示其在创意写作、长文本理解及复杂指令遵循方面表现卓越,生成内容兼具诗意与逻辑严谨性。
堆友AI反应堆正式上线AI创作全能画布,堆友用户可免费体验。堆友AI集成文生图、图生图、智能滤镜、矢量编辑、字体设计、高清放大、智能抠图、局部重绘等功能,提供一站式AI设计解决方案,实现从灵感到交付的全流程自动化。
AI视频初创公司Video Rebirth宣布完成5000万美元种子轮融资,投资方包括启明创投、韩国游戏公司Actoz Soft等。公司由前腾讯杰出科学家刘威创立,致力于打造“视频原生的世界模型”,计划于12月发布1.0版本产品,目标是为专业创作者提供高保真、高可控性的视频生成平台,挑战现有市场格局。
美团发布AI编程工具CatPaw,支持Python、Java等主流语言,具备实时代码补全、问答生码、预览调试及项目级分析功能,目前兼容macOS,Windows版将上线。新用户注册获500次免费对话额度,旨在提升开发效率。
阶跃星辰团队开发的首个开源大语言模型驱动的音频编辑工具Step-Audio-EditX,专注于通过迭代方式控制音频的情感、说话风格和副语言特征。核心技术采用大规模合成数据训练,无需依赖嵌入式先验或辅助模块,能实现零样本文本转语音功能。
科大讯飞在2025全球1024开发者节上发布讯飞星火X1.5深度推理大模型。模型基于全国产算力,攻克MoE模型全链路训练效率,端到端性能达国际竞品93%以上。其语言理解、文本生成等能力对标国际主流大模型,数学能力国际领先,多语言能力支持130多种语言,性能达GPT-5的95%以上。
美团 LongCat 团队推出全模态大模型评测基准UNO-Bench,精准衡量模型在图像、音频、视频和文本等单模态与全模态任务上的表现。基准通过高质量、多样化的数据构建,首次验证全模态大模型的“组合定律”,揭示单模态与全模态能力的复杂关系。
月之暗面公司最新发布的具备通用Agent能力和深度推理能力的AI模型Kimi-k2 Thinking,支持多轮工具调用和256k上下文长度。模型通过新增的reasoning_content字段展示思考过程,能自主规划任务并调用外部工具完成复杂操作,例如自动拆解指令、分析数据并生成报告。