Gemini 3正式发布:谷歌推出最强AI模型
谷歌正式发布新一代多模态大模型Gemini 3,在多项基准测试中表现卓越,以1501 Elo得分位列LMArena竞技场第一。模型具备原生多模态理解、高级推理及Agent编程能力,支持100万token上下文窗口,在学术推理、数学、代码开发等任务上显著领先前代及竞品。
谷歌正式发布新一代多模态大模型Gemini 3,在多项基准测试中表现卓越,以1501 Elo得分位列LMArena竞技场第一。模型具备原生多模态理解、高级推理及Agent编程能力,支持100万token上下文窗口,在学术推理、数学、代码开发等任务上显著领先前代及竞品。
谷歌DeepMind发布的最新AI天气预报模型WeatherNext 2,运算速度比前代快8倍,能生成1小时分辨率的精准预测。模型通过功能生成网络(FGN)技术,在1分钟内即可完成传统超算需数小时的全球15天天气模拟,可输出数百种可能的天气情景。
蚂蚁集团正式上线全模态通用AI助手灵光APP,以结构化思维生成逻辑清晰、可视化的内容,如动态3D模型、可交互地图等,让知识呈现更生动;用户通过自然语言描述,30秒内即可生成个性化AI应用,搭载AGI相机技术,通过实时视频流解析物理世界,支持文生图/视频、图生图/视频创作,能对物体、场景进行识别与知识讲解。
马斯克旗下xAI公司发布的最新AI对话模型Grok 4.1,主打情感智能与实用性能的突破。模型在LMArena排行榜以1483分登顶,比第二名高出31分,并首创”思考模式”与”即时模式”双轨设计——即使不启动深度推理,基础版本仍能超越其他模型的完整配置。
字节跳动Seed团队发布Lumine,是首个能在3D开放世界中实时完成小时级复杂任务的通用AI智能体。基于视觉语言模型,通过端到端架构统一感知、推理与行动,仅靠屏幕图像和键盘鼠标操作,无需游戏内部API。
JetBrains联合Linux基金会推出DPAI Arena,是全球首个开源、多语言、多框架的AI编程智能体基准测试平台。客观衡量AI工具在真实软件开发任务中的效率提升,填补行业空白,支持补丁修复、代码审查等多样化工作流的可复现评估。
陈天桥领导的盛大团队推出的开源长期记忆操作系统EverMemOS,专为AI智能体设计,解决大语言模型因固定上下文窗口导致的记忆断裂问题。该系统基于人类大脑记忆机制,采用四层架构(代理层、记忆层、索引层、接口层),在LoCoMo和LongMemEval-S评测中以92.3%和82%的高分超越行业标杆。
阿里巴巴正式推出千问APP,基于Qwen最强模型打造,全面对标ChatGPT。APP依托Qwen开源生态,全球下载量超6亿次,支持119种语言,具备智能调度多应用、多模态交互等能力,成为全球用户的AI生产力工具。
美国生成式AI创企Gamma完成6800万美元B轮融资,估值达21亿美元。Gamma创立于2020年,是一个生成式AI设计平台,可快速创建演示文稿、文档和社交媒体帖子,支持22种AI图像模型和60多种语言。
OpenAI宣布在韩国、新西兰等部分地区试点ChatGPT群聊功能。功能基于GPT-5.1模型,支持用户与ChatGPT共同协作,可邀请亲友或同事进入共享空间,用于策划方案、决策讨论或头脑风暴。
AI编程神器Cursor(母公司Anysphere)完成23亿美元D轮融资,投后估值达293亿美元,成为全球首家估值超2000亿元人民币的AI编程创企。此轮融资由Accel和Coatue领投,英伟达、谷歌等跟投。过去一年,Anysphere估值增长超10倍,年化收入突破10亿美元。
具身智能公司Dexmal原力灵机宣布完成数亿元A+轮融资,阿里巴巴为独家投资方。此前其A轮融资由蔚来资本领投,两轮融资金额近10亿元。资金将用于智能机器人软硬件技术研发与落地。Dexmal专注于具身智能技术研发,自主研发的多模态具身智能大模型MMLA可实现跨场景智能泛化。
全球权威 AI 评测平台 LMArena 更新 Code Arena (编程与代码生成) 专项榜单,智谱 GLM-4.6 与 Anthropic Claude、OpenAI GPT-5 等顶尖模型一同位列全球榜首。
“AI教母”李飞飞创立的World Labs公司正式推出首款商用多模态世界模型产品Marble,用户可通过文本、图像、视频或3D布局生成高保真、可编辑的3D虚拟世界,支持导出为高斯溅射、网格或视频格式。
字节旗下TRAE团队正式发布TRAE SOLO正式版。版本定位为“响应式编程智能体”,支持复杂项目开发,新增内置智能体SOLO CODER与SOLO BUILDER,具备上下文压缩、多任务并行、可视化工具调用等功能,可高效应对从0到1的项目搭建及从1到100的迭代优化,现面向全球用户开放,限时免费体验。
百度在世界大会上正式发布文心大模型5.0。模型参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多模态输入输出,在多模态理解、创意写作、指令遵循等方面表现突出,综合能力达全球领先水平。
OpenAI发布的AI升级版本GPT-5.1,重点优化了对话体验而非单纯性能指标。新版本包含Instant和Thinking两大模型,前者更注重人性化交流(如自适应思考、八种风格预设),后者强化专业推理能力(简化术语表达)。相比前代,GPT-5.1在情感互动、指令理解上显著改善。
AI设计平台Lovart正式上线“Edit Elements 元素拆分”功能,用户上传成品海报后,AI可自动拆解为文字、主体、背景等独立可编辑图层,支持修改文本、替换元素及实时预览
Chat2DB 团队创始人姬朋飞及其团队正式发布主打“Database-First”(数据库优先)的全栈应用构建平台 ZOER.AI ,专注于解决传统 AI 编程工具在后端能力上的短板,通过智能设计数据库结构、自动生成安全的后端逻辑和前端界面,实现从数据层到底层服务的全流程自动化。
极佳视界完成亿元级A1轮融资,由华为哈勃和华控基金联合投资,这是其在两个月内完成的第三轮融资。极佳视界的技术解决了物理AI领域数据稀缺和仿真误差等问题,其CEO预测“物理世界ChatGPT时刻”将在2-3年内到来。
OiiOii是革命性的动画创作工具,作为全球首个动画创作Agent系统,内置艺术总监、编剧、分镜师等7大智能体,用户只需输入创意或上传参考图,即可一键生成剧本、分镜、角色设计及完整动画短片,支持161种风格,涵盖剧情短片、MV、漫画转视频等多种场景,大幅降低动画创作门槛,现处于内测阶段,限时免费使用。
腾讯微信团队推出的KaLM-Embedding-Gemma3-12B-2511模型,在MTEB多语言通用Embedding模型权威评测中综合成绩位列全球第一。模型参数量达120亿,支持3840至64等多种向量维度,具备卓越的跨语言语义理解与检索能力,在多语言语义对齐、数据质量优化及训练策略创新方面表现突出,为多语言应用场景提供了强大的语义基础支持。
百度旗下小度AI眼镜Pro正式开售,售价2299元,是继阿里巴巴夸克AI眼镜S1后,国内第二家正式开售AI眼镜的互联网大厂,小度AI眼镜Pro是一款AI拍摄眼镜,与小米AI眼镜类型相同,并非当下更为“完全体”版本的AI+AR眼镜,融合多模态AI大模型,产品功能包括拍照、听歌识曲、智能匹配歌单、AI翻译、AI识物、AI备忘、AI录音等。
Meta AI团队推出Omnilingual ASR,是全球首个支持超1600种语言的自动语音识别系统,其中500种语言首次获得AI语音识别支持。系统通过大规模预训练模型和上下文学习技术,仅需少量音频-文本样本即可扩展新语言,字符错误率低于10%的语言占比达78%。