ニュース2026年2月13日

谷歌宣布 Gemini 3 Deep Think 深度思考大模型升级

谷歌发布了Gemini 3 Deep Think模型的重大升级。新版模型在多项顶尖基准测试中刷新纪录，尤其在竞技编程平台Codeforces获得3455分的Elo评级，在全球排名第八，仅有7位顶尖程序员能在比赛中胜过它。模型在ARC-AGI-2推理基准、“人类的最后考试”（不使用工具）、物理及化学奥林匹克笔试等多个学术竞赛中取得了金牌级别的领先成绩。

戻る

すべてのカテゴリ