project
Gemini 3.5 Flash - Google 推出的新一代 AI 大模型
Gemini 3.5 Flash 是 Google 推出的新一代AI大模型,以前沿智能+行动能力为核心定位。模型在 Terminal-Bench 2.1 编码基准得分 76.2%、GDPval-AA 代理任务 16...
Gemini 3.5 Flash是什么
Gemini 3.5 Flash 是 Google 推出的新一代AI大模型,以前沿智能+行动能力为核心定位。模型在 Terminal-Bench 2.1 编码基准得分 76.2%、GDPval-AA 代理任务 1656 Elo、MCP Atlas 达 83.6%,均超越 Gemini 3.1 Pro,输出速度达前沿模型 4 倍,成本不到一半,支持 100 万 Token 多模态上下文,已全球上线 Gemini App 与 Search AI Mode。
Gemini 3.5 Flash的主要功能
- 极速推理与生成:输出速度达 289 tokens/秒,经 Antigravity 内部联合优化后可达 12 倍提升,显著降低 Agent 多轮调用延迟。
- 顶级编码与 Agent 能力:在 Terminal-Bench 2.1(76.2%)、SWE-Bench Pro(55.1%)、MCP Atlas(83.6%)、Toolathlon(56.5%)等基准上全面超越 Gemini 3.1 Pro。
- 多模态长上下文理解:原生支持 100 万 Token 输入窗口,CharXiv Reasoning 得分 84.2%,MMMU-Pro 达 83.6%,可统一处理文本、图像、视频、音频及 PDF。
- 子代理协作编排:通过 Antigravity 2.0 部署并行子代理,官方演示 93 个 subagent 并行 12 小时内以不到 1000 美元完成完整操作系统开发。
- 动态推理级别控制:支持
thinking_level参数(标准/扩展),用户可按需切换思维深度,代码与工具调用默认使用低档位优化速度。
Gemini 3.5 Flash的技术原理
- 模型蒸馏与压缩架构:基于 Gemini 3.5 系列全新架构,通过先进蒸馏技术压缩模型体积,在保持接近 Pro 级能力的同时实现极低延迟。
- 动态推理预算分配:引入
thinking_level机制替代固定预算,根据任务类型自动分配计算资源,代码生成与工具调用默认使用 low 档位。 - 原生多模态统一编码:采用统一多模态编码器,将文本、图像、音视频嵌入同一语义空间,优化百万级长序列注意力计算。
- 前沿安全对齐框架:遵循 Frontier Safety Framework,强化网络与 CBRN 安全防护,通过可解释性工具检查内部推理,降低有害输出与误拒率。
如何使用Gemini 3.5 Flash
- 选择接入平台 通过 Gemini App、Google Search AI Mode、Google AI Studio、Antigravity 2.0 桌面应用访问模型。
- 更新 API 模型标识:将代码中的模型名称从旧版预览标识替换为正式版
gemini-3.5-flash。 - 配置推理级别:根据任务类型设置
thinking_level参数:代码与工具调用选 low,通用任务选 medium,复杂推理选 high。 - 移除采样参数覆盖:删除手动设置的 temperature、top_p、top_k 默认值,让模型使用内部优化配置。
- 注意功能迁移例外:若工作流依赖 Computer Use 浏览器控制功能,需继续用
gemini-3-flash-preview,3.5 Flash 暂不支持该功能。
Gemini 3.5 Flash的核心优势
- 速度领先:输出速度达 289 tokens/秒,是其他前沿模型的 4 倍,经 Antigravity 内部优化后可达 12 倍提升,Agent 多轮调用几乎无感知延迟。
- 成本优势:API 定价 $1.50/$9.00 每百万 Token(输入/输出),比 Claude Opus 4.7、GPT-5.5 等 frontier 竞品便宜一半以上,Google 估算头部 Cloud 客户将 80% frontier 工作负载迁移至 3.5 Flash 后每年可节省超 10 亿美元。
- Agent 性能突出:MCP Atlas 得分 83.6%、Toolathlon 56.5%,支持 93 个子代理并行协作,12 小时内以不到 1000 美元完成完整操作系统开发,专为复杂长周期代理任务优化。
- 超长上下文窗口:支持 100 万 Token 多模态输入,可一次性处理整本长篇小说、百页法律合同或长视频内容,长文档与视频分析无压力。
- 全平台生态覆盖:已接入 Gemini App、Search AI Mode、Antigravity 2.0、AI Studio、Android Studio 等 Google 全系产品,消费者、开发者、企业三端同步可用。
Gemini 3.5 Flash的项目地址
- 项目官网:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/#gemini-3-5-flash
Gemini 3.5 Flash的同类竞品对比
| 对比维度 | Gemini 3.5 Flash | Claude Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| 输出速度 | ~289 t/s(4x) | ~67 t/s | ~71 t/s | ~135 t/s |
| Terminal-Bench 2.1 | 76.2% | – | 78.2% | 70.3% |
| SWE-Bench Pro | 55.1% | – | 58.6% | 54.2% |
| MCP Atlas | 83.6%(领先) | 79.1% | 75.3% | 78.2% |
| GDPval-AA Elo | 1656 | 1753 | 1769 | 1314 |
| CharXiv Reasoning | 84.2% | 82.1% | 84.1% | 83.3% |
| 上下文窗口 | 1M Token | 200K | 128K | 1M |
Gemini 3.5 Flash的应用场景
- 实时 AI 编程助手:低延迟特性适合 IDE 自动补全、代码审查与交互式调试,Antigravity 2.0 已将其设为默认模型。
- 企业级 Agent 自动化:部署并行子代理处理多周工作流,如 Xero 自动管理 1099 税表供应商识别与信息收集。
- 金融文档智能审核:Macquarie Bank 用于推理 100 页以上复杂文档,加速客户入职与合规审核。
- 多模态发票与 OCR 处理:Ramp 结合多模态理解与历史模式推理,实现复杂发票的智能化识别与分类。