project
GPT-5.4 mini - OpenAI推出的最强小型模型
GPT-5.4 mini是OpenAI推出的最强小型模型,专为高吞吐量、低延迟场景设计。模型比前代GPT-5 mini快2倍以上,在编程、推理、多模态理解和计算机使用等任务中性...
GPT-5.4 mini是什么
GPT-5.4 mini是OpenAI推出的最强小型模型,专为高吞吐量、低延迟场景设计。模型比前代GPT-5 mini快2倍以上,在编程、推理、多模态理解和计算机使用等任务中性能接近满血版GPT-5.4,价格仅为其1/3。GPT-5.4 mini支持400K上下文窗口,适用代码助手、子智能体、实时图像解析等场景,已上线API、Codex和ChatGPT,是构建多智能体系统的理想选择。
GPT-5.4 mini的主要功能
- 编程开发:支持定向代码编辑、代码库导航、前端生成及调试循环,在 SWE-Bench Pro 基准测试中达到 54.4% 的通过率,接近满血版 GPT-5.4 的水平。
- 多模态理解:模型能快速解析复杂用户界面截图并进行实时视觉推理,在 MMMUPro 基准测试中取得 78% 的成绩。
- 计算机使用:模型具备强大的屏幕内容解析和界面元素定位能力,在 OSWorld-Verified 基准测试中达到 72.1%,仅比 GPT-5.4 低 3 个百分点。
- 工具调用:支持函数调用、网页搜索、文件搜索及技能执行,在 MCP Atlas 工具调用基准测试中取得 57.7% 的成绩。
- 子智能体任务:可作为子智能体并行执行搜索代码库、审阅大文件、处理辅助文档等任务,在 Codex 中仅消耗 GPT-5.4 配额的 30%。
- 长上下文处理:支持 400K tokens 的超大上下文窗口,能处理长文档分析和复杂多轮对话。
GPT-5.4 mini的关键信息和使用要求
-
定位:OpenAI 最强小型模型,专为高吞吐量、低延迟场景设计
-
速度:比 GPT-5 mini 快 2 倍以上
-
性能:编程、推理、多模态、计算机使用等任务接近 GPT-5.4
-
上下文:400K tokens
-
定价:输入 $0.75/百万 tokens,输出 $4.50/百万 tokens(约为 GPT-5.4 的 1/3)
-
接入渠道:API、Codex、ChatGPT
GPT-5.4 mini的核心优势
-
速度与性能兼得:比 GPT-5 mini 快 2 倍以上,同时在编程、推理、多模态等任务中性能接近满血版 GPT-5.4。
-
极致性价比:输出价格仅为 GPT-5.4 的 1/3,在 Codex 中消耗配额仅 30%,大幅降低开发成本。
-
多模态能力强:快速解析复杂 UI 截图,在 OSWorld-Verified 计算机使用基准测试中达到 72.1%,接近 GPT-5.4 的 75%。
-
超大上下文:支持 400K tokens 上下文窗口,可处理长文档和复杂多轮对话。
-
子智能体优化:专为并行任务执行设计,适合作为子智能体处理搜索、审阅等辅助任务,构建大模型决策+小模型执行的组合架构。
-
全平台覆盖:已上线 API、Codex、ChatGPT,支持文本/图像输入、工具调用、函数调用、网页搜索、文件搜索、计算机使用等完整功能。
如何使用GPT-5.4 mini
- API 使用:通过 OpenAI API 调用,支持文本与图像输入、工具使用、函数调用、网页搜索、文件搜索、计算机使用及技能调用等功能,上下文窗口达 400K tokens。
- Codex 使用:模型已在 Codex 应用、CLI、IDE 扩展及网页端全面上线。默认消耗 GPT-5.4 配额的 30%,可配置为子智能体默认模型,用于处理搜索代码库、审阅大文件、处理辅助文档等低推理强度任务。
- ChatGPT 使用:免费版与 Go 用户通过 “+” 菜单的 “Thinking” 功能直接访问。其他用户则作为 GPT-5.4 Thinking 的速率限制备选方案自动切换使用。
GPT-5.4 mini的同类竞品对比
| 对比维度 | GPT-5.4 mini (OpenAI) | Claude Haiku 4.5 (Anthropic) | Gemini 3 Flash (Google) |
|---|---|---|---|
| 定位 | 最强小型模型 | 轻量快速模型 | 最快最便宜的模型 |
| 速度 | 比 GPT-5 mini 快 2 倍+ | 中等 | 最快 |
| 上下文窗口 | 400K tokens | 200K tokens | 100万 tokens |
| 输出价格 | $4.50/百万 tokens | 约 $2.50/百万 tokens | 约 $0.60/百万 tokens |
| SWE-Bench Pro (编程) | 54.4% | 未公开 | 未公开 |
| Terminal-Bench 2.0 | 60.0% | 41.0% | 47.6% |
| OSWorld-Verified (计算机使用) | 72.1% | 50.7% | 未公开 |
| MCP Atlas (工具调用) | 57.7% | 34.6% | 57.4% |
| GPQA Diamond (推理) | 88.0% | 73.0% | 90.4% |
| 多模态能力 | 强 | 中等 | 强 |
GPT-5.4 mini的应用场景
- 内容分类:对海量文本、图像进行快速标签分类和情感分析,适用社交媒体内容审核、新闻主题归类、用户评论筛选。
- 数据提取:从非结构化文档、网页、表格中批量提取结构化数据,适用简历解析、发票信息抓取、合同关键字段识别。
- 排序筛选:对搜索结果、推荐内容、候选列表进行相关性评分和优先级排序,适用电商商品推荐、招聘简历筛选、信息流个性化。
- 轻量子智能体:作为子智能体执行验证、格式化、简单查询等边缘任务,与 GPT-5.4/mini 配合构建低成本多智能体系统。