project
MiniCPM5-1B - 面壁智能联合清华开源的端侧文本基座模型
MiniCPM5-1B 是面壁智能联合清华大学、OpenBMB 开源社区推出的 1B 参数端侧文本基座大模型,在 AA-Index 榜单上以 17.9 分超越所有 2B 以下模型,成为全球同...
MiniCPM5-1B是什么
MiniCPM5-1B 是面壁智能联合清华大学、OpenBMB 开源社区推出的 1B 参数端侧文本基座大模型,在 AA-Index 榜单上以 17.9 分超越所有 2B 以下模型,成为全球同级最强开源端侧文本大模型,INT4 量化后仅 0.5GB,可驱动手机、浏览器等终端上的AI 桌宠应用。
MiniCPM5-1B的主要功能
-
超强文本推理能力:在综合知识、数学推理、代码编程、逻辑推理、指令遵循等维度全面超越同尺寸模型。
-
端侧原生部署:支持 FP16/INT8/INT4 多精度推理,INT4 量化后权重仅 0.5GB,可在手机、平板、车机、浏览器中直接运行。
-
AI 桌宠应用:可驱动终端本地化的智能陪伴应用,无需联网即可交互。
-
工具调用与 Agentic 能力:支持工具调用协议,具备端侧 Agent 执行能力。
-
多框架兼容:支持 LlamaFactory、ms-swift 微调,以及 SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight 等推理框架。
MiniCPM5-1B的技术原理
-
分级数据治理体系:将预训练数据按质量划分为 L0-L4 五个等级,针对不同语料(高知识密度中英文网页、高质量数学合成数据)实施差异化清洗与筛选策略。
-
高质量数据合成:构建 Ultra-FineWeb-L3 等合成数据集,用精选高密度数据替代海量低质数据的训练范式。
-
AI 自研训练框架 ForgeTrain:Base Model 由全球首个完全由 AI 编写的生产级大模型预训练框架 ForgeTrain 完成,零人类程序员参与框架代码编写,在华为昇腾上预训练,在英伟达 H100 上训练速度比 Megatron 快 10%。
-
极致量化压缩:通过 INT4/Q4 量化技术将模型压缩至 0.5GB,实现端侧普适部署。
-
自研 CPU 推理框架 ArcLight:针对纯 CPU 环境深度优化,无显卡也能流畅运行。
如何使用MiniCPM5-1B
- 获取模型权重:访问 HuggingFace、ModelScope、GitCode 或魔乐社区下载 MiniCPM5-1B 模型文件。
- 选择推理框架:根据硬件环境选择 SGLang、vLLM、llama.cpp、Ollama 或面壁自研 ArcLight(CPU 专用)进行加载。
- 量化部署(可选):对模型进行 INT8 或 INT4 量化,INT4 版本仅需 0.5GB 存储可在手机或浏览器运行。
- 运行或微调:直接用预训练模型进行推理,或通过 LlamaFactory、ms-swift 进行领域微调后部署到目标设备。
- 开发端侧应用:基于 MiniCPM-Desk-Pet 等开源项目,快速构建本地 AI 桌宠或智能助手应用。
MiniCPM5-1B的核心优势
-
全球 2B 以下性能第一:AA-Index 得分 17.9,超越 Qwen3.5-2B(16.3 分)等参数翻倍模型。
-
智能密度定律验证者:以 1B 参数实现 3 个月前 2B 模型的性能,验证智能密度约每 3.5 个月翻一番。
-
零门槛部署:不挑硬件、不挑平台,浏览器打开即用,支持 Claude Code 等 AI 编程工具一键安装。
-
全面开源:模型权重、训练数据集(Ultra-FineWeb-L3)、部署方案全部开源。
MiniCPM5-1B的项目地址
- GitHub仓库:https://github.com/OpenBMB/MiniCPM
- HuggingFace模型库:https://huggingface.co/openbmb/MiniCPM5-1B
MiniCPM5-1B的同类竞品对比
| 对比维度 | MiniCPM5-1B | Qwen3.5-2B | LFM2.5-1.2B-Thinking |
|---|---|---|---|
| 参数规模 | 1B | 2B | 1.2B |
| AA-Index 得分 | 17.9(第一) | 16.3 | – |
| 综合知识 (MMLU-Pro) | 48.85 | 42.74 | 47.98 |
| 数学推理 (MATH-500) | 91.60 | 30.40 | 89.00 |
| 代码编程 (LCB-Pro) | 22.68 | 0.00 | 6.19 |
| INT4 量化体积 | 0.5GB | ~1GB+ | – |
| 训练框架 | AI 自研 ForgeTrain | 传统框架 | 传统框架 |
| 端侧部署 | 浏览器/手机/CPU 全支持 | 需一定算力 | 有限支持 |
| 开源程度 | 权重+数据集+框架全开源 | 权重开源 | 权重开源 |
MiniCPM5-1B的应用场景
-
端侧智能助手:在手机、平板等设备上离线运行,提供随时响应的AI对话与任务处理能力。
-
AI桌宠陪伴:驱动本地化桌宠应用,无需联网即可实现智能互动与情感陪伴。
-
边缘设备推理:部署于物联网终端和边缘盒子,满足低功耗场景下的文本理解与生成需求。
-
隐私敏感计算:数据本地处理不上传云端,适用于医疗、金融等对隐私合规要求严格的行业。
-
低算力代码辅助:在CPU或低显存设备上提供代码补全、逻辑推理等编程支持。