project
Hy-MT2 - 腾讯混元开源的新一代翻译大模型
Hy-MT2是腾讯混元开源的新一代翻译大模型,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译及 5 种民汉/方言翻译。
Hy-MT2是什么
Hy-MT2是腾讯混元开源的新一代翻译大模型,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译及 5 种民汉/方言翻译。其中 7B 和 30B-A3B 在多项评测中达到开源模型最佳效果,超越数十倍参数量模型;1.8B 轻量版经 1.25-bit 极端量化后仅 440MB,可部署在手机端本地推理。
Hy-MT2的主要功能
-
多语言互译:支持 33 种语言互译及 5 种民汉/方言翻译,覆盖全球主流语种与国内少数民族语言。
-
语音输入翻译:小程序内置语音输入功能,用户可通过说话直接完成跨语言翻译。
-
自定义翻译风格:支持设定术语、输出格式、精简程度等个性化指令,让翻译结果更符合预期。
-
端侧离线翻译:1.8B 模型经 1.25-bit 量化后仅 440MB,可下载至手机在无网络环境下本地推理。
-
单词解析与对比:提供单词释义解析及不同风格翻译结果对比,帮助用户理解词汇用法差异。
Hy-MT2的技术原理
-
多尺寸模型架构:提供 1.8B、7B 和 30B-A3B 三种规格,分别面向端侧轻量、云端高效及高精度翻译场景。
-
AngelSlim 极端量化:采用 1.25-bit 量化技术将 1.8B 模型压缩至 440MB,实现手机芯片上的低资源本地部署。
-
多场景联合训练:基于大规模多语言语料统一训练,在通用翻译、专业领域和真实业务场景中均衡优化模型能力。
-
指令遵循强化:针对翻译任务专门优化指令理解能力,使模型能准确执行风格变换、术语约束等复杂用户要求。
如何使用Hy-MT2
- 在线体验
-
打开小程序:微信搜索并打开腾讯 Hy 翻译小程序。
-
输入待译内容:选择源语言与目标语言,输入文字或点击语音按钮进行语音输入。
-
自定义翻译风格:点击个性化设置,自定义翻译风格、术语偏好或格式要求等指令。
-
查看翻译结果:查看翻译结果,可切换不同风格对比或点击单词查看详细解析。
-
- 离线使用
-
下载端侧模型:在小程序设置中下载 1.8B 端侧翻译模型到本地。
-
启用离线模式:等待模型下载完成后,即可在无网络或弱网络环境下使用离线翻译。
-
本地推理翻译:离线状态下输入文字,模型将在手机本地完成推理并输出翻译结果。
-
- 开源模型部署
-
获取开源模型:访问 GitHub 或 HuggingFace 获取 Hy-MT2 开源模型(1.8B / 7B / 30B-A3B)。
-
选择模型尺寸:根据硬件条件选择对应尺寸模型,1.8B 量化版仅需约 440MB 存储空间。
-
配置推理环境:按照开源文档配置推理环境,可在本地服务器或终端设备上部署使用。
-
Hy-MT2的核心优势
-
性能超越大模型:7B 和 30B-A3B 在 FLORES-200 等评测中超越 DeepSeek-V4-Pro 和 Kimi K2.6,30B-A3B 在真实场景和专业领域超过 Gemini 3.1 Pro。
-
端侧部署极致轻量:1.8B 模型量化后仅需 440MB 存储,可在苹果、高通、联发科等手机芯片上流畅运行,推理速度较上一代提升 1.5 倍。
-
翻译指令遵循领先:在 IFMTBench 指令遵循测试集上表现优异,能精准执行风格变换、指定术语翻译等复杂指令。
-
专业领域深度优化:针对金融、法律、医疗、教育等 8 大专业领域深度调优,GEMBA 评分接近或超越主流商业 API。
Hy-MT2的项目地址
- 项目官网:https://aistudio.tencent.com/llm/en?tabIndex=0
- GitHub仓库:https://github.com/Tencent-Hunyuan/Hy-MT2
- HuggingFace模型库:https://huggingface.co/collections/tencent/hy-mt2
Hy-MT2的同类竞品对比
| 对比维度 | Hy-MT2 | GPT-Realtime-Translate |
|---|---|---|
| 模型定位 | 开源文本翻译大模型,专注高质量多语言翻译 | 闭源实时语音翻译专用模型,专注低延迟语音互译 |
| 发布方 | 腾讯混元 | OpenAI |
| 参数规模 | 1.8B / 7B / 30B-A3B 三档可选 | 未公开 |
| 语言覆盖 | 33 种语言互译 + 5 种民汉/方言 | 70+ 输入语言 → 13 输出语言 |
| 输入形式 | 文本输入 + 语音输入(小程序) | 实时语音流(24 kHz PCM16) |
| 输出形式 | 文本翻译结果 + 单词解析 | 实时翻译语音 + 文本字幕 |
| 延迟表现 | 云端推理快,端侧本地推理 | 亚秒级延迟(约 0.8s) |
| 端侧部署 | 1.8B 量化后 440MB,可手机本地运行 | 不支持,仅云端 API |
| 离线使用 | 支持下载模型后无网络离线翻译 | 不支持,必须联网调用 API |
Hy-MT2的应用场景
-
日常跨语言沟通:模型适用旅游、社交等场景下的 33 种语言实时互译。
-
专业文档翻译:模型能满足金融、法律、医疗、教育等 8 大垂直领域的精准翻译需求。
-
离线翻译场景:在无网络或弱网络环境下,通过手机端侧模型实现本地离线翻译。
-
个性化内容创作:模型支持自定义翻译风格,辅助自媒体、学术写作等特定表达需求。
-
商务办公辅助:支持语音输入与文档翻译,提升跨国商务沟通与会议记录效率。