快讯
美团开源LongCat-Flash-Prover数学证明模型
美团开源LongCat-Flash-Prover 大模型,采用 5677 亿参数 MoE 架构,专注解决复杂数学证明问题。模型引入混合专家迭代框架,整合 Lean4 与 AST 多阶段严格验证,有效消除幻觉。在 MiniF2F-Test 上取得 97.1% 成绩,PutnamBench 解决 41.5% 问题,两项测试均刷新 SOTA 水平。
美团开源LongCat-Flash-Prover 大模型,采用 5677 亿参数 MoE 架构,专注解决复杂数学证明问题。模型引入混合专家迭代框架,整合 Lean4 与 AST 多阶段严格验证,有效消除幻觉。在 MiniF2F-Test 上取得 97.1% 成绩,PutnamBench 解决 41.5% 问题,两项测试均刷新 SOTA 水平。