快讯
代号为 Elephant Alpha 的匿名模型正式揭晓:Ling-2.6-flash
蚂蚁百灵大模型团队推出Ling-2.6-flash,总参数 104B、激活参数 7.4B,采用 MLA+Lightning Linear 混合注意力与稀疏 MoE 架构。模型在4 卡 H20 环境下推理速度达 340 tokens/s,评测 Token 消耗仅同类约 1/10,在 BFCL-V4、SWE-bench Verified 等 Agent 基准达 SOTA。
蚂蚁百灵大模型团队推出Ling-2.6-flash,总参数 104B、激活参数 7.4B,采用 MLA+Lightning Linear 混合注意力与稀疏 MoE 架构。模型在4 卡 H20 环境下推理速度达 340 tokens/s,评测 Token 消耗仅同类约 1/10,在 BFCL-V4、SWE-bench Verified 等 Agent 基准达 SOTA。