News
小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程
小米机器人事业部开源 Xiaomi-Robotics-0 真机后训练全流程。基于预训练基座,用20小时任务数据可完成耳机收纳等高精度操作。团队通过异步推理、动作前缀及自适应加权、Λ型掩码、随机遮蔽三重策略,破解模型”偷懒效应”,实现动作连贯与视觉灵敏的平衡。
小米机器人事业部开源 Xiaomi-Robotics-0 真机后训练全流程。基于预训练基座,用20小时任务数据可完成耳机收纳等高精度操作。团队通过异步推理、动作前缀及自适应加权、Λ型掩码、随机遮蔽三重策略,破解模型”偷懒效应”,实现动作连贯与视觉灵敏的平衡。