快讯2026年5月22日

美团开源数字人视频模型 LongCat-Video-Avatar 1.5

美团LongCat团队正式开源LongCat-Video-Avatar 1.5数字人视频模型，从开源SOTA迈向商业级应用。模型升级Whisper-large音频编码器，构建高质量多场景数据体系，引入逐帧级GRPO偏好对齐，在唇形同步、物理合理性、长视频稳定性及多人互动上全面跃升。模型采用DMD蒸馏实现8步生成，效率提升约15倍。

全部分类