快讯
美团开源数字人视频模型 LongCat-Video-Avatar 1.5
美团LongCat团队正式开源LongCat-Video-Avatar 1.5数字人视频模型,从开源SOTA迈向商业级应用。模型升级Whisper-large音频编码器,构建高质量多场景数据体系,引入逐帧级GRPO偏好对齐,在唇形同步、物理合理性、长视频稳定性及多人互动上全面跃升。模型采用DMD蒸馏实现8步生成,效率提升约15倍。
美团LongCat团队正式开源LongCat-Video-Avatar 1.5数字人视频模型,从开源SOTA迈向商业级应用。模型升级Whisper-large音频编码器,构建高质量多场景数据体系,引入逐帧级GRPO偏好对齐,在唇形同步、物理合理性、长视频稳定性及多人互动上全面跃升。模型采用DMD蒸馏实现8步生成,效率提升约15倍。