News
阿里通义推出PrismAudio:声画同频,音效随行
阿里通义实验室推出视频生成音频框架 PrismAudio,专注环境音/音效合成。模型首创将强化学习与思维链结合,通过”分解式思维链”让模型先分析视频内容、时序、音质、空间位置再生成音频,引入四位”老师”(语义、时序、美学、空间)分别打分优化。
阿里通义实验室推出视频生成音频框架 PrismAudio,专注环境音/音效合成。模型首创将强化学习与思维链结合,通过”分解式思维链”让模型先分析视频内容、时序、音质、空间位置再生成音频,引入四位”老师”(语义、时序、美学、空间)分别打分优化。