快讯
网易有道开源 TTS 语音合成引擎 Confucius4-TTS
网易有道开源TTS模型 Confucius4-TTS。模型实现三大突破:3秒零样本语音克隆、14种语言跨语种无口音合成,以及情感韵律迁移。模型底层采用语音编码器+大语言模型+流匹配生成的端到端架构,完整54G权重支持本地离线部署。
网易有道开源TTS模型 Confucius4-TTS。模型实现三大突破:3秒零样本语音克隆、14种语言跨语种无口音合成,以及情感韵律迁移。模型底层采用语音编码器+大语言模型+流匹配生成的端到端架构,完整54G权重支持本地离线部署。