News
阿里通义推出全模态大模型Qwen3.5-Omni
阿里通义推出Qwen3.5-Omni全模态大模型,在215项音频及音视频任务中取得SOTA,全面超越Gemini-3.1-Pro。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,原生支持文本、图像、音频及音视频输入,具备细粒度音视频Caption生成能力。新增语义打断、音色克隆、语音控制等实时交互功能,支持256K超长上下文、113种语言识别及10小时音频处理。
阿里通义推出Qwen3.5-Omni全模态大模型,在215项音频及音视频任务中取得SOTA,全面超越Gemini-3.1-Pro。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,原生支持文本、图像、音频及音视频输入,具备细粒度音视频Caption生成能力。新增语义打断、音色克隆、语音控制等实时交互功能,支持256K超长上下文、113种语言识别及10小时音频处理。