NewsMarch 31, 2026

阿里通义推出全模态大模型Qwen3.5-Omni

阿里通义推出Qwen3.5-Omni全模态大模型，在215项音频及音视频任务中取得SOTA，全面超越Gemini-3.1-Pro。模型采用Thinker-Talker分工架构与Hybrid-MoE技术，原生支持文本、图像、音频及音视频输入，具备细粒度音视频Caption生成能力。新增语义打断、音色克隆、语音控制等实时交互功能，支持256K超长上下文、113种语言识别及10小时音频处理。

Back

All Categories