快讯2026年5月21日

智谱推出下一代大模型推理网络架构 ZCube

智谱联合驭驯网络与清华大学推出ZCube组网架构，针对PD分离推理拥塞难题，取消Spine层，采用扁平化拓扑与单/多轨混合接入。GLM-5.1 coding实测显示，ZCube使交换机及光模块成本降33%，GPU推理吞吐提升15%，首Token时延TTFT P99降40.6%，为下一代超大规模推理集群提供高效底座。

全部分类