快讯
智谱推出下一代大模型推理网络架构 ZCube
智谱联合驭驯网络与清华大学推出ZCube组网架构,针对PD分离推理拥塞难题,取消Spine层,采用扁平化拓扑与单/多轨混合接入。GLM-5.1 coding实测显示,ZCube使交换机及光模块成本降33%,GPU推理吞吐提升15%,首Token时延TTFT P99降40.6%,为下一代超大规模推理集群提供高效底座。
智谱联合驭驯网络与清华大学推出ZCube组网架构,针对PD分离推理拥塞难题,取消Spine层,采用扁平化拓扑与单/多轨混合接入。GLM-5.1 coding实测显示,ZCube使交换机及光模块成本降33%,GPU推理吞吐提升15%,首Token时延TTFT P99降40.6%,为下一代超大规模推理集群提供高效底座。