智谱发布Infra新成果:不加一块GPU 算力多出15%
《科创板日报》21日讯,今日,智谱正式公布已在生产环境完成验证的新型推理集群组网架构 ZCube。该架构在不新增GPU、不更换服务器、不修改代码的前提下,实现集群推理吞吐提升 15%,首Token响应尾延迟(TTFT P99)下降 40.6%。交换机与光模块硬件成本减少三分之一。这意味着,未来大规模 AI 集群的组网采购中,对高端交换机的需求有望向“更少层级、更大端口密度”演进,对光模块的需求则将向更高速率集中。(记者 李明明)
20,974*特别声明:文章内容仅供参考,不构成投资建议。投资者据此操作风险自担。