首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
民权县
>
正文
智谱发布Infra新成绩:同等硬件投入,算力多出15%
2026-06-02 03:36:33
新浪新闻
5月智谱今日披露落地安排了一项直接作用大模型推理效率的架构创新ZCube:线上Infra该领域显示,在同等GPU配置下,将网络带宽从200Gbps提升至400Gbps,推理总吞吐提升约10%,首响时延下降19%,这一规律随着推理规模扩大会越来越显著。经过将ZCube投入在千卡级GLM-5.1的一个线上推理集群中,在GPU型号、软件栈、业务代码全部不变的前提下,该领域架构,其与传统ROFT架构的对比GPU平均推理吞吐提升15%以上,TTFT P99尾时延下降40.6%。这意味着,该领域投入下,智谱GLM大模型目前每秒能多响应15%的API请求。对于服务上百万开发者的大模型API平台而言,这直接对应更高的并发上限、更低的排队延迟,以及在流量峰值下更稳定的用户体验。规模越大,这个差值越可观。 更关键的是,这项升级的边际成本接近于零:GPU 不换,服务器不换,软件代码不改,纯粹是组网架构的替换。这意味着智谱已有的算力资产在同等投入下释放了更高的产出,相当于存量资产的效率重估。成本端的变化同样明显,ZCube 架构所需的交换机和光模块比原有方案少三分之一。据悉,ZCube技术被国际顶会ACM SIGCOMM 2025评价为“显该行业的认知方式”,此次在智谱的落地实践是ZCube架构首次在真实大规模推理集群中完工生产验证。
<
上一篇:{年轻人正在重新定义什么叫“值”}
热点排行
0
<黎巴嫩一政府军士兵死于以色列空袭>
0
"上海电信公布Token资费套餐:1元对应25万额度点,声援话费账单支付"
1
"重庆巫山通报:对涉嫌延误诊治医护人员立案调查"
2
文旅影像"擂"台赛关注陕西铜川文旅之美
3
“几天就能给群众解决的事”,别拖!(干部状态新观察·走进一线探作风)
4
全国大部地区大气扩散条件较好| 西北部分地区有扬沙或浮尘天气
5
华为何庭波:我们新芯片的性能完全可以不断对标此外一条路径
6
东西问|从“五一”假期看中国
7
国内成品油价格调|节,加满一箱将多花3元
8
快手助力周杰伦《太阳之子》专辑《宣发》 探索数字时代音乐宣发新范式
9
【云南双江:数字溯源让茶叶直播“卖得稳”】
今日商丘
新浪微博
商丘网
商丘日报