去年英伟达为了适应美国政府对尖端人工智能(AI)芯片新的出口管制,推出中国特供版的H20计算卡,基于Hopper架构打造,取代了以往销售的A800和H800。虽然性能有不小的下降,但是可以满足部分客户的使用需求,而英伟达也获得了更多的收益。至于H20和全球范围内热卖的H100之间规格有多大差异,具体性能差多少,英伟达并没有透露。
据Wccftech报道,H20现身Geekbench 6数据库,显示其配备了78组SM。搭载GH100芯片完整的配置为144组SM,不过实际的H100产品中没有全部打开,其中SXM5版本中启用了132组SM,而PCIe 5.0版本则启用了114组SM。相比最高配置的H100,H20的内核数量减少了41%。H20配备了96GB的HBM3,高于H100 80GB版本,不过低于后来推出的新版H100,拥有144GB HBM3E。同时H20的带宽为4.0 TB/s,低于顶级解决方案的8.0 TB/s。
性能方面,INT8为296 TFLOPS,FP16为148 TFLOPS,TF32为74 TFLOPS,FP32为44 TFLOPS,而FP64只有1 TFLOPS。此外,H20配有60MB的L2缓存,支持多达7个多实例GPU,8路HGX配置,900 GB/s的NVLink带宽,TDP为400W。
在OpenCL基准测试中,H20的成绩为248,992分,H100 80GB版本在同一测试中的成绩大概在280,000分,如果是拥有132组SM的H100可以提高至350,000分左右,至于配备144GB HBM3E的H100分数就更高了。
最近有报道称,H20计算卡仍然有着不错的销售前景,受到了客户的欢迎,预计2024年英伟达将向中国出售超过100万块H20,每块售价大概在1.2万至1.3万美元,意味着销售额将达到120亿美元以上,这将超过上一个财年英伟达在中国的总收入。
这些信息可能会帮助到你: 联系作者 | 报毒说明
修改版本软件,加群提示等均为修改者自留,非本站信息,注意鉴别
评论(0)