近两年,随着算力时代角逐加剧,国际科技“封锁红线”的调整频率越来越高,倒逼国内GPU产业链迎来重塑。
从A100、H100类型AI芯片,降格到A800、H800、L40、L40S,再降级到H20、L20、L2,英伟达黄仁勋一步步挨着美国禁令红线向中国市场售卖“阉割版”的芯片,但如今H20芯片“性能打到骨折”,国内的买家开始不买账了。
老黄想保住中国市场,这是毋庸置疑的。毕竟,中国大陆市场是最甜的一口蛋糕,占据英伟达20%以上的营收。即便英伟达从商业角度渴望保留中国市场,但从近几年美国管制禁令的变化来看,关于科技战,“丢掉幻想”依然是国内科技发展的核心思想。
随着AI落地生花,AI模型的训练、推理需要大量的计算,由此GPU被推上算力时代的最热风口。英伟达的万亿市值,也正是靠着计算加速GPU,而非靠桌面端显卡。
注:GPU(Graphics processing unit):图形处理器,俗称“显卡”,当下显卡可以简单分成两类:①图像渲染GPU,传统的用于图形图像处理的显卡,如英伟达的RTX 10/20/30/40系列等;②计算加速GPU,主要服务于AI模型训练和推理等新兴的算力需求,如英伟达的P40、V100、A100、H100、A800、H800,或者AMD的MI250、MI300。
今天,我们来看看,芯片领域最重要的一块,国产GPU进展如何。
01
算力争霸,英伟达“中国特供”生意还能延续吗?
近日《科创板日报》称,英伟达对华“特供版”AI芯片H20将在今年的英伟达GTC 2024大会(3月18日-3月21日)开完之后,全面接受预订,最快四周可以供货。
目前,在全球AI芯片角逐赛场上,英伟达与华为的竞争愈发激烈,英伟达更是摊牌把华为列为最大竞争对手。此次,英伟达推出的中国特供H20,是规避政策的缓兵之策,也是在中国市场上对华为昇腾910B的直接挑战。
据了解,英伟达H20是基于H100 GPU的调整版,其AI算力“缩水”为不到H100的15%,内存容量和运行速度也有所降低,H20在性能上相较于英伟达的其他高端芯片有明显下降,在某些关键领域的表现甚至未能达到华为昇腾910B(Ascend 910B)的水平。
注:目前,华为海思的芯片主要有鲲鹏、麒麟、昇腾等几大系列。华为昇腾910B是华为海思面向AI训练领域推出的芯片,是昇腾910的升级款。去年8月,科大讯飞创始人刘庆峰曾表示,华为的GPU能力已经可以对标英伟达A100。综合目前查到的性能数据、客户反馈来看,910B在算力指标方面可基本对齐英伟达A100,是中国AI芯片市场的佼佼者。
一边是英伟达对华“特供版”AI芯片H20,另一边是国产主力华为昇腾910B,国内经销商、云计算厂商等需求用户会怎么选?
我们可以从华为昇腾910与英伟达H20的性能与价格对比看看:
性能方面:
华为昇腾910的最大功耗为310W,其单精度(FP16)计算能力达到256 TeraFLOPS(每秒万亿次浮点运算),双精度(FP32)计算能力达到128 TeraFLOPS。
据公布的参数规格显示,英伟达H20的单精度(FP16)计算能力为148 TeraFLOPS,FP32为44 TeraFLOPS,大约为A100的50%/H100的15%,配6颗HBM3e,96G容量,NVLink提升到900G/s。
价格方面:
目前,华为昇腾910B的价格大约为120,000人民币(约合16672美元)。
英伟达H20的中国渠道定价设定在12,000~15,000美元之间,但部分渠道商的报价则高达约110,000人民币(相当于15,320美元)。
大体来看,英伟达H20在价格上略占优势,但考虑到昇腾910B在性能上的卓越,昇腾910B的性价比明显高于H20。
图源:pixabay
对于是否会采购H20,有国内厂商表示,还需要看市场验证,要等到拿到货实际测试之后才能判断。
日前,有专家会议称,国内互联网大厂对于英伟达H20的订单量或将大幅缩减。此外,为了确保国内科技产业的自主可控,工信部要求购买H20的企业必须报备,并详细解释为何选择使用阉割版的英伟达卡而非国产卡。这一举措,无疑将是英伟达“赢回”中国市场的又一道门槛。
英伟达“中国特供”生意能否延续,还有待市场验证,但这场算力争霸赛无疑将会是今年业内备受瞩目的擂台。
总体上,目前H20的需求声量尚不大,从性价比、算力国产化长期来看,国产芯片对国内买家的吸引力上升,华为、寒武纪和海光等有实力的国产芯片厂商将是厂商们的不错选择。
02
6000+国产GPU厂商发力,AI算力大比拼
相比传统的桌面端GPU,AI计算加速GPU门槛比较低,因此国内涌入AI计算加速GPU赛道的玩家并不少。据悉,目前国内AI芯片厂商数量约在6000+家,其中主流厂商数量约60余家,主要分为三个梯队。
第一梯队厂商拥有成熟产品,且已有商业化量产规模的应用。例如,华为、海光、寒武纪等。
目前,华为已推出昇腾 910 和昇腾 310 两款 AI 芯片,为人工智能提供强劲的算力支持。
海光信息主要产品包括海光通用处理器(CPU)和海光协处理器(DCU)。据悉,深算一号DCU相当于英伟达P100 GPU的水平,即英伟达2014到2015年时期的水准,可以运行通用大模型。但是现在面临一个问题,海光应该只拿到了美国超威半导体第一代的GPGPU的授权,所以未来产品如何更新迭代会有些棘手。
寒武纪的产品主要由云端芯片与边缘芯片等组成,体系丰富,适配AI应用及各类算法。据悉,寒武纪第三代云端产品思元370,采用7nm制程工艺,是寒武纪首款采用Chiplet技术的AI芯片,最大算力高达256TOPS(INT8)。目前,业界对于寒武纪新一代思元590芯片寄予厚望,期望其在大模型训练和推理任务中一定程度上替代A100。
图源:pixabay
第二梯队包括壁仞、天数、沐曦、摩尔线程、芯动、燧原、昆仑芯等近几年成立的初创企业。
这几家AI本土厂商虽然已发布相关产品,但实际落地应用规模进展有限,仍处于局部领域试水状态,或者还在努力建设软件生态,集群部署方案等。
如:壁仞科技创立于2019年,团队招揽了来自诸如阿里云、海思、英伟达、AMD、Synopsys(EDA软件龙头)等相关行业顶部公司的核心成员。2022年8月,壁仞发布首款GPU芯片BR100,据悉壁仞AI芯片在浪潮、中国移动、百度等都有落地,但具体规模不详。2023年10月,壁仞通过“白宫认证”,被美国商务部列入制裁名单,导致台积电停止了对壁仞所有产品的生产。
第三梯队包括龙芯、景嘉微等,这两家厂商有意向进军AI计算领域,已开始布局AI计算芯片研发,但尚无AI芯片量产。
写在结尾
随着美国AI禁令再升级,GPU成管制焦点,这无疑倒逼国产化提速。目前,国产化GPU提速,搭建算力底座的多重契机正全面来袭。
首先,AI革命带动算力需求火热,国产算力即将迎来发展机遇。2023年10月,工信部等六部门联合印发《算力基础设施高质量发展行动计划》发展目标,2023-2025年我国算力规模复合增长率为18.5%,目标是到2025年,算力规模超过300EFLOPS,智能算力占比达到35%。
其次,政策支持,顶层设计助力算力底座搭建。两会提出开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。这说明人工智能、信创等方向已上升到国家战略层面。
AI+芯片已经成为大国角力的主战场,没有烽烟却决定未来百年格局。身处大国科技博弈的角斗场上,国产GPU厂商“铁下心来掀桌子”,开始搭建自己的生态,必将能扛起AI算力角逐的大旗。
筚路蓝缕,以启山林。今天,虽然我们还看不出谁是中国版的英伟达,但时势造英雄!
精彩评论