• 0
买不起英伟达“特供”,中国创业者偏爱4090
统计 阅读时间大约10分钟(3839字)

2024-08-14 买不起英伟达“特供”,中国创业者偏爱4090

来源:英伟达官网
大模型进入推理阶段,性价比压过算力。

本文转载自:字母榜,作者:毕安娣,编辑:赵晋杰。猎云网已获授权。

距离A100、H100被禁售已经过去一年半,如今英伟达对华售卖阉割版的难度却一再升高。

近期,Jeffries分析师表示,美国在10月会对半导体出口管制进行年度审查,届时“很可能”禁止英伟达H20向中国销售。而禁售的方式有三种可能:特定产品禁令、降低计算能力上限,以及限制内存容量。

英伟达计划为中国推出新的特供版AI芯片,这个消息自黄仁勋3月官宣Blackwell后就没停过。目前主流的消息是,英伟达计划推出的是B200的“阉割版”B20。

但远在中国的众多中小创业者们明白:不管是论价格,还是论获取难度,英伟达的最新款高端AI芯片也大概率最多与自己“云端相见”。

AI创业者Jason告诉字母榜,他的公司之前的方向是AI应用层,除了通过云服务租A100和H100的算力之外,本地部署的是50张英伟达V100芯片,以及英伟达3090显卡。

这样的选择既是因为初创企业要追求性价比,压缩成本,也是因为做AI应用层的业务其实并不需要极高的算力。V100是英伟达在2017年发布的计算卡,彼时V100八卡服务器官方售价是102万元。而Jason的50张V100是“900元每张捡的”二手货,3090显卡是以每张5000元的价格收来的。

从2022年底开始,英伟达的最强大的芯片都因美国升级半导体出口管制而出口中国受阻,不管是A100,还是Blackwell之前最强大的H100,都无法在中国正规售卖。在那之后,美国针对高端芯片的出口管制越来越严格,英伟达从A800、H800,到H20、L20、L2,推出了一款又一款“中国特供版”芯片。

对于大多数创业者来说,特供版不仅性能远不及“原版”,价格也令人望而却步。一位卖家告诉字母榜,H20八卡服务器的售价在130万元左右。IT时报曾报道,H20的主要需求方还是百度、阿里、腾讯和字节等互联网大厂。

Jason称,H20主要是拿来做推理,但是“用H20不如用4090”,因为后者够用,而且H20作为商用芯片,“商用有折旧率,折价比较多,机房大概几年换一批,普遍不保值,比如V100当年卖几万,现在只能卖几千,也就五六年时间,如果不是AI潮,最多值500。”

不止一位业内人士向字母榜表示,自己偏好使用英伟达RTX4090,这款2022年10月推出的旗舰产品原以游戏显卡为名问世,但也备受AI行业的青睐,同样也受到了美国芯片出口管制的影响。

AI超算供应商浙江华兮云科技有限公司也介绍称,“目前最好用的是4090”,不过“也要看配置、组网、显卡”,很多客户的需求其实4090就能满足,而且性价比来看也比较好。该工作人员还补充称,本月公司就要上100台4090。

对于英伟达将在中国推出新特供产品、B200的“阉割版”B20的消息,Jason不感到兴奋,直说“看性价比”,而华兮云方面表示也尚未在业内听到相关消息。

此前路透社曾报道英伟达已经就B20有中国的浪潮信息展开合作,但后者已经回应称该消息不属实。

今年3月19日,黄仁勋在美国加州圣何塞SAP中心登台,主题演讲大开大合,名为《见证AI的变革时刻》。

老黄很少吹牛,英伟达官宣新一代Blackwell架构,并推出芯片B200和超级芯片GB200。“新核弹”是外界对英伟达新产品的形容,彼时刚升任英伟达研究经理的Jim Fan感慨摩尔定律已经按不住这家公司了。

但来自苹果的一次实验探索,稍稍阻挡下了英伟达的前进步伐。黄仁勋或许已成为全世界最不期待Apple智能上线的人。

北京时间7月30日,苹果发表了一篇技术论文,其中有这样一则信息:支撑Apple智能的两个AI模型,都是在谷歌的云端芯片上进行预训练的。

一来,谷歌的自研芯片为TPU张量处理器,此前多用于谷歌内部使用,而不对外出售。此番却出手抢走了大客户。二来,苹果此前曾在5月被《华尔街日报》爆料,正在为其数据中心服务器开发自研芯片,如今没有用上自研芯片,却依然没有选择英伟达。这足以令英伟达有些尴尬。

苹果“晾着”英伟达,是英伟达如今处境的一个缩影。英伟达的股价在今年前六个月上涨了150%,然而在7月份接连暴跌,占市值下跌幅度最大的八次中的四次。

此外,英伟达近期坏消息不断:被传新芯片B200将延迟三个月甚至更久才能交付;美国司法部针对其展开两项反垄断调查。

与之相对的,是不断传出的“中国特供版”消息——据多家外媒报道,英伟达计划向中国推出B200的阉割版B20。并且,英伟达还有可能会针对中国出售搭载最新芯片的服务器,以服务器来弥补特供芯片的性能。如果该消息属实,这将会是英伟达首次针对中国市场专门推出一款服务器产品。

上述举措也表明,尽管面临重重阻碍,但英伟达不仅没有放弃,还为中国市场做出更大的努力。

2022年底ChatGPT掀起的AI浪潮已经翻涌了近两年,英伟达也从一家芯片巨头一跃成为全世界市值最高的公司之一。如今AI赛道逐渐回归理性,竞争对手也慢慢形成围剿之势,中国变成了英伟达越来越难舍弃的市场。

对于中国AI赛道上的大量中小初创企业来说,英伟达中国特供版芯片并非他们的关注重点。而对于特供版芯片的主要采买方——中国的大型互联网企业来说,选择英伟达也只是当下的最优解。

英伟达在2023年10月推出了为中国量身定制的HGX H20、L20 PCle、L2 PCle,其中H20是备受瞩目的“矮子里的将军”,阉割版里的最强款。然而,一个月之后,随着英伟达跳票、H20推迟到次年第一季度交付的消息,使得不少企业转向国产芯片。

彼时中国基金报报道,百度已经为200台服务器向华为订购了1600个昇腾910B芯片。周鸿祎不久后也在乌镇峰会上表示,360采购了1000多个华为AI芯片,比百度还早。

到了今年上半年,又传出企业观望、华为等国产厂商竞争,英伟达H20在华销售疲软的消息。5月,传出H20下调价格的消息,原因指向两点,一点是H100不缺货并开始降价,H20随之下调,另一点是华为昇腾910B与之竞争,且初始售价后者更有优势。

下半年,H20在中国的销售似乎迎来转机。前不久,芯片行业咨询公司SemiAnalysis预测,H20芯片有望在当前财年提振该公司中国区业绩,今年有望交付超过100万张H20芯片。按照单芯片1.2万美元到1.3万美元的售价计算,仅H20就可以为英伟达贡献超过120亿美元的营收,这个数字超过上一财年英伟达中国区的整体营收。IT时报的报道指出,H20的销售抬头,主要是因为英伟达的生态优势,以及华为昇腾910B供货紧张。

这对英伟达来说,只能算作短暂的快乐,因生态优势和竞对供应紧张而获得的转机并不能言稳固。下一代“中国特供版”芯片很有可能在路上,但英伟达的挑战颇多。

除了传言中可能推出的B200的“阉割版”B20之外,据The Information报道,英伟达还计划为中国新版特供芯片搭配服务器。在中国专门推出一款服务器,这个动作英伟达此前未曾有过,此举是为了以服务器让特供芯片性能表现最大化,弥补“阉割版”的不足。

以搭载服务器当“一揽子”方案的消息如果为真,将是英伟达在禁售束缚之下做的新尝试。

坏消息是,市场再次传出英伟达最新芯片交付推迟的消息。据The Information近日的报道,英伟达已经向客户表示,B200将延迟发布三个月或更长时间,批量出货时间或将延迟到明年的第一季度(原计划今年10月就开始批量生产)。

此处提到的“客户”中不乏科技巨头,据报道,Meta已经定下价值至少100亿美元的订单,微软也在近几周内将其订单规模增加20%,并计划在明年第一季度前为OpenAI准备好5.5万到6.5万个GB200。

有理由怀疑,B200的延迟交付也将影响英伟达向中国市场推出阉割版的节奏。报道中称延迟交付的原因是在生产时发现了“设计缺陷”。

虽然英伟达尚未证实推出B20的消息,但几乎不会有人怀疑这将会发生。

比起2022年英伟达初次受到AI芯片的出口禁令,如今这家芯片巨头更加难舍中国市场。

中国庞大的芯片需求自然是首要驱动力。2022财年和2023财年,中国内地及香港地区分别为英伟达贡献71.11亿美元、57.85亿美元的营收,分别占其总营收的31.7%和25.9%。

然而,由于美国的芯片禁令,英伟达在中国却面临失速风险。2024财年,英伟达包含内地和港澳地区的中国市场营收止步百亿美元,占比滑至16.9%。

今年5月,英伟达发布2025财年第一季度(截至2024年4月28日)的业绩报告,在数据中心业务上,英伟达来自中国客户的营收占比已经从2023财年的19%,降低至2024财年的中个位数百分比(5%)。

对于中国本土芯片制造商发起的竞争,黄仁勋也心知肚明:“我们在中国的业务确实比过去的水平下滑很多。由于技术限制,现在在中国的竞争更加激烈。这些都是事实。”几天之后,黄仁勋再提中国芯片企业,称中国有很多GPU初创企业,不要低估中国在芯片领域的追赶能力。

从某种角度来看,美国的芯片禁售令虽然给中国AI企业在这波浪潮之中增加了难度,但同时也为中国本土的芯片制造商提供了发展的空间。从黄仁勋的角度来看,这无疑是危险的,时钟滴答响,留给英伟达在“阉割”之中破局的时间不多了。

这还不是英伟达更加难舍中国市场的全部因素。相比于2022年底,ChatGPT掀起千模大战,英伟达销售额和股价齐飞冲天,如今英伟达正在面临越来越不确定的局面。

仅在今年,就有OpenAI的CEO山姆·奥特曼(Sam Altman)7万亿芯片网络野心被爆料,微软开发类似英伟达网卡ConnectX-7的替代品,想提高其自研芯片Maia的性能。而谷歌TPU创造者乔纳森·罗斯(Jonathan Ross)创办的技术公司Groq,则叫嚣其新产品可以威胁到英伟达。

苹果投向谷歌的怀抱则是英伟达的噩梦又向前了一步:在自研芯片之外,一家财力雄厚的科技巨头加入AI之战,却没有选择英伟达。

在竞争之外,英伟达还面临着越来越强烈的监管压力。先是7月法国竞争管理局证实,正在对英伟达疑似违反市场竞争的行为进行调查。紧接着,8月,美国司法部针对英伟达展开两项反垄断调查。

英伟达的股价在今年前六个月上涨了150%,然而美联储降息落后,华尔街也对于科技股施加重压,多重因素影响下,英伟达股价“终于”在7月份接连暴跌,占市值下跌幅度最大的八次中的四次。

在这种情况下,英伟达需要,也必须保住在中国市场的影响力。这波AI浪潮虽然热闹,如今前路却也迷雾重重,英伟达是否会摸到天花板,甚至应了“AI泡沫论”的“诅咒”跌落神坛,谁都说不准。

在整整四年前,2020年8月,英伟达公布2021财年第二季度财报,季度数据中心的收入才首次超过游戏业务。如今,数据中心已经取代游戏,成为英伟达的核心业务。但这一步,黄仁勋铺垫了多年。

如今的英伟达,也同样需要为未来做打算,既要保持信心,也得“留一手”。一个有意思的数据是,据英伟达2025财年第一季度财报,该季度汽车业务在总营收中占比仅有1.2%,却是英伟达在数据中心业务之外,唯一实现环比增长的业务。而在英伟达官方公布的汽车业务合作伙伴中,中国车企与智驾方案供应商占比超过80%。

从这个角度来看,中国特供AI芯片的意义也许并不仅仅在AI,还在于英伟达需要在中国拥有持续的、可作为未来支点的影响力,哪怕是面临一次次被阉割的命运。

参考资料:

硅基研究室:《中国大陆营收占比暴跌,美国芯片禁令“刺伤”英伟达》

赛博汽车:《感谢中国车企,英伟达缓过来了》

钛媒体:《英伟达“过山车”式股价背后,AI芯片巨头地位并非不可动摇》

IT时报:《性能“阉割”的英伟达H20为何会大卖?》

半导体行业观察:《3万亿芯片公司,也在夹缝求生?》

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×