热点丨拒绝短板,英伟达200亿收编Groq“堵死”AI推理后路

Ai芯天下
关注

前言:

圣诞夜的硅谷没有寂静,英伟达CEO黄仁勋抛出了一枚价值200亿美元的[圣诞礼物],与AI芯片初创公司Groq达成历史性合作。

这一金额远超2019年收购Mellanox的70亿美元,创下英伟达史上最高额交易纪录。

这场看似非理性的豪赌背后,藏着黄仁勋对AI推理市场的焦虑,以及对供应链霸权的深层防御。

推理让格局松动,[反骨]的Grop水涨船高

过去十年,英伟达凭借其GPU架构和CUDA软件生态,牢牢占据了AI训练市场的绝对统治地位。

数据中心、科研机构乃至全球大多数AI模型的训练环节,都依托英伟达的GPU完成。但进入2024-2025年之后,AI应用开始大规模从训练转向推理环节。

这类任务对低延迟、高效率、能耗与成本敏感性提出了苛刻要求,而传统GPU在这类工作负载下并非最优解。

正是在这种背景下,一类被称为LPU的推理加速芯片应运而生,Groq便是这一领域最受资本追捧的明星。

其创始人Jonathan Ross曾是谷歌TPU的核心工程师,他主导设计的Groq芯片架构在推理性能与成本效率上具备显著优势。

Groq的LPU核心特征是完全静态调度、无动态分支、指令级确定执行,这在GPU世界里几乎是[异端],但在推理场景中却意味着延迟可预测、性能不随负载抖动、更适合SLA驱动的商业部署。

已曝光数据表明,Groq的推理芯片在速度方面极具竞争力,有潜力实现比传统GPU高10倍的推理效率。

这意味着在延迟敏感、实时性要求高的AI应用中,Groq具备明显的技术优势。

一旦这种优势被规模化采用,它将直接对以GPU为核心的英伟达生态形成实质性挑战。

凭借这种差异化优势,Groq迅速成为资本宠儿,自2016年成立以来,累计融资18亿美元,投资方包括贝莱德、三星、思科等巨头。

2025年9月完成的7.5亿美元融资,更是将其估值推至69亿美元。

彼时的Groq意气风发,制定了5亿美元的年度营收目标,还与Meta、IBM、沙特阿美等达成战略合作,计划建设大型AI推理数据中心。

谁也没想到,仅仅三个月后,这家志在[颠覆英伟达]的初创公司,就被巨头以200亿美元的价格[招安]。

200亿溢价的真相,英伟达在防什么?

这笔交易最令人费解的地方在于Groq的市占率不足1%,2025年营收仅1.725亿美元,距离对英伟达构成实质性威胁还有天壤之别。

为何Groq能让黄仁勋如此[迫切]地出手,答案藏在AI产业的结构性变迁与英伟达的供应链软肋中。

AI产业正从训练时代迈入推理时代,IDC报告显示2025年全球AI推理芯片市场规模将达到训练市场的3倍。

与训练芯片追求极致算力不同,推理芯片更注重延迟、吞吐与成本的平衡。

在自动驾驶、金融高频交易、实时聊天机器人等场景中,昂贵的通用GPU并非最优解,这为专用推理芯片提供了生存空间。

英伟达虽然在训练市场占据90%份额,但在推理领域正面临多重夹击。

谷歌TPU已被苹果、Anthropic等用于训练和推理,Meta、OpenAI等大客户纷纷自研专用推理芯片以降低依赖,Groq、Cerebras等初创公司则凭借差异化技术分食市场。

黄仁勋在内部邮件中直言,收购Groq的核心目的,是[将其低延迟处理器整合到英伟达的AI工厂架构中,服务更广泛的AI推理和实时工作负载],直白地承认了自身在推理领域的短板。

但比补齐短板更重要的是防御供应链的潜在危机,英伟达的真正护城河,不仅是CUDA软件生态,更是对HBM和CoWoS等核心供应链的[买方垄断]。

HBM和CoWoS是高端AI芯片的核心组件,但产能极其稀缺。

根据台积电规划,2025年CoWoS月产能仅6.5万-8万片,其中60%以上被英伟达占用。

这意味着,即便其他公司设计出优秀的芯片,也可能因拿不到足够的HBM和CoWoS产能而无法量产。

而Groq的技术路线恰恰绕开了这两大瓶颈,由于采用片上SRAM,Groq芯片无需HBM,也不需要复杂的CoWoS封装,仅通过英特尔等代工厂即可生产。

这意味着,一旦Groq的路线跑通,AI芯片的生产门槛将大幅降低,其他设计公司无需依赖稀缺供应链就能大规模生产推理芯片,这对英伟达的[稀缺性帝国]是致命打击。

[当你不再依赖美光、三星的HBM,也不再被CoWoS产能牵着走,制造节奏和选择空间都会明显放大。]分析师Max Weinbach的评价点出了要害。

黄仁勋支付200亿美元,本质上是一场预防性收购,即便未来有人找到绕开现有体系的办法,那条新路也必须握在自己手里。

此外,这场交易还暗藏着资本与其他因素的考量,Groq的投资方中,包括特朗普大儿子担任合伙人的1789 Capital,沙特主权财富基金也对其有大额投资。

而就在交易前一个月,美国政府刚刚批准向沙特出口顶级AI芯片,特朗普也签署行政命令推进AI联邦统一监管。

有分析认为,黄仁勋通过这笔交易向华盛顿与中东地区递出[投名状],意在换取核心产品的出口豁免权与监管红利。

总之,英伟达凭借606亿美元的现金储备,通过投资、收购、技术许可等多种手段,将AI产业链的核心资源尽收囊中。

从AI模型开发商Cohere,到云服务商CoreWeave,再到推理芯片公司Groq,甚至向老对手英特尔和OpenAI巨额投资,构建起一张无孔不入的生态网络。

硅谷新玩法,[只买灵魂不买壳]的[人才收购]

这场轰动业界的交易,从一开始就充满了[硅谷式套路],几小时后双方紧急澄清,这并非全盘收购,而是一份[非独家技术许可协议]。

英伟达拿走了Groq的核心技术、灵魂团队,却让Groq保留独立法人身份继续运营。

这种被称为[Acqui-hire(人才收购)]的操作,本质上是一场精心设计的[掏空式整合],既规避了反垄断审查,又将潜在威胁化为己用。

根据协议,英伟达获得Groq的核心技术知识产权非独家授权,Groq创始人Jonathan Ross、总裁Sunny Madra及核心工程团队全部加入英伟达。

而Groq本身继续作为独立公司运营,由原CFO接任CEO,GroqCloud云服务也照常运营。

回顾近两年的硅谷,这类交易早已蔚然成风。

2025年6月,Meta以150亿美元挖走Scale AI创始人亚历山大王和核心工程师团队。

7月,谷歌以24亿美元挖走Windsurf创始人及研发团队,随后推出AI编程工具Antigravity,

9月,英伟达再以9亿美元聘请Enfabrica CEO及团队,获得其技术许可。

这些交易的核心逻辑高度一致,在AI技术竞争白热化的当下,人才和核心技术远比公司外壳更有价值。

这种模式正在形成一种新的行业生态,巨头通过资本优势,将潜在的颠覆者转化为自身的技术模块,而初创公司的终极目标也从[独立上市]变成了[被巨头收购]。

技术硬伤与行业变局,LPU的荣光与困境

尽管被英伟达高价收购,但Groq的LPU芯片并非完美无缺,其技术路线的局限性也揭示了AI推理芯片行业的复杂博弈。

Groq的核心优势是低延迟和高能效,但这是以牺牲内存容量为代价的。

由于SRAM容量有限,单颗LPU芯片的内存仅230MB,而英伟达H200的内存容量高达141GB,两者相差约628倍。

这意味着,运行同样参数的大模型,需要的LPU数量远高于GPU。

此外,LPU的技术路线还面临通用性不足的问题,其采用的144路VLIW架构,虽然结构简单、延迟低,但对编译器要求极高。

由于硬件本身没有调度逻辑,所有计算任务的并行安排都依赖编译器,一旦遇到新的模型结构,就需要重新拆解计算图,泛化能力远不如GPU。

这也是Groq近年来刻意淡化VLIW架构,将产品名称从TSP改为LPU的重要原因,为了回避软件适配的短板。

这些硬伤导致Groq的商业化进程并不顺利,2025年7月,Groq将年度收入预期从20亿美元大幅下调至5亿美元,主要原因是大额订单交付延迟和数据中心建设进度滞后。

但即便如此,Groq的技术依然具有不可替代的战略价值,在自动驾驶、金融高频交易等对延迟要求极高的场景中,LPU的优势无可比拟。

英伟达将其整合进AI工厂架构后,能够填补自身在专用推理场景的空白,形成训练+推理的全栈优势。

结尾

未来十年,AI硬件领域不会再是单一架构的主导,而是多种计算模型、软件生态与开放标准的博弈场。

英伟达这次以高溢价布局推理技术,既是对自身短板的补齐,也是对未来AI图景早期布局的一次重大下注。

而在全球AI生态不断拓展的过程中,新的竞争者与创新路径仍将层出不穷。

部分资料参考:硅基观察Pro:《市占率不足1%,却溢价3倍!英伟达究竟在怕什么?》,创业邦:《英伟达200亿美元[吞掉]Groq,中国对标公司借壳上市,市值飙至229亿》,51CTO技术栈:《英伟达史上最大收购!黄仁勋豪掷200亿美元收购Groq,野心瞄准AI推理市场》,腾讯科技:《黄仁勋200亿美金接盘Groq,中东王爷和特朗普都笑了》

       原文标题 : 热点丨拒绝短板,英伟达200亿收编Groq“堵死”AI推理后路

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存