

你有没有发现,最近AI圈子的风向变了?
以前大家见面就问:“你们公司买了多少张英伟达的卡?”现在变成了:“你们用TPU了吗?”
就在上周,英伟达发布了炸裂的财报——年收入2159亿美元,净利润翻倍!按理说股价应该暴涨对吧?
但诡异的是,财报发布后,英伟达股价反而暴跌5.46%,一夜蒸发数千亿美元市值!
华尔街不是看不懂数字,是看懂了趋势!
这可能是英伟达历史上最尴尬的时刻!
看看发生了什么:
英伟达最大的几个客户,正在集体分散筹码!
为什么?因为大模型进入规模化落地阶段后,大家发现了一个残酷的现实:
“每美元产生的Token数”正在取代峰值算力,成为衡量芯片商业价值的核心指标!
简单说就是:同样花一块钱,谁能吐出更多Token,谁就更值钱!
而GPU有个致命短板——每次计算时数据都要在外部显存和计算单元之间来回搬运。路径长、次数多,能耗就高、延迟就大。
路透社爆料,OpenAI已多次表达对英伟达芯片的“不满”——响应速度没达预期,在代码生成产品上感受尤为明显!
一直以来,谷歌TPU都是专供自家大模型训练和推理的“独门武器”,外人根本用不到。
但去年开始,谷歌把TPU推向了商用市场!
结果呢?订单像雪片一样飞来!
博通CEO透露了几个惊人的数字:
为什么TPU突然这么火?
因为谷歌第七代TPU的性能,已经具备与顶级GPU分庭抗礼的实力!
更关键的是:TPU v7在同等算力输出下功耗仅为英伟达B200的40%至50%!
这意味着什么?
大模型推理的综合成本相比GPU拉低50%以上!
这才是Anthropic、Meta们用真金白银投票的根本逻辑!
现在大多数大模型企业已经在用“TPU+GPU”的组合来缓解成本压力。
半导体研究机构SemiAnalysis对比发现:与OpenAI相比,同时使用TPU与GPU的Anthropic,在与英伟达谈判时拥有更强的议价权!
手里有TPU,就多了一张跟老黄讨价还价的牌!
2025年底,英伟达做了一件震惊业界的事——
斥资200亿美元,拿下AI芯片创企Groq的核心技术和团队!
这是英伟达史上最大的一笔交易,溢价近三倍!
Groq创始人Jonathan Ross,被称为“TPU之父”,是谷歌TPU的核心设计者之一。
离开谷歌后,他创立Groq的目标很明确:做一颗超越谷歌TPU的芯片!
两者的差异在架构:
数据显示,在相同推理任务中:
美国DARPA“电子复兴计划”高度看好“软件定义硬件”方向,将其列为国家级战略核心!
Groq虽然被收编,但“高阶TPU”的进化没停!
国内清微智能、海外Cerebras等公司正在高效数据流动态配置和先进集成方式上持续突破!
通过3D Chiplet技术构建三维立体数据流架构!
“计算核心+3D DRAM芯粒”的组合在垂直与水平两个维度上形成了高效的数据流计算模式,突破了传统二维架构的效率局限!
依托算力网格技术构建灵活数据流计算范式!
传统固定组网存在扩展性和语义适配瓶颈。而算力网格技术则可以通过灵活组网,实现Scale up与Scale out的协同!
通过前沿的晶圆级芯片技术,将数据流架构的优势发挥到极致!
这项技术将数据流架构从芯片尺度扩展到整片晶圆!
以Cerebras为例,数据显示:
在实测中,OpenAI的Codex-Spark跑出了每秒超1000 token的生成速度,让代码编写第一次有了实时交互的体验!
谷歌TPU走出围墙,OpenAI拥抱晶圆级芯片,英伟达天价收编Groq!
这些信号均指向同一个方向:TPU已变成巨头们真金白银押注的主战场!
算力世界的单极时代,正在被多元架构终结!
决定下一代AI天花板的,不是算力堆砌的军备竞赛,而是能耗、延迟、确定性共同构成的新指标!
在AI芯片的世界里,没有永远的王者,只有不断进化的架构!
互动问题:你觉得未来3年,AI芯片市场会形成怎样的新格局?
如果这篇文章对你有启发,记得点赞+分享给更多朋友!
让我们一起见证这场芯片革命的到来!