找工位
空间入驻
小程序

2026台北GTC黄仁勋:算力即收入

2026-06-02 00:00:00
文章转载自"北大纵横"

图片
来源 | 大顺AI商业流量
作者 | Alex
3100字 阅读时间6分钟

2026年6月1日,台北南港展览馆。

黄仁勋站在聚光灯下,身后巨幕滚动着一行字:“Compute is Revenue”——

算力即收入。

这不是营销口号,而是一份经济判决书:

旧计算范式已死,Agentic AI时代正式诞生。

作为全球AI基础设施的缔造者,英伟达早已超越GPU厂商的身份。

在这场被称作“回家”的GTC台北大会上,黄仁勋用近三小时的演讲,将一幅由芯片、系统、工具链与物理智能体构成的全景图徐徐展开。

本次演讲中的核心命题更是清晰而锋利:

在Agentic AI时代,算力不再是成本中心,而是直接驱动企业收入的核心引擎


一、AI并未替代人力,而是重塑生产力函数

黄仁勋开篇抛出一组数据: 

GitHub上开发者每年的commit数量从2023年的3亿次飙升至2026年前几个月的近9亿次。

背后是全球约3000万软件工程师——

他们每年领取约3万亿美元薪资,却创造了相当于9万亿美元的生产力输出。

这组数字揭示了一个被广泛误解的真相:

AI并未减少工作岗位,而是将单位人力的产出放大三倍

企业不是在裁员,而是在疯狂雇佣能驾驭AI的工程师。

因为每多雇一人,就等于多了一台印钞机。

“有人说AI会减少工作岗位,这完全是一派胡言。”黄仁勋语气冷峻。

他没有情绪化反驳,而是用数据切开舆论泡沫,暴露出底层逻辑:

当AI成为生产力放大器,劳动力需求只会增长,不会萎缩。

更关键的是,Token已成为新的经济单位。

过去,企业收入来自用户点击、广告曝光或软件订阅;

现在,收入直接与生成的Token数量挂钩。

每一个Token都承载着推理、决策或行动的价值,而生成Token的能力,完全取决于算力规模与效率。

这就是“算力即收入”的第一重含义:

算力不再是IT部门的成本项,而是CEO眼中的利润引擎

数据中心不再是技术负债,而是AI工厂——

一座以电力为原料、以芯片为机床、以Token为产品的现代化工厂。


二、四大产品矩阵如何协同构建Agentic AI基础设施

英伟达2026年的全线产品,并非孤立创新,而是一个高度协同的系统工程。

从云端到端侧,从虚拟到物理,每一层都为Agentic AI量身定制。

其设计逻辑遵循一个基本原则:

智能体需要完整的运行时环境,而非仅是推理加速器

1. RTX Spark + N1X:端侧智能体的神经中枢

PC正在经历40年来最彻底的重构。 

RTX Spark平台搭载的N1X芯片,集成6144个CUDA核心、20核Grace CPU和128GB统一内存,AI算力达1 Petaflop 。

这不是更强的显卡,而是私人数字机器人的载体

黄仁勋演示了一个典型场景:用户上传一张遥控器电池盖的照片,本地智能体自动调用CAD工具生成3D打印文件。

整个过程无需联网,毫秒级响应,且数据不出设备。

这意味着,端侧不再是轻量级推理终端,而是具备完整工具调用能力的智能体运行时

商业模式随之改变。 

RTX Spark上的智能体“24小时在线、免调用费”,直接绕过云API计费模式。

对用户而言,这是隐私与成本的双重胜利;

对微软和英伟达而言,这是锁定下一代操作系统生态的战略支点——

谁掌控端侧智能体运行时,谁就掌握用户入口。

2. Vera CPU:智能体时代的调度中枢

传统CPU为人类设计——按秒响应、按核计费。

但智能体生活在纳秒世界,任何延迟都会阻断其推理链条。 

Vera CPU由此诞生: 

88个Olympus核心,单周期执行10条指令,LPDDR5X内存带宽达1.2 TB/s ,内部互联速度3.6TB/s 。

黄仁勋将其比作“管弦乐队的指挥家”。

在Vera Rubin超算平台中,GPU负责思考(生成Token),而Vera CPU负责编排工具调用、管理内存缓存、处理安全隔离。

它不是计算单元,而是智能体工作流的调度中枢

实测数据显示:

Vera在智能体沙盒性能上是x86架构的1.8倍,SQL查询速度提升3倍。

这意味着,在相同电力预算下,采用Vera的AI工厂能多产出80%的有效Toke—

—直接转化为数亿美元年收入。

这种性能优势并非来自单一指标,而是源于对智能体行为模式的深度理解:

高频上下文切换、低延迟工具调用、跨模态数据检索。

3. Neotron 3 Ultra + Agent Toolkit :企业AI的操作系统

企业要部署智能体,需要四要素:

模型、框架、工具、运行时。

英伟达一次性打包交付。

Neotron 3 Ultra采用SSM+MoE混合架构,推理速度提升5倍,成本降低30%。

更重要的是,它开源训练数据与脚本,允许企业基于自身业务数据微调出“懂行”的专属智能体——

例如金融风控代理、芯片验证代理或供应链优化代理。

Agent Toolkit则提供Open Shell安全容器、Hermes编排框架、CUDA-X加速库。

以芯片设计为例,Cadence与英伟达共建的验证代理,将原本数周的RTL验证周期压缩至数小时。

这不是自动化,而是智能体驱动的工程范式革命

人类定义目标,智能体自主规划路径、调用工具、迭代验证。

4. Cosmos 3 + Isaac Groot:物理世界的智能体入口

语言模型可从互联网学习,但机器人必须拥有第一人称视角。 

Cosmos 3世界模型通过合成视频、动作与语言,构建符合物理规律的虚拟环境,供机器人学习。

Isaac Groot人形机器人参考设计,配备31个躯干自由度和双侧各25个高精度机械手,开箱即用。

研究人员无需再拼凑仿真、遥操作与数据流水线,物理AI的研发门槛被彻底拉平

这一组合解决了机器人领域的根本瓶颈:

真实世界数据稀缺、试错成本高昂。

通过在Cosmos 3中预训练,机器人可在虚拟环境中积累数百万小时经验,再迁移到物理实体。

这意味着,物理智能体的规模化部署首次成为可能


三、旧计算架构为何无法支撑Agentic AI

黄仁勋的批判锋利如探针,直指现有计算架构的三大结构性缺陷。

这些不是技术细节,而是决定AI工厂生死的系统性瓶颈

第一,内存墙已演变为智能体墙

传统应用依赖单一进程内存,而智能体需同时管理海量KV缓存、结构化数据库与非结构化文档。

现有存储系统无法高效检索跨模态数据,导致GPU频繁闲置等待CPU处理上下文。

在典型智能体工作流中,GPU利用率不足40%,大量算力被浪费在I/O等待上。

第二,工具调用成为新瓶颈

大模型擅长推理,但执行需调用外部工具(如编译器、数据库、CAD软件)。

现有操作系统缺乏对工具链的原生支持,导致调用延迟高、安全性差、权限混乱。

CUDA-X库之所以受智能体青睐,正是因为它们提供了标准化的“技能手册”——

预认证、预优化、预隔离的工具接口。

第三,电力配置严重低效

当前AI工厂电力预留高达40%,大量GPU因供电不足无法满载。 

DSX Max LPS通过动态功率分配,回收闲置电力输送至高负载区域,同等电网容量下可多部署 30% GPU——

每年增收数十亿美元。电力不再是静态资源,而是可调度的生产要素。

这些病灶共同指向一个结论:

Agentic AI需要全新的计算基座,而非对现有架构的修补

英伟达的解决方案不是单点突破,而是全栈重建:

从Vera CPU的低延迟互联,到DSX OS的智能电力调度,再到Open Shell的安全运行时,每一层都在切除病灶。


四、DSX如何定义AI工厂的新标准

英伟达的终极野心,不是卖芯片,而是定义AI工厂的标准。 

DSX(Data Center Supercomputer for AI)是一套涵盖芯片、机架、网络、电力、冷却的全栈参考设计。

借助Omniverse数字孪生,客户可在破土动工前模拟整座工厂的电力流、冷却效率与网络拓扑。

关键创新在于三点:

 45℃高温液冷
传统数据中心冷却至15–20℃,而DSX允许芯片在45℃下稳定运行,大幅降低水电消耗,将更多电力用于计算;
 动态功率分配
机架间实时调度电力,抑制峰值浪涌,使GPU平均利用率从60%提升至90%以上;
电网协同: 
DSX Flex可响应电网信号,在用电高峰时段自动降载,换取电价优惠或补贴,实现经济性与可持续性的统一。

一座1GW的AI工厂造价已达千亿美元。如此巨额投资,容不得试错。 

DSX的价值,正是将不确定性降至最低——

确保首台机架上线即盈利

黄仁勋透露:

CoreWeave、Nebius等新兴云厂商,正是依靠DSX快速崛起。

他们不是硬件专家,但通过采用英伟达全栈方案,得以在两年内建成世界级AI基础设施。

这揭示了一个残酷现实:

在Agentic AI时代,基础设施的复杂性已超出单一企业自研能力,标准化全栈方案成为唯一可行路径

图片


文中观点仅为作者观点,不代表本平台立场


各位读者朋友,公众号改了推送规则,如果您还希望第一时间收到我们推送的文章,请记得给北大纵横公众号设置星标。图片

点击左下方公众号“北大纵横”→点击右上角“...”→点选“设为星标⭐️”