


2026年6月1日,台北南港展览馆。
黄仁勋站在聚光灯下,身后巨幕滚动着一行字:“Compute is Revenue”——
算力即收入。
这不是营销口号,而是一份经济判决书:
旧计算范式已死,Agentic AI时代正式诞生。
作为全球AI基础设施的缔造者,英伟达早已超越GPU厂商的身份。
在这场被称作“回家”的GTC台北大会上,黄仁勋用近三小时的演讲,将一幅由芯片、系统、工具链与物理智能体构成的全景图徐徐展开。
本次演讲中的核心命题更是清晰而锋利:
在Agentic AI时代,算力不再是成本中心,而是直接驱动企业收入的核心引擎。
黄仁勋开篇抛出一组数据:
GitHub上开发者每年的commit数量从2023年的3亿次飙升至2026年前几个月的近9亿次。
背后是全球约3000万软件工程师——
他们每年领取约3万亿美元薪资,却创造了相当于9万亿美元的生产力输出。
这组数字揭示了一个被广泛误解的真相:
AI并未减少工作岗位,而是将单位人力的产出放大三倍。
企业不是在裁员,而是在疯狂雇佣能驾驭AI的工程师。
因为每多雇一人,就等于多了一台印钞机。
“有人说AI会减少工作岗位,这完全是一派胡言。”黄仁勋语气冷峻。
他没有情绪化反驳,而是用数据切开舆论泡沫,暴露出底层逻辑:
当AI成为生产力放大器,劳动力需求只会增长,不会萎缩。
更关键的是,Token已成为新的经济单位。
过去,企业收入来自用户点击、广告曝光或软件订阅;
现在,收入直接与生成的Token数量挂钩。
每一个Token都承载着推理、决策或行动的价值,而生成Token的能力,完全取决于算力规模与效率。
这就是“算力即收入”的第一重含义:
算力不再是IT部门的成本项,而是CEO眼中的利润引擎。
数据中心不再是技术负债,而是AI工厂——
一座以电力为原料、以芯片为机床、以Token为产品的现代化工厂。
英伟达2026年的全线产品,并非孤立创新,而是一个高度协同的系统工程。
从云端到端侧,从虚拟到物理,每一层都为Agentic AI量身定制。
其设计逻辑遵循一个基本原则:
智能体需要完整的运行时环境,而非仅是推理加速器。
PC正在经历40年来最彻底的重构。
RTX Spark平台搭载的N1X芯片,集成6144个CUDA核心、20核Grace CPU和128GB统一内存,AI算力达1 Petaflop 。
这不是更强的显卡,而是私人数字机器人的载体。
黄仁勋演示了一个典型场景:用户上传一张遥控器电池盖的照片,本地智能体自动调用CAD工具生成3D打印文件。
整个过程无需联网,毫秒级响应,且数据不出设备。
这意味着,端侧不再是轻量级推理终端,而是具备完整工具调用能力的智能体运行时。
商业模式随之改变。
RTX Spark上的智能体“24小时在线、免调用费”,直接绕过云API计费模式。
对用户而言,这是隐私与成本的双重胜利;
对微软和英伟达而言,这是锁定下一代操作系统生态的战略支点——
谁掌控端侧智能体运行时,谁就掌握用户入口。
传统CPU为人类设计——按秒响应、按核计费。
但智能体生活在纳秒世界,任何延迟都会阻断其推理链条。
Vera CPU由此诞生:
88个Olympus核心,单周期执行10条指令,LPDDR5X内存带宽达1.2 TB/s ,内部互联速度3.6TB/s 。
黄仁勋将其比作“管弦乐队的指挥家”。
在Vera Rubin超算平台中,GPU负责思考(生成Token),而Vera CPU负责编排工具调用、管理内存缓存、处理安全隔离。
它不是计算单元,而是智能体工作流的调度中枢。
实测数据显示:
Vera在智能体沙盒性能上是x86架构的1.8倍,SQL查询速度提升3倍。
这意味着,在相同电力预算下,采用Vera的AI工厂能多产出80%的有效Toke—
—直接转化为数亿美元年收入。
这种性能优势并非来自单一指标,而是源于对智能体行为模式的深度理解:
高频上下文切换、低延迟工具调用、跨模态数据检索。
企业要部署智能体,需要四要素:
模型、框架、工具、运行时。
英伟达一次性打包交付。
Neotron 3 Ultra采用SSM+MoE混合架构,推理速度提升5倍,成本降低30%。
更重要的是,它开源训练数据与脚本,允许企业基于自身业务数据微调出“懂行”的专属智能体——
例如金融风控代理、芯片验证代理或供应链优化代理。
Agent Toolkit则提供Open Shell安全容器、Hermes编排框架、CUDA-X加速库。
以芯片设计为例,Cadence与英伟达共建的验证代理,将原本数周的RTL验证周期压缩至数小时。
这不是自动化,而是智能体驱动的工程范式革命:
人类定义目标,智能体自主规划路径、调用工具、迭代验证。
语言模型可从互联网学习,但机器人必须拥有第一人称视角。
Cosmos 3世界模型通过合成视频、动作与语言,构建符合物理规律的虚拟环境,供机器人学习。
Isaac Groot人形机器人参考设计,配备31个躯干自由度和双侧各25个高精度机械手,开箱即用。
研究人员无需再拼凑仿真、遥操作与数据流水线,物理AI的研发门槛被彻底拉平。
这一组合解决了机器人领域的根本瓶颈:
真实世界数据稀缺、试错成本高昂。
通过在Cosmos 3中预训练,机器人可在虚拟环境中积累数百万小时经验,再迁移到物理实体。
这意味着,物理智能体的规模化部署首次成为可能。
黄仁勋的批判锋利如探针,直指现有计算架构的三大结构性缺陷。
这些不是技术细节,而是决定AI工厂生死的系统性瓶颈。
第一,内存墙已演变为智能体墙。
传统应用依赖单一进程内存,而智能体需同时管理海量KV缓存、结构化数据库与非结构化文档。
现有存储系统无法高效检索跨模态数据,导致GPU频繁闲置等待CPU处理上下文。
在典型智能体工作流中,GPU利用率不足40%,大量算力被浪费在I/O等待上。
第二,工具调用成为新瓶颈。
大模型擅长推理,但执行需调用外部工具(如编译器、数据库、CAD软件)。
现有操作系统缺乏对工具链的原生支持,导致调用延迟高、安全性差、权限混乱。
CUDA-X库之所以受智能体青睐,正是因为它们提供了标准化的“技能手册”——
预认证、预优化、预隔离的工具接口。
第三,电力配置严重低效。
当前AI工厂电力预留高达40%,大量GPU因供电不足无法满载。
DSX Max LPS通过动态功率分配,回收闲置电力输送至高负载区域,同等电网容量下可多部署 30% GPU——
每年增收数十亿美元。电力不再是静态资源,而是可调度的生产要素。
这些病灶共同指向一个结论:
Agentic AI需要全新的计算基座,而非对现有架构的修补。
英伟达的解决方案不是单点突破,而是全栈重建:
从Vera CPU的低延迟互联,到DSX OS的智能电力调度,再到Open Shell的安全运行时,每一层都在切除病灶。
英伟达的终极野心,不是卖芯片,而是定义AI工厂的标准。
DSX(Data Center Supercomputer for AI)是一套涵盖芯片、机架、网络、电力、冷却的全栈参考设计。
借助Omniverse数字孪生,客户可在破土动工前模拟整座工厂的电力流、冷却效率与网络拓扑。
关键创新在于三点:
一座1GW的AI工厂造价已达千亿美元。如此巨额投资,容不得试错。
DSX的价值,正是将不确定性降至最低——
确保首台机架上线即盈利。
黄仁勋透露:
CoreWeave、Nebius等新兴云厂商,正是依靠DSX快速崛起。
他们不是硬件专家,但通过采用英伟达全栈方案,得以在两年内建成世界级AI基础设施。
这揭示了一个残酷现实:
在Agentic AI时代,基础设施的复杂性已超出单一企业自研能力,标准化全栈方案成为唯一可行路径。

文中观点仅为作者观点,不代表本平台立场
