黄仁勋 GTC 台北 2026 演讲笔记:Agentic AI 时代已来

入库于 2026/6/3|

黄仁勋 GTC 台北 2026 演讲笔记:Agentic AI 时代已来

来源:NVIDIA GTC Taipei 2026 主题演讲(2026 年 6 月 1 日) 记录时间:2026-06-02


一句话定调

"Agent AI 和实用型人工智能时代已经到来。Token 是利润单位,AI 是 GDP 生成器,软件工程师数量正在增加——AI 减少工作岗位,完全是胡说八道。"


核心判断:范式已经切换

黄仁勋这场演讲,本质上是宣布一件事:AI 从回答问题,进化到自主完成任务

过去的范式是:用户提问 → 大模型回答。 现在的范式是:大模型 + 控制外壳 + 工具调用 + 运行时 = 分布式自主系统(Agentic AI)。

这意味着整个科技行业的软硬件架构都需要深度重构:从云端数据中心,到每个人的 PC,到企业服务器,到物理世界里的机器人。

他用了一个很直白的经济学表达来描述这个变化:

  • Token 就是资产——谁能生产更多 Token,谁就能创造更多利润
  • 算力即收入(Compute is Revenue)——AI 工厂是新时代的"印钞机"

硬件层:为 Agent 重新设计每一颗芯片

1. Vera Rubin——AI 数据中心的新底座

  • 已全面量产,OpenAI、Anthropic、SpaceX 为首批客户
  • 同等规模数据中心运行 Agent 任务,效率是上代 Grace Blackwell 的 10 倍
  • 首次将**共封装光学(CPO)**技术大规模引入 AI 数据中心网络(降低功耗和信号损失)
  • 新增机密计算能力,端到端加密,覆盖整个平台
  • 部署时间:从 Blackwell 的 2 小时,压缩到 5 分钟级别

2. Vera CPU——历史上首颗专为 Agent 设计的处理器

"至今为止所有的 CPU 都是为人类打造的,Vera 是为 AI 时代、为智能体打造的 CPU。"

  • 88 个 Olympus 核心(↑ Grace 的 72 核)
  • Agent 工作负载测速:比同期 x86 服务器 CPU 快 1.8 倍
  • 与 Rubin GPU 通过第二代 NVLink-C2C 互联,带宽 1.8 TB/s(大幅降低 CPU-GPU 数据传输开销)
  • LPDDR5X 内存 1.2 TB/s 带宽 + 芯片内 3.6 TB/s 无损互联

3. RTX Spark SoC + N1X——AI PC 的"超级芯"

  • 首次将 N1X CPU + Blackwell GPU 集成进单颗 SoC,统一内存架构
  • N1X 由英伟达与微软合作设计,联发科定制,台积电 3nm 制造,Arm 架构
  • 今秋首发于微软、戴尔、惠普、华硕、联想、微星,首批超 30 款机型
  • 定位:PC 不再是"点击运行软件的机器",而是私人专属的数字机器人

4. DGX Station for Windows——企业桌面级 AI 超算

  • 搭载 GB300 Grace Blackwell Ultra Desktop Superchip
  • 748 GB 统一内存,20 PFLOPS FP4 算力,800 Gb/s 网络
  • 首次让企业能在本地 Windows 环境中安全运行多个 Agent 并接入工作流

软件层:Agent 运行的完整操作系统

DSX——AI 工厂从"建设"到"运营"的全套工具箱

"英伟达不只是卖芯片,我们为每一个基础设施建设者提供了完整的 AI 工厂建设和运营蓝图。"

组件功能
Reference DesignAI 工厂参考设计(机房/机架/网络/电力/冷却)
DSX Sim建设前仿真验证,先跑通再下单
DSX OSAI 工厂运营软件(调度、健康监测、故障恢复、多租户管理)
DSX MaxLPS固定电力预算下,多运行最多 40% 的 GPU
DSX Flex接入电网,按电价/负荷智能调整任务
DSX Exchange打通 IT/运营/能源/冷却系统数据接口

Nemotron 3 Ultra + NemoClaw——Agent 的大脑和骨架

  • 5500 亿参数 MoE 模型,推理速度比同级主流开源模型快 5 倍,成本降低 30%
  • NemoClaw 负责将模型组织成 Agent:编排、上下文管理、记忆、工具调用、安全控制
  • OpenShell 提供运行时安全:隔离沙箱 + 系统级策略,防止 Agent 越权或泄露数据

Cosmos 3——让 Agent 理解物理世界

  • 全球首个完全开放的全能模型(Omni Model):视觉推理 + 世界生成 + 动作预测三合一
  • 原生理解文本、图像、视频、环境声音和动作
  • 把物理 AI 的训练和评估周期从数月压缩到数天
  • 目标:让机器人、自动驾驶汽车、视觉 AI 系统可以感知、推理、规划、行动

物理 AI:Agent 有了身体

  • 英伟达与宇树联合发布 H2 Plus——全球首款基于 Isaac GR00T 的人形机器人开放参考设计
  • 核心价值:把底层硬件集成、数据采集、仿真、训练、部署打通,让研究团队跳过底层拼凑,直接进入技能开发
  • 同步开源物理 AI Skills 工具集,覆盖机器人/自动驾驶/视觉 AI/工业数字孪生
  • 黄仁勋预言:物理 AI 的大爆炸即将来临,将为全球最大产业带来数万亿美元机遇

一个有意思的结构性变化:台积电与英伟达互为供应商

过去三十年:台积电帮英伟达造芯片(单向甲乙方)。

现在:台积电正在用英伟达的 AI 技术来提升自己晶圆厂的周转时间、能效、良率和运营效率。

两者关系从单向依赖,变成了双向相互依存。这是一个微妙但意味深长的变化。


核心趋势总结

趋势黄仁勋的判断
AI 阶段生成式 AI → Agentic AI(已发生,不是未来)
算力经济Token = 资产;算力 = 收入;AI 工厂 = 新型基础设施
就业影响软件工程师数量正在增加,AI 替代论"胡说八道"
计算范式从"运行软件"到"运行 Agent",整个软硬件栈需要重构
下一个大爆炸物理 AI(机器人 + 自动驾驶),将从数字世界扩展到物理世界
英伟达定位不只是卖芯片,而是提供完整的 AI 工厂建设和运营体系

我的思考

  1. "Token 即资产"的经济逻辑:这句话值得细品。黄仁勋在重新定义 AI 时代的"产品单位"。就像工业时代"电"是基础资源、互联网时代"流量"是资产,AI 时代"Token 生产能力"正在成为核心竞争力。谁能低成本、大规模生产 Token,谁就掌握了 AI 时代的"发电厂"。

  2. Agent 时代的安全问题被提到了前所未有的高度:BlueField-4 STX 新增芯片级安全、OpenShell 隔离沙箱、Vera Rubin 机密计算——英伟达在这场演讲里三次强调安全。背后逻辑是:当 Agent 在无人监督下持续运行并访问企业数据,"安全"不再是功能,而是前提条件。

  3. PC 形态的重构值得重视:RTX Spark + N1X 进军 AI PC,不只是性能升级,而是要改变 PC 的使用模式。从"人操控软件"变成"Agent 替人工作",PC 成为"私人数字机器人"。这对整个 Windows 生态、应用软件行业的影响,可能比想象的更深远。


by dodo · 2026-06-02