黄仁勋 GTC 台北 2026 演讲笔记:Agentic AI 时代已来
来源:NVIDIA GTC Taipei 2026 主题演讲(2026 年 6 月 1 日) 记录时间:2026-06-02
一句话定调
"Agent AI 和实用型人工智能时代已经到来。Token 是利润单位,AI 是 GDP 生成器,软件工程师数量正在增加——AI 减少工作岗位,完全是胡说八道。"
核心判断:范式已经切换
黄仁勋这场演讲,本质上是宣布一件事:AI 从回答问题,进化到自主完成任务。
过去的范式是:用户提问 → 大模型回答。 现在的范式是:大模型 + 控制外壳 + 工具调用 + 运行时 = 分布式自主系统(Agentic AI)。
这意味着整个科技行业的软硬件架构都需要深度重构:从云端数据中心,到每个人的 PC,到企业服务器,到物理世界里的机器人。
他用了一个很直白的经济学表达来描述这个变化:
- Token 就是资产——谁能生产更多 Token,谁就能创造更多利润
- 算力即收入(Compute is Revenue)——AI 工厂是新时代的"印钞机"
硬件层:为 Agent 重新设计每一颗芯片
1. Vera Rubin——AI 数据中心的新底座
- 已全面量产,OpenAI、Anthropic、SpaceX 为首批客户
- 同等规模数据中心运行 Agent 任务,效率是上代 Grace Blackwell 的 10 倍
- 首次将**共封装光学(CPO)**技术大规模引入 AI 数据中心网络(降低功耗和信号损失)
- 新增机密计算能力,端到端加密,覆盖整个平台
- 部署时间:从 Blackwell 的 2 小时,压缩到 5 分钟级别
2. Vera CPU——历史上首颗专为 Agent 设计的处理器
"至今为止所有的 CPU 都是为人类打造的,Vera 是为 AI 时代、为智能体打造的 CPU。"
- 88 个 Olympus 核心(↑ Grace 的 72 核)
- Agent 工作负载测速:比同期 x86 服务器 CPU 快 1.8 倍
- 与 Rubin GPU 通过第二代 NVLink-C2C 互联,带宽 1.8 TB/s(大幅降低 CPU-GPU 数据传输开销)
- LPDDR5X 内存 1.2 TB/s 带宽 + 芯片内 3.6 TB/s 无损互联
3. RTX Spark SoC + N1X——AI PC 的"超级芯"
- 首次将 N1X CPU + Blackwell GPU 集成进单颗 SoC,统一内存架构
- N1X 由英伟达与微软合作设计,联发科定制,台积电 3nm 制造,Arm 架构
- 今秋首发于微软、戴尔、惠普、华硕、联想、微星,首批超 30 款机型
- 定位:PC 不再是"点击运行软件的机器",而是私人专属的数字机器人
4. DGX Station for Windows——企业桌面级 AI 超算
- 搭载 GB300 Grace Blackwell Ultra Desktop Superchip
- 748 GB 统一内存,20 PFLOPS FP4 算力,800 Gb/s 网络
- 首次让企业能在本地 Windows 环境中安全运行多个 Agent 并接入工作流
软件层:Agent 运行的完整操作系统
DSX——AI 工厂从"建设"到"运营"的全套工具箱
"英伟达不只是卖芯片,我们为每一个基础设施建设者提供了完整的 AI 工厂建设和运营蓝图。"
| 组件 | 功能 |
|---|---|
| Reference Design | AI 工厂参考设计(机房/机架/网络/电力/冷却) |
| DSX Sim | 建设前仿真验证,先跑通再下单 |
| DSX OS | AI 工厂运营软件(调度、健康监测、故障恢复、多租户管理) |
| DSX MaxLPS | 固定电力预算下,多运行最多 40% 的 GPU |
| DSX Flex | 接入电网,按电价/负荷智能调整任务 |
| DSX Exchange | 打通 IT/运营/能源/冷却系统数据接口 |
Nemotron 3 Ultra + NemoClaw——Agent 的大脑和骨架
- 5500 亿参数 MoE 模型,推理速度比同级主流开源模型快 5 倍,成本降低 30%
- NemoClaw 负责将模型组织成 Agent:编排、上下文管理、记忆、工具调用、安全控制
- OpenShell 提供运行时安全:隔离沙箱 + 系统级策略,防止 Agent 越权或泄露数据
Cosmos 3——让 Agent 理解物理世界
- 全球首个完全开放的全能模型(Omni Model):视觉推理 + 世界生成 + 动作预测三合一
- 原生理解文本、图像、视频、环境声音和动作
- 把物理 AI 的训练和评估周期从数月压缩到数天
- 目标:让机器人、自动驾驶汽车、视觉 AI 系统可以感知、推理、规划、行动
物理 AI:Agent 有了身体
- 英伟达与宇树联合发布 H2 Plus——全球首款基于 Isaac GR00T 的人形机器人开放参考设计
- 核心价值:把底层硬件集成、数据采集、仿真、训练、部署打通,让研究团队跳过底层拼凑,直接进入技能开发
- 同步开源物理 AI Skills 工具集,覆盖机器人/自动驾驶/视觉 AI/工业数字孪生
- 黄仁勋预言:物理 AI 的大爆炸即将来临,将为全球最大产业带来数万亿美元机遇
一个有意思的结构性变化:台积电与英伟达互为供应商
过去三十年:台积电帮英伟达造芯片(单向甲乙方)。
现在:台积电正在用英伟达的 AI 技术来提升自己晶圆厂的周转时间、能效、良率和运营效率。
两者关系从单向依赖,变成了双向相互依存。这是一个微妙但意味深长的变化。
核心趋势总结
| 趋势 | 黄仁勋的判断 |
|---|---|
| AI 阶段 | 生成式 AI → Agentic AI(已发生,不是未来) |
| 算力经济 | Token = 资产;算力 = 收入;AI 工厂 = 新型基础设施 |
| 就业影响 | 软件工程师数量正在增加,AI 替代论"胡说八道" |
| 计算范式 | 从"运行软件"到"运行 Agent",整个软硬件栈需要重构 |
| 下一个大爆炸 | 物理 AI(机器人 + 自动驾驶),将从数字世界扩展到物理世界 |
| 英伟达定位 | 不只是卖芯片,而是提供完整的 AI 工厂建设和运营体系 |
我的思考
-
"Token 即资产"的经济逻辑:这句话值得细品。黄仁勋在重新定义 AI 时代的"产品单位"。就像工业时代"电"是基础资源、互联网时代"流量"是资产,AI 时代"Token 生产能力"正在成为核心竞争力。谁能低成本、大规模生产 Token,谁就掌握了 AI 时代的"发电厂"。
-
Agent 时代的安全问题被提到了前所未有的高度:BlueField-4 STX 新增芯片级安全、OpenShell 隔离沙箱、Vera Rubin 机密计算——英伟达在这场演讲里三次强调安全。背后逻辑是:当 Agent 在无人监督下持续运行并访问企业数据,"安全"不再是功能,而是前提条件。
-
PC 形态的重构值得重视:RTX Spark + N1X 进军 AI PC,不只是性能升级,而是要改变 PC 的使用模式。从"人操控软件"变成"Agent 替人工作",PC 成为"私人数字机器人"。这对整个 Windows 生态、应用软件行业的影响,可能比想象的更深远。
by dodo · 2026-06-02