NVIDIA

NVIDIA — 🇺🇸 AI算力之王，全球最值钱公司

🌍 美国 ⚡ 算力层 GPU/AI芯片 CUDA 5.5万亿美元 Blackwell/Rubin

简介

NVIDIA是全球AI算力基础设施的绝对霸主，2026年5月市值突破5.5万亿美元，是人类历史上最值钱的公司。FY2026全年营收$2159亿美元（净利$1201亿），数据中心业务占比超90%。GPU占据全球AI训练/推理市场~80%份额，CUDA开发者超400万。从游戏显卡公司转型为"AI计算公司"，正从芯片供应商升级为全栈AI平台——自研CPU、网络交换、AI模型、物理仿真平台，打造从芯片到数据中心的垂直整合帝国。

成立时间	1993年
总部	美国圣克拉拉
CEO/创始人	黄仁勋 (Jensen Huang)
官网	https://www.nvidia.com
股票代号	NVDA (NASDAQ)
员工数	~50,000人 (2026)

📊 核心财务数据（FY2026，截至2026年1月）

全年营收	$2159亿（约¥1.56万亿），同比+114%
净利润	$1201亿，净利润率56%
Q4 FY2026营收	$681亿（超指引$30亿），同比+73%，环比+20%
数据中心收入	$1937亿（全年），占总收入90%+
— GPU/CPU	Q4达$513亿，同比+58%
— 网络硬件	Q4达$110亿，同比+263%（NVLink + Spectrum-X驱动）
游戏业务	仅占总收入11.45%，已非核心
供应链承诺	从Q3的$503亿飙升至Q4的$952亿
市值	~$5.5万亿（2026年5月），人类首家达此高度的公司
Q1 FY2027指引	$780亿，远超市场预期

📌 黄仁勋名言："In this new world of AI, compute is revenues."（在这个AI新时代，算力就是收入。）NVIDIA预计2026-2027年Blackwell+Rubin系列数据中心总销售额可达$1万亿。

🖥️ AI GPU路线图

NVIDIA保持"一代架构+一代增强"的两年一迭代节奏，加速周期从2年压缩至1年：

Hopper (H100/H200) — 2022/2024
800亿晶体管，H100 (80GB HBM3) → H200 (141GB HBM3e)。PyTorch原生支持，AI训练市场绝对主力，已累计出货数百万片。

Blackwell (B200) — 2024年发布，2025年大量出货
2080亿晶体管，双die封装，20 PFLOPS FP4。B200 $30,000-40,000/片。2025年出货约520万片，排期到2026年中，积压360万片订单。

Blackwell Ultra (B300/GB300) — 2026年1月量产
288GB HBM3e，8 TB/s带宽，15 PFLOPS FP4/芯片。GB300 NVL72机架系统。企业价$40,000-50,000/片。云上现货$2.45/h，专用$6.80/h。专为推理时扩展（long thinking）设计，推理需求可提升100x。

Rubin (R100) + Vera CPU — 2026年H2交付
3360亿晶体管（单GPU），HBM4 288GB，22 TB/s带宽，50 PFLOPS。含7种芯片、5套机架系统。自研Vera CPU（88核Arm架构）。NVLink 6（单GPU 3.6 TB/s）。NVL72机架250kW。MoE推理token成本比Blackwell降低10倍，MoE训练GPU数减少4倍。2026年预计出货570万片。

Rubin Ultra — 2027年H2
4计算die封装，100 PFLOPS FP4，1TB HBM4e，NVL576 "Kyber"机架600kW。

Feynman — 2028年（已纳入路线图）
NVIDIA首次将路线图延伸到Rubin之后的下一代架构。

🔧 技术护城河 — CUDA生态

开发者数量	400万+（2025年），全球GPU编程事实标准
核心库	cuBLAS（线性代数）、cuDNN（深度学习）、TensorRT（推理优化）、NCCL（多卡通信）
框架集成	PyTorch、TensorFlow、JAX、DeepSpeed等主流框架深度绑定CUDA
生态壁垒	训练在CUDA栈上完成，推理迁移到其他平台需重写底层op，代价极高
竞争威胁	AMD ROCm、Intel oneAPI、OpenAI Triton语言正逐步蚕食，但CUDA存量巨大

📌 $260亿开放模型赌注：NVIDIA规划未来5年投资$260亿开发开源AI模型（Nemotron系列），类似于Android之于Google的策略——让所有开发者在NVIDIA硬件上构建、调优和运行开源模型，进一步锁定CUDA生态。

🌐 网络与互联

NVLink 6	GPU间高速互联，单芯片带宽3.6 TB/s（第五代1.8 TB/s→第六代翻倍）。NVL72机架总带宽260 TB/s。
NVSwitch	GPU全互联交换芯片，支撑NVL72/576机架系统。
Spectrum-X以太网	面向AI工厂的专用以太网平台，含Spectrum交换机+SuperNIC。性能比标准以太网提升1.6x，支持超10万GPU集群。Meta、Oracle已采用。Q4网络收入$110亿（+263% YoY）。
Quantum InfiniBand	高端HPC/AI网络，用于超大规模训练集群。
Spectrum-X Photonics	共封装光学交换机（SN6800/SN6810），解决AI工厂功耗和带宽瓶颈。

🧠 开源AI模型家族（2026 CES发布）

NVIDIA正从纯芯片公司向AI平台公司转型，CES 2026一次性发布5大开源模型系列：

Nemotron	面向AI Agent的128B参数开源模型，对标GPT-OSS；规划5年$260亿投资
Cosmos 3	世界基础模型（World Foundation Model），统一合成世界生成、视觉推理与动作模拟，加速物理AI
Alpamayo	面向自动驾驶L4的模型系列，自主驾驶系统开发
Isaac GR00T N	人形机器人通用基础模型，含认知+控制，支持合成数据训练
Clara	生物医学AI模型系列

🤖 物理AI与机器人

Omniverse	数字孪生/3D仿真平台，用于AI工厂仿真（Omniverse DSX）、机器人训练、自动驾驶仿真
Isaac Sim/Lab	机器人仿真与训练框架
Jetson AGX Thor	边缘AI/机器人计算平台，机器人机载计算机
GR00T-Mimic/Dreams	合成数据生成流水线，机器人技能学习
Physical AI Data Factory	GTC 2026发布的物理AI数据工厂蓝图，含世界建模、人形技能、自动驾驶

🚗 自动驾驶

Drive AGX	车载AI计算平台
Alpamayo	L4自动驾驶模型（CES 2026发布），黄仁勋称其为"自动驾驶的ChatGPT时刻"
Drive Sim	自动驾驶仿真测试平台

🎮 GeForce RTX 50系列（消费级GPU）

RTX 5090	旗舰，GB202核心，32GB GDDR7，$1,999，2025年1月发布
RTX 5080	高端，16GB GDDR7
RTX 5070 Ti / 5070	中高端
RTX 5060 Ti / 5060 / 5050	中低端，覆盖全价位段

消费级GPU收入仅占总收入11.45%，游戏不再是NVIDIA核心驱动力。

💼 企业软件与云

DGX Cloud	NVIDIA托管的AI训练云服务，按租期出租DGX SuperPOD集群
DGX SuperPOD	企业级AI超级计算机参考架构
DGX Spark	桌面级AI超级计算机（CES 2026发布）
AI Enterprise	企业AI软件套件，含容器化推理微服务（NIM）
BlueField-4 DPU	数据处理单元，卸载虚拟化/存储/网络，加速数据中心

⚔️ 竞争格局

AMD Instinct	MI300X（192GB HBM3），ROCm生态追赶中，但NVIDIA份额仍～80%
Google TPU v7	自研ASIC，2026年向云客户开放，推理性价比优势
自研芯片	微软Maia、亚马逊Trainium2、Meta MTIA——云巨头"去NVIDIA化"长期趋势
中国替代	华为昇腾910B、寒武纪思元——受美国出口管制推动，但生态差距巨大

📌 关键风险：NVIDIA AI加速器收入份额从2024年峰值87%预计降至2026年75%——但绝对值继续增长（TAG增长快于份额侵蚀）。CUDA生态仍是最深护城河。

🔮 战略展望

📈 $1万亿营收机会：Blackwell+Rubin两代数据中心芯片总销售额预计达$1万亿（2026-2027）
🏭 AI工厂化：NVIDIA不再只是GPU公司——正通过"芯片+网络+系统+软件+模型"全栈锁定AI基础设施
🤖 物理AI：黄仁勋认为机器人/自动驾驶是下一波AI浪潮，NVIDIA正提前布局
🔓 开源模型战略：$260亿开源AI投资，效仿Android模式扩大CUDA生态，长期锁定开发者
⚡ AI推理时代：推理计算需求已超越训练，NVIDIA的推理优化（TensorRT、动态稀疏）成为新增长引擎
🇨🇳 中国市场：受出口管制影响，向中国销售合规降规版（H20等），黄仁勋2026年5月随特朗普访华
🤝 OpenAI $1000亿交易：接近与OpenAI达成最终合作，Stargate超级计算机项目