🧠 AI知识库

人工智能产业链与技术栈全景图 v0.2.0 · 2026-05-14

💎 AI芯片

AI Chips

AI计算的物理底座。NVIDIA GPU (H100/B200) 是训练芯片的事实标准，Google TPU是专用ASIC的代表，AMD MI300在追赶。国产替代方面，华为昇腾910、寒武纪思元、海光深算等正在快速缩小差距。芯片的架构制程和算力密度直接决定了模型能跑多大、跑多快。

平台/工具（10项）

GPU

🌍 海外

AMD Instinct MI300X

AMD面向AI训练推出的数据中心GPU，采用CDNA 3架构和Chiplet设计，集成1530亿晶体管。配备192GB HBM3显存，显存容量超越H100。通过ROCm平台兼容PyTorch生态，是N...

Blackwell架构新一代GPU，双芯片设计集成2080亿晶体管，采用台积电4NP制程。支持FP4精度，AI算力高达20 PFLOPS，是H100的2.5倍以上。配备192GB HBM3e内存，专为...

NVIDIA Hopper架构旗舰GPU，采用4nm制程，集成800亿晶体管与HBM3显存，支持FP8精度和Transformer Engine加速。单卡FP16算力近2000 TFLOPS，是大模型...

TPU/NPU

🇨🇳 中国

华为昇腾910B

华为自研的AI训练NPU芯片，是昇腾910的升级版，FP16算力达320 TFLOPS。采用达芬奇架构，通过CANN软件栈和MindSpore框架构建国产AI生态。在美国制裁背景下，成为中国大模型训练...

寒武纪思元590

寒武纪最新一代云端智能芯片，基于自研MLUarch07架构，采用7nm制程。支持训练和推理，INT8算力高达256 TOPS。适配PyTorch、TensorFlow等主流框架，是中国AI芯片自主替代...

🌍 海外

Google自研第五代张量处理单元，专为AI训练和推理设计的ASIC芯片。v5p版本单Pod可扩展至8960芯片，训练性能较v4提升2倍以上。支持Google Cloud大规模租用，是Gemini大模...

ASIC/FPGA

🌍 海外

Cerebras推出的第三代晶圆级AI芯片，整片晶圆为一个芯片，集成4万亿晶体管和90万个AI核心。相比传统GPU集群，消除了跨芯片通信瓶颈，单芯片即可训练万亿参数大模型。搭载于CS-3系统，在科研和...

Graphcore推出的智能处理单元，采用MIMD架构与大规模片上SRAM，不同于GPU的SIMD设计。Bow IPU采用台积电3D Wafer-on-Wafer技术，在稀疏计算和图神经网络等场景表现...

Intel旗下Habana Labs推出的第三代AI训练加速器，采用5nm制程。内置24个100Gbps RoCE端口实现高效Scale-out互联。BF16算力达1835 TFLOPS，宣称训练性能...

Qualcomm Cloud AI

高通面向云端AI推理推出的专用加速器，采用7nm制程，INT8算力高达350 TOPS。以极低的功耗比（每瓦性能）见长，专注于计算机视觉、自然语言处理等推理工作负载。支持PyTorch和ONNX模型部...