💎 AI芯片
AI Chips
AI计算的物理底座。NVIDIA GPU (H100/B200) 是训练芯片的事实标准,Google TPU是专用ASIC的代表,AMD MI300在追赶。国产替代方面,华为昇腾910、寒武纪思元、海光深算等正在快速缩小差距。芯片的架构制程和算力密度直接决定了模型能跑多大、跑多快。
平台/工具(10项)
GPU
🌍 海外
AMD Instinct MI300X
AMD面向AI训练推出的数据中心GPU,采用CDNA 3架构和Chiplet设计,集成1530亿晶体管。配备192GB HBM3显存,显存容量超越H100。通过ROCm平台兼容PyTorch生态,是N...
NVIDIA B200
Blackwell架构新一代GPU,双芯片设计集成2080亿晶体管,采用台积电4NP制程。支持FP4精度,AI算力高达20 PFLOPS,是H100的2.5倍以上。配备192GB HBM3e内存,专为...
NVIDIA H100
NVIDIA Hopper架构旗舰GPU,采用4nm制程,集成800亿晶体管与HBM3显存,支持FP8精度和Transformer Engine加速。单卡FP16算力近2000 TFLOPS,是大模型...
TPU/NPU
🇨🇳 中国
ASIC/FPGA
🌍 海外
Cerebras WSE-3
Cerebras推出的第三代晶圆级AI芯片,整片晶圆为一个芯片,集成4万亿晶体管和90万个AI核心。相比传统GPU集群,消除了跨芯片通信瓶颈,单芯片即可训练万亿参数大模型。搭载于CS-3系统,在科研和...
Graphcore IPU
Graphcore推出的智能处理单元,采用MIMD架构与大规模片上SRAM,不同于GPU的SIMD设计。Bow IPU采用台积电3D Wafer-on-Wafer技术,在稀疏计算和图神经网络等场景表现...
Intel Gaudi 3
Intel旗下Habana Labs推出的第三代AI训练加速器,采用5nm制程。内置24个100Gbps RoCE端口实现高效Scale-out互联。BF16算力达1835 TFLOPS,宣称训练性能...
Qualcomm Cloud AI
高通面向云端AI推理推出的专用加速器,采用7nm制程,INT8算力高达350 TOPS。以极低的功耗比(每瓦性能)见长,专注于计算机视觉、自然语言处理等推理工作负载。支持PyTorch和ONNX模型部...