M
Megatron-LM
NVIDIA Megatron-LM
简介
NVIDIA开源的大模型分布式训练框架,实现了张量并行、流水线并行、序列并行等高效并行策略。结合DeepSpeed,可以高效训练万亿参数模型。是大多数LLM训练方案的核心参考实现,NVIDIA NeMo框架也基于Megatron-LM构建。
| 发布/成立 | 2019 | 美国 |
| 官网 | https://github.com/NVIDIA/Megatron-LM |
人工智能产业链与技术栈全景图 v0.2.0 · 2026-05-14
NVIDIA开源的大模型分布式训练框架,实现了张量并行、流水线并行、序列并行等高效并行策略。结合DeepSpeed,可以高效训练万亿参数模型。是大多数LLM训练方案的核心参考实现,NVIDIA NeMo框架也基于Megatron-LM构建。
| 发布/成立 | 2019 | 美国 |
| 官网 | https://github.com/NVIDIA/Megatron-LM |