🧠 AI知识库

人工智能产业链与技术栈全景图 v0.2.0 · 2026-05-14

📦 模型库与引擎

Model Libraries & Engines

预训练模型库和推理引擎加速了从开发到部署的流程。HuggingFace Transformers是最大的模型库，vLLM是高性能推理引擎的代表，llama.cpp让大模型能在消费级硬件上运行。这一层降低了AI使用门槛。

平台/工具（8项）

模型库

🌍 海外

HuggingFace开源的扩散模型库，提供Stable Diffusion、DALL·E、Imagen等主流图像/视频生成模型的标准化API。内置多种调度器和Pipeline抽象，支持LoRA微调和...

HuggingFace Transformers

全球最大的预训练模型库，提供数十万开源模型和标准化的API接口。支持PyTorch、TensorFlow和JAX后端，覆盖NLP、CV、语音等多模态模型。是AI开发者下载和使用预训练模型的首选平台，极...

推理引擎

🇨🇳 中国

潞晨科技开源的大模型训练加速系统，提供多维并行（数据、张量、流水线和序列并行）的统一抽象。自动并行化降低分布式训练门槛，支持异构算力混合训练。为中小企业提供低成本大模型训练方案，在开源社区有较高关注度...

🌍 海外

微软开源的大模型训练优化库，核心创新是ZeRO（零冗余优化器）分阶段优化显存占用。ZeRO-3可将万亿参数模型分布在数百个GPU上训练。集成混合精度训练、CPU Offload等技术，是训练GPT级别...

NVIDIA开源的大模型分布式训练框架，实现了张量并行、流水线并行、序列并行等高效并行策略。结合DeepSpeed，可以高效训练万亿参数模型。是大多数LLM训练方案的核心参考实现，NVIDIA NeM...

一键式本地大模型运行工具，封装llama.cpp后端，提供类Docker的模型管理体验。支持从命令行拉取、运行和管理开源模型（Llama、Mistral、Gemma等），自动处理量化和GPU加速。极大...

UC Berkeley开源的高吞吐量LLM推理引擎，核心创新是PagedAttention显存管理技术。KV缓存利用率接近100%，相比HuggingFace Transformers推理吞吐量提升最...

量化工具

🌍 海外

纯C/C++实现的高效LLM推理引擎，支持4-bit至8-bit量化，无需Python依赖即可在CPU和Apple Metal GPU上运行大模型。内存占用极低，普通笔记本即可运行7B-70B参数模型...