🧠 AI知识库

人工智能产业链与技术栈全景图 v0.2.0 · 2026-05-14

🚅 推理部署

Inference & Deployment

将训练好的模型部署到生产环境。ONNX Runtime提供跨平台推理,TensorRT是NVIDIA生态的推理优化器,OpenVINO针对Intel硬件优化。云端的Triton Inference Server和自托管的Ollama覆盖了不同部署场景。

平台/工具(7项)