🧠 AI知识库

人工智能产业链与技术栈全景图 v0.2.0 · 2026-05-14

Triton Inference Server

NVIDIA Triton推理服务器

🌍 海外 🚅 推理部署 云端推理服务

简介

NVIDIA开源的企业级多框架推理服务器,支持TensorRT、ONNX Runtime、PyTorch、TensorFlow等多种后端同时部署。提供动态批处理、模型并发、模型流水线和GPU多实例等生产特性。是云原生AI推理基础设施的核心组件,支持Kubernetes部署。

发布/成立2018美国
官网https://developer.nvidia.com/triton-inference-server