输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
Triton Inference Server 是 NVIDIA 开发的开源推理服务器,支持 TensorFlow、PyTorch、ONNX 等多种框架,可高效部署 AI 模型到 GPU 或 CPU,提供动态批处理、模型并发、版本管理等核心功能,降低生产级推理的复杂度。
近期常被查询的 AI 概念。