这是一个提供LLM推理服务的Docker镜像。
它基于VLLM,一个高效的LLM推理引擎,旨在提供快速、低延迟的LLM服务。
该镜像包含了运行VLLM所需的所有依赖项,方便用户快速部署和使用。
docker.io/dustynv/vllm:0.7.4-r36.4.0-cu128-24.04