这是一个NVIDIA TensorRT-LLM的发布版本镜像。它包含了TensorRT-LLM运行时库和相关依赖,用于在NVIDIA GPU上加速大型语言模型的推理。
docker.io/nvcr.io/nvidia/tensorrt-llm/release:0.21.0rc0