docker.io/nickoptimal/gpustack-vllm-gfx906-ray-smart-retry

该Docker镜像 docker.io/nickoptimal/gpustack-vllm-gfx906-ray-smart-retry 包含了针对 AMD GFX906 GPU 架构优化的 vLLM (大型语言模型)推理服务。它使用了 Ray 库进行分布式计算,并集成了智能重试机制,以提高模型推理的稳定性和效率。

下载:1 版本:1