这是一个基于 ROCm (Radeon Open Compute Platform) 的 VLLM (Very Large Language Model) Docker 镜像。它针对 AMD GFX908 架构的显卡进行了优化,这意味着它可以在搭载相应显卡的机器上高效运行大型语言模型。
docker.io/btbtyler09/vllm-rocm-gfx908:0.8.3