这是一个基于OpenEuler操作系统的虚拟大语言模型 (LLM) CPU镜像。它包含了运行VLLM (一个高效的LLM推理服务)所需的所有依赖项,可以在CPU上运行各种大型语言模型。
docker.io/openeuler/vllm-cpu:0.6.3-oe2403lts