ghcr.io/aeon-7/vllm-aeon-ultimate-dflash

这是一个基于vllm框架构建的大语言模型推理优化容器镜像,旨在提供高效的大模型部署与运行能力,集成了相关加速特性以提升推理性能。

下载:0 版本:1