这是一个用于KServe的推理服务镜像,包含了QP-Ext模型的部署和服务所需的一切。QP-Ext是一个高效的模型推理框架,能够优化模型的性能和资源利用率。该镜像简化了在KServe上部署和运行QP-Ext模型的过程。
docker.io/kserve/qpext:v0.15.0