该镜像用于部署文本嵌入推理服务,支持多种预训练文本嵌入模型(如Sentence-BERT系列、BERT等),可将输入文本转换为高维向量表示,适用于语义检索、文本相似度计算、文本聚类等自然语言处理任务场景。它具备高效的推理性能,支持批量处理与低延迟响应,便于集成到各类应用系统中提供文本嵌入服务。
docker.io/infiniflow/text-embeddings-inference:cpu-1.8
docker.io/infiniflow/text-embeddings-inference:1.8