该镜像用于运行MultiPL-E评估任务,包含执行评估所需的环境、测试用例及依赖工具,可帮助用户在不同环境中便捷复现MultiPL-E基准测试的评估结果。
ghcr.io/nuprl/multipl-e-evaluation:v3.1