Apache Gluten是一个开源项目,旨在通过整合列式存储和向量化执行引擎(如Velox)加速Apache Spark SQL的查询性能。它提供与Spark原生API兼容的接口,用户无需修改现有代码即可获得性能提升,支持多种数据格式(如Parquet、ORC)和数据源,帮助降低大数据分析的成本与延迟。
docker.io/apache/gluten:vcpkg-centos-7