THIS IS A TEST INSTANCE. ALL YOUR CHANGES WILL BE LOST!!!!

Apache Kylin : Analytical Data Warehouse for Big Data

Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

2. 为避免 kylin 启动脚本 kylin.sh 中将 hadoop lib 目录下的所有 jar 包都加入 classpath,对 hadoop lib 下的 jar 包做整理和筛选,并将需要的 jar 包 copy 到 $SPARK_HOME/jars 目录下;目录下(仅当 $SPARK_HOME 路径为 $KYLIN_HOME/spark 时);

2. 继承 IHiveClient 接口实现 SparkHiveClient 类,使用 SparkSession 实现其中的方法;

3. 将 Kylin 4.0 中使用到原有 CLIHiveCLient/BeelineHiveClient 类的地方均替换为使用 SparkHiveClient 类;

5. 清理相关无用代码。


代码完成后,在 kylin4 支持的各个环境中进行兼容性测试,主要测试构建、查询和 load hive table。最终在以下环境通过测试:

Hadoop DistributionSparkHadoopHiveCluster Manager

Distributed Filesystem

Verified ?Comment
CDH 5.72.4.7/3.1.12.6.0-cdh5.7.61.1.0-cdh5.7.6YARNHDFS
  •  verified
无需额外步骤
HDP 2.42.4.72.7.1.2.4.0.0-161.2.1000.2.4.0.0-16YARNHDFS
  •  verified
无需额外步骤
AWS EMR 5.33.02.4.7/3.1.1

2.10.1-amzn-1

Hive 2.3.7-amzn-4

YARNHDFS/S3
  •  verified
无需额外步骤
CDH 6.2.02.4.7/3.1.13.0.0-cdh6.2.02.1.1-cdh6.2.0YARNHDFS
  •  verified
需要准备jar包放在指定目录:Deploy Kylin 4 on CDH 6
AWS EMR 6.3.03.1.1

3.2.1-amzn-3

3.1.2-amzn-4YARNHDFS/S3
  •  verified
无需额外步骤
Apache3.1.13.2.02.3.9YARN, StandaloneS3
  •  verified
http://kylin.apache.org/docs40/install/deploy_without_hadoop.html