THIS IS A TEST INSTANCE. ALL YOUR CHANGES WILL BE LOST!!!!

Apache Kylin : Analytical Data Warehouse for Big Data

Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Cube Planner 通过两种算法计算构建收益比并推荐出 Recommend Cuboid List:贪心算法和基因算法,选择哪一种算法取决于静态规则设置之后的 Cuboid 个数。

  • Cuboid Count <= 2X ,跳过 Cube Planner,使用静态规则剪枝优化之后的 Cuboid List 构建 Cube
  • 2X < Cuboid Count < 2Y ,使用贪心算法推荐 Recommend Cuboid List
  • 2Y <= Cuboid Count ,使用基因算法推荐 Recommend Cuboid List
参数代替为默认值参数级别
kylin.cube.cubeplanner.algorithm-threshold-greedy X8Cube
kylin.cube.cubeplanner.algorithm-threshold-geneticY23Cube
  • Cuboid Count <= 2X ,跳过 Cube Planner,使用静态规则剪枝优化之后的 Cuboid List 构建 Cube
  • 2X < Cuboid Count < 2Y ,使用贪心算法推荐 Recommend Cuboid List
  • 2Y <= Cuboid Count ,使用基因算法推荐 Recommend Cuboid List

下面通过一个例子详解贪心算法。

假设原始数据中有4列:ABCMABC 表示 3 个维度,M 表示度量,对于维度 ABC 来说,有 27 行不重复的数据,如下图所示:

...

Hive 表及 System Cube 的更多介绍请查看 System Cube Introduction_CN

3. Tips about

...

Cuboid Pruning optimization

3.1 How to debug the calculation process of Cube Planner algorithm ?

...