Apache Kylin : Analytical Data Warehouse for Big Data
Page History
...
Cube Planner 通过两种算法计算构建收益比并推荐出 Recommend Cuboid List:贪心算法和基因算法,选择哪一种算法取决于静态规则设置之后的 Cuboid 个数。
- Cuboid Count <= 2X ,跳过 Cube Planner,使用静态规则剪枝优化之后的 Cuboid List 构建 Cube
- 2X < Cuboid Count < 2Y ,使用贪心算法推荐 Recommend Cuboid List
- 2Y <= Cuboid Count ,使用基因算法推荐 Recommend Cuboid List
参数 | 代替为 | 默认值 | 参数级别 |
---|---|---|---|
kylin.cube.cubeplanner.algorithm-threshold-greedy | X | 8 | Cube |
kylin.cube.cubeplanner.algorithm-threshold-genetic | Y | 23 | Cube |
- Cuboid Count <= 2X ,跳过 Cube Planner,使用静态规则剪枝优化之后的 Cuboid List 构建 Cube
- 2X < Cuboid Count < 2Y ,使用贪心算法推荐 Recommend Cuboid List
- 2Y <= Cuboid Count ,使用基因算法推荐 Recommend Cuboid List
下面通过一个例子详解贪心算法。
假设原始数据中有4列:ABCM,ABC 表示 3 个维度,M 表示度量,对于维度 ABC 来说,有 27 行不重复的数据,如下图所示:
...
Hive 表及 System Cube 的更多介绍请查看 System Cube Introduction_CN。
3. Tips about
...
Cuboid Pruning optimization
3.1 How to debug the calculation process of Cube Planner algorithm ?
...
Overview
Content Tools
ThemeBuilder
Apps