Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

  1. 需要将数据装箱,内存利用率较低。以int类型为例,需要先装箱为TsPrimitiveType,再装箱为TsPrimitiveType数组,内存占用为实际内存占用的3倍,会导致一个Chunk太小,影响写入性能。
  2. 不能复用ArrayPool管理内存



方案2行式存储优点:方案2列式存储优点:


  1. 节省对象装箱,节省内存占用
  2. 可复用现有的PrimitiveArrayPool管理数组
  3. 排序时可通过排rowIndex,节省排序开销

...

  1. 需要编码解码来读取数据,效率低下
  2. 不能复用ArrayPool管理内存
  3. 对空值不友好
  4. 对TEXT类型的数据不友好,需要找到bytes 中对应的Offset和length来读取中对应的offset和length来读取


四、实验验证

 

1.目标

比较行式和列式存储在排序和遍历功能上的时间开销,以及存储的性能开销

...