TVList查询拷贝及排序优化

1.问题

目前每次查询内存中的数据时，需要将tvlist拷贝并排序，排序后的结果并不放回memtable，多个查询可能反复排序某一个tvlist，存在较大的性能损失，关键代码如下所示：

```

// 拿到tvlist 
IWritableMemChunk memChunk = memTableMap.get(deviceId).get(measurement);
// 拷贝
TVList chunkCopy = memChunk.getTVList().clone();
// 排序
chunkCopy.sort();

// 注意，排序后的tvlist没有放回memtable，意味着下次查询还需要重新排序
chunkCopy.setDeletionList(deletionList);
return new ReadOnlyMemChunk(measurement, dataType, encoding, chunkCopy, props, getVersion());
```

2.目标

（1）减少查询排序tvlist的开销

（2）减少查询拷贝已排序的tvlist的开销

3.方案

针对上述两个目标，制定如下解决方案：

（1）将某查询排序后的tvlist放回memtable中，这样下一次查询如果tvlist中新写入的数据是顺序的，则不需要排序，如果存在乱序，现有Timsort方式也可以在前半部分有序的情况下节省排序的CPU开销。

（2）使用写时复制的思想（在这里就是排序时复制，因为只有排序会改变tvlist中旧的数据）。对已排序的tvlist进行引用计数，当下次查询到来时，如果数据有序，则不需要拷贝tvlist，直接使用引用进行查询即可；当查询或flush需要排序时，再拷贝一份tvlist进行排序，原有进行中的查询引用的tvlist并不改变。

4.测试

（1）正确性测试：CI + Session 并发读写测试

（2）性能测试：benchmark读写并发测试

Space shortcuts

Page tree

2 Comments

Richard Yuan

Kaifeng Xue