Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

(1) 总体目标:目前tsfile采用一对一的索引方式,每个tsfile都有一个索引文件TsFileResource,tsfile文件内的信息(开始时间、结束时间等)都保存在TsFileResource中。

由于TsFileResource常驻内存中,当有过多设备的情况下,就会爆内存。本次针对TsFileResouce的改进总目标为可以支持更多的设备。常驻内存中,当设备过多时(几十万量级)内存增长过快,就会爆内存,因此不适用于管理较多活跃设备场景。

本次针对TsFileResouce的改进总目标为可以支持更多的设备,将 resource 中的设备起止时间移出,单独在文件的时间索引模块进行管理,

且可以支持不同实现方式(如每个文件对应一个时间范围索引条目)。每个数据文件在内存中还以 TsFileResource 对象进行管理。


(2) 阶段1目标 —— 接口化:区分【文件句柄TsFileResource】【文件索引TsFileIndex】,将TsFileResource开始时间、结束时间等字段移至TsFileIndex中。

...

二、阶段1详细设计:新增和修改的数据结构

具体而言,涉及到数据结构如下:

1. TsFileIndex DeviceFileIndex (后续“实现”的全部修改仅针对 TsFileIndex)

...

Map<String, String> cachedDevicePool // for reducing the String number in memory

File file // tsfile

TsFileProcessor processor 【未封口】

ModificationFile modFile // modification file

boolean closed【未封口】

boolean deleted【未封口】

boolean isMergingSet<Long> historicalVersions // for tracking the merge history of a TsFile

TsFileLock tsFileLock

List<ChunkMetadata> chunkMetadataList // 【未封口】chunk metadata list of unsealed tsfile. Only be set in a temporal TsFileResource in a query process.

List<ReadOnlyMemChunk> readOnlyMemChunk // 【未封口】mem chunk data. Only be set in a temporal TsFileResource in a query process.

TimeseriesMetadata timeSeriesMetadata // 【未封口】get TimeseriesMetadata of unsealed file

List<TsFileResource> upgradedResources // 【升级】generated upgraded TsFile ResourceList used for upgrading v0.9.x/v1 -> 0.10/v2

UpgradeTsFileResourceCallBack upgradeTsFileResourceCallBack // 【升级】load upgraded TsFile Resources to storage group processor used for upgrading v0.9.x/v1 → 0.10/v2

boolean isSeq // 【升级】indicate if this tsfile resource belongs to a sequence tsfile or not used for upgrading v0.9.x/v1 -> 0.10/v2

TsFileResource originTsFileResource // 【未封口】current tsfile resource is a snapshot of the originTsFileResource. When we want to used the lock, we should try to acquire the lock of originTsFileResource

long maxPlanIndex // for cluster, max index of plans executed within this TsFile

long minPlanIndex // for cluster, min index of plans executed within this TsFile

...