查询基础介绍

顺序和乱序 tsFile 文件

在对某一个设备插入数据的过程中，由于插入数据的时间戳的特点会产生顺序和乱序的 tsFile 文件。如果我们按照时间戳递增的顺序插入数据，那么只会产生顺序文件。顺序数据被写入到磁盘后，一旦新写入的数据时间戳在顺序文件的最大时间戳之前则会产生乱序文件。

IoTDB 会将顺序和乱序文件分开存储在 data/sequence 和 data/unsequence 文件目录下。在查询过程中也会对顺序和乱序文件中的数据分别进行处理，我们总会使用QueryResourceManager.java中的getQueryDataSource()方法通过时间序列的全路径得到存储该时间序列的顺序和乱序文件。

读取 TsFile 的一般流程

TsFile 各级结构在前面的 TsFile 文档中已有介绍，读取一个时间序列的过程需要按照层级各级展开 TsFileResource -> TimeseriesMetadata -> ChunkMetadata -> IPageReader -> BatchData。

文件读取的功能方法在 org.apache.iotdb.db.utils.FileLoaderUtils

loadTimeSeriesMetadata()用来读取一个 TsFileResource 对应于某一个时间序列的 TimeseriesMetadata，该方法同时接受一个时间戳的 Filter 条件来保证该方法返回满足条件的 TimeseriesMetadata，若没有满足条件的 TimeseriesMetadata 则返回 null。
loadChunkMetadataList()得到这个 timeseries 所包含的所有 ChunkMetadata 列表。
loadPageReaderList()可以用来读取一个 ChunkMetadata 对应的 Chunk 所包含的所有 page 列表，用 PageReader 来进行访问。

以上在对于时间序列数据的各种读取方法中总会涉及到读取内存和磁盘数据两种情况。

读取内存数据是指读取存在于 Memtable 中但尚未被写入磁盘的数据，例如loadTimeSeriesMetadata()中使用TsFileResource.getTimeSeriesMetadata()得到一个未被封口的 TimeseriesMetadata。一旦这个 TimeseriesMetadata 被刷新到磁盘中之后，我们将只能通过访问磁盘读取到其中的数据。磁盘和内存读取 metadata 的相关类为 DiskChunkMetadataLoader 和 MemChunkMetadataLoader。

loadPageReaderList()读取 page 数据也是一样，分别通过两个辅助类 MemChunkLoader 和 DiskChunkLoader 进行处理。

顺序和乱序文件的数据特点

对于顺序和乱序文件的数据，其数据在文件中的分部特征有所不同。顺序文件的 TimeseriesMetadata 中所包含的 ChunkMetadata 也是有序的，也就是说如果按照 chunkMetadata1, chunkMetadata2 的顺序存储，那么将会保证 chunkMetadata1.endtime <= chunkMetadata2.startTime。

乱序文件的 TimeseriesMetadata 中所包含的 ChunkMetadata 是无序的，乱序文件中多个 Chunk 所覆盖的数据可能存在重叠，同时也可能与顺序文件中的 Chunk 数据存在重叠。

每个 Chunk 结构内部所包含的 Page 数据总是有序的，不管是从属于顺序文件还是乱序文件。也就是说前一个 Page 的最大时间戳不小于后一个的最小时间戳。因此在查询过程中可以充分利用这种有序性，通过统计信息对 Page 数据进行提前筛选。

查询中的数据修改处理

IoTDB 的数据删除操作对磁盘数据只记录了 mods 文件，并未真正执行删除逻辑，因此查询时需要考虑数据删除的逻辑。

如果一个文件中有数据被删除了，将删除操作记录到 mods 文件中。记录三列：删除的时间序列，删除范围的最大时间点，删除操作对应的版本。

Modification 文件

IoTDB 通过为包含数据的 TsFile 写入一个 Modification 文件来完成删除操作。

在 0.11.0 版本的 IoTDB 中对 Modification 文件中的删除记录格式进行了修改，每一行的删除记录包含删除的开始时间和结束时间。对之前版本产生的 Modification 文件依旧可以照常处理，旧的 Modification 文件中只记录一个"deleteAt"时间戳，现在会被视为删除了一个时间戳从 Long.MIN_VALUE 开始到"deleteAt"结束的范围数据。

TimeRange

相应的，TimeRange 结构是删除区间在内存中的表示媒介。

删除操作中所有的 TimeRange 都是闭区间，我们使用 Long.MIN_VALUE 和 Long.MAX_VALUE 表示正负无穷范围。

包含删除区间的查询处理

当对一个 TVList 进行查询的时候，该 TVList 的所有记录的删除区间会预先被排序和合并。例如初始的删除区间为 [1,10], [5,12], [15,20], [16,21]，会被预先处理为 [1,12] and [15,21] 两个区间。这样做的好处在于当删除区间很多的情况下，可以加快排除被删除数据的过程。

具体的说，由于 TVList 中存储的是有序的时序数据，因此使用排序过后的 TimeRange 会有助于筛选出已经被删除的时间戳数据。使用一个标记位来标记 TimeRange 列表中当前遍历到的 TimeRange，由于时间戳是有序的，因此后面的数据不会落在当前 TimeRange 之前的范围之中。下面是一个具体遍历的实例：

private boolean isPointDeleted(long timestamp) {
  while (deletionList != null && deleteCursor < deletionList.size()) {
    if (deletionList.get(deleteCursor).contains(timestamp)) {
      return true;
    } else if (deletionList.get(deleteCursor).getMax() < timestamp) {
      deleteCursor++;
    } else {
      return false;
    }
  }
  return false;
}

查询流程处理 Modification

对于任意的 TimeseriesMetadata,ChunkMetadata 和 PageHeader 都有相应的 modified 标记，表示当前的数据块是否存在更改。由于数据删除都是从一个时间节点删除该时间前面的数据，因此如果存在数据删除会导致数据块统计信息中的 startTime 失效。因此在使用统计信息中的 startTime 之前必须检查数据块是否包含 modification。对于 TimeseriesMetadata，如果删除时间点等于 endTime 也会导致统计信息中的 endTime 失效。

如上图所示，数据修改会对前面提到的 TsFile 层级数据读取产生影响

TsFileResource -> TimeseriesMetadata

// 只要这个时间序列有对应的删除操作，就标记 TimeseriesMetadata 中的统计信息不可用
FileLoaderUtils.loadTimeseriesMetadata()

TimeseriesMetadata -> List<ChunkMetadata>

// 对于每个 ChunkMetadata，找到比其 version 大的所有删除操作中最大时间戳，设置到  ChunkMetadata 的 deleteAt 中，并标记 统计信息不可用
FileLoaderUtils.loadChunkMetadataList()

对于以上示例，读取到的 ChunkMetadataList 为

ChunkMetadata -> List<IPageReader>

// 跳过被完全删除的 Page，将 deleteAt 设置到 PageReader 里，将数据被部分删除的 page 标记统计信息不可用
FileLoaderUtils.loadPageReaderList()

IPageReader -> BatchData

// 对于磁盘数据，跳过被删除的和过滤掉的，对于内存数据，跳过被过滤掉的
IPageReader.getAllSatisfiedPageData()

Space shortcuts

Page tree