目标

...

新策略：

目标（解决1-5）

无需在有无乱序数据时分开配置

...

避免设置活跃的 partition 个数
考虑 PrimitiveArrayPool 内存占用
尽量有效利用内存，使 Chunk 尽量大

尽量保证创建元数据成功，为保证内存不爆，可以拒绝写入
尽量在有无乱序情况下，iotdb参数不需要变化都能很好适应

让chunk大小最大化

尽量不阻塞写入
尽量不加入固定参数

...

写入流程各部分内存统计

RPC模块

一次请求的大小受限制 bthrift_max_frame_size=67108864.（防止许用户一条SQL写入1亿个点等场景；或者写了一个大于2GB的bytes[]).
并发数受限制 c。

内存写入模块：

优点：

所有SG共享内存，不再对每个SG单独设置一个内存上限，因此创建序列（或今后改为序列活跃情况变化）时也不需要再更新SG；好处是内存利用率可以很高；

缺点：

部分步骤需要全局锁；目前看，假设array为k，SG info 写x延迟上报，则个memTable写入16MB后，会拿一次全局锁更新全局内存情况。

rpc_max_concurrent_client_num=65535。

核心思想：

Schema和历史resource单独分配大小；下文仅考虑其余写数据部分大小。
每个SG统计自身的chunk_metadata和unseal_resource大小；
全局ArrayPool统计buffered和out of buffer的array大小
系统统计总的大小

数据写入流程

写入线程：

如果是非空的写入线程
- 在 StorageEngine 中检查SystemInfo是否为reject状态；如果是，则该写入线程循环sleep 50ms（等待flush线程释放内存，system置回正常状态）再进行写入；如果等待max_waiting_time_when_insert_blocked后仍为reject状态，抛出写入异常；
- 进入对应的StorageGroupProcessor，获取 writeLock
- 进入对应分区的 TsFileProcessor：（1）获取已有的可写入的顺序或乱序 TsFileProcessor（2）如果没有可写入的TsFileProcessor，创建新的 TsFileProcessor
  - 统计当前写入计划新增的内存占用，增加至TspInfo和SgInfo中：（1）新测点增加 chunk_metadata（2）TEXT 类型数据（3）TVList 中增加的 PrimitiveArray（4）flush内存
  - 如果 SGInfo 增量超过阈值（storage_group_size_report_threshold=16M）
    - 向SystemInfo进行上报（将当前 TsFileProcessor 传入）；
      synchronized(SystemInfo) {
      - 更新 SystemInfo 内存占用。
      - 如果 SystemInfo 内存占用 < 总写入内存 * flush_proportion，返回 true。
      - 如果总写入内存 * flush_proportion ≤ SystemInfo 内存占用 < 总写入内存 * reject_proportion, 执行 选择Memtable提交flush流程，返回 true。
      - 如果总写入内存 * reject_proportion ≤ SystemInfo 内存占用, SystemInfo 置为 reject 状态，执行 选择Memtable提交flush流程，记返回值为 flag
        如果 flag = true
        如果 SystemInfo 内存占用 < 总写入内存，则返回 true
        如果 SystemInfo 内存占用 ≥ 总写入内存，直接抛写入Reject 异常
        如果 flag = false，则返回 false
        }
    - 判断 向SystemInfo上报 的返回结果
      - 如果返回 false，则该写入线程循环 sleep (50ms) ，检查 SystemInfo 的 reject 状态如果不 reject或者该memtable被标记为shouldFlush，执行正常写入。如果等待 max_waiting_time_when_insert_blocked 后仍为reject状态，抛出写入异常
      - 如果返回 true，则执行正常写入
      - 如果捕获到写入Reject 异常，reset SystemInfo，并继续向上抛
  - 检查 workingMemtable 的 shouldFlush，如果为true，提交 Flush 任务，并根据文件大小判断是否需要 close。
- StorageGroupProsessor. 释放writeLock
如果是空的写入线程
- 进入对应的 StorageGroupProcessor，获取 writeLock
- 获取对应分区的 TsFileProcessor：如果（其 workingMemtable 不为空且 shouldFlush 为 true），则提交 flush 任务；否则直接返回。
- StorageGroupProsessor. 释放writeLock

...

一个insertPlan写入完成后，检查该TSP的 workingMemtable 的 shouldFlush 字段，如果为 true，再检查是否TsFile大小超过阈值，如果超过，flush memtable后将文件封口。
TsFile关闭完成后，清空该TSPInfo，重置对应的 SGInfo 状态，并向SystemInfo报告重置后SGInfo
如果此时SystemInfo 为reject状态且 `SystemInfo中统计的总内存 < 总写入内存 * reject_proportion`，将SystemInfo 置于正常状态

MTree内存控制：

注册时间序列时，如果总时间序列个数*estimate_series_size > 总内存*write_read_schema_free_memory_proportion:schema，此时拒绝注册，抛出异常。

Space shortcuts

Page tree

Versions Compared

Old Version 19

New Version 20

Key

目标

写入流程各部分内存统计

RPC模块

数据写入流程

相关参数整理

Space shortcuts

Page tree

Page History

Versions Compared

Old Version 19

New Version 20

Key

目标

写入流程各部分内存统计

RPC模块

数据写入流程

相关参数整理