对于缓存和数据本身,维护缓存一致性共有以下几种方式:
- 先删缓存,再更新数据库数据
- 此时可能会出现更新还未完成的情况,此时
- 先更新数据库,再更新缓存
- 当更新数据库后,若缓存未更新,可能会读到旧数据
为什么是删除缓存,而不是更新缓存?
如果数据库更新了一千次,那缓存也需要更新对应的次数,但是在这个时间段内,并不会有这么多次读取该缓存,因此我们选择更新而不是缓存。等到需要访问数据时,去添加缓存。
也可以为缓存设置过期时间
客户端缓存
在客户端缓存每个device对应的partitionGroup的leader,减少集群节点内部的转发次数
对应的endpoint保存在rpc调用的返回值TSStatus中
客户端缓存相关的文档
Map<DeviceIdMap<设备全路径, Endpoint>
客户端缓存不需要保证一致性,因为无法
数据分区表缓存
数据分区表缓存在每个Datanode,用于缓存保存时间分片的物理节点。数据分区表缓存在查询和写入过程中都需要用到,若无缓存,则需要向ConfigNode请求对应数据分区表项。
数据结构
Map<存储组, Map<设备组, Map<时间段, List<VSG 共识组>>>>
Map<VSG 共识组, List<物理节点>>
更新方式
实时负载均衡:某节点上压力过大,需要进行设备组的迁移
构建DataPartitionrRequest向ConfigNode申请数据分区表项,通过一次rpc(confignode不需要同步)
删除存储组(缓存失效)
负载均衡(缓存失效)
...