我们需要表示的数据
- Internal Mata-data
- Core data storage
- Temporary Data Strutures
- Table Indexs
hash function
- XXHash
- CityHash
- FarmHash
哈希算法
- 开放地址法
- robin 开放地址
- cuckoo hashing
- 链表法
- extendible hashing(有些复杂)
- Linear hashing(循环拆分,有点难以理解)
B+树
- 为什么叶子结点的key和value不放在一起?
为了cpu缓存,能够快速定位key。
索引
- 部分索引
- 覆盖索引
- 聚集索引
- Include Columns:在建立索引的时候增加一些额外信息,能够加速查询。
- 函数式/表达式索引
- trie index
- radix tree的垂直压缩
- 倒排索引