CMU-cs445:数据存储表示

数据表示

涉及浮点数和定点数的存储,不同的是我们需要更多的信息去记录浮点数,包括字符串形式的数据以及其他辅助信息,运算过程为字符串相加相乘类似。

大数据表示

当需要存储的数据大于单页大小,有以下解决方案
- overflow page:存储指向overflow page的指针,如果仍然无法全部存储,就形成链表结构。通常比较难以维护,包括overflow page上的元信息。
- 外部存储:数据库存一个文件路径。缺点是无法受到数据库保护。

catalogs

存储表,列,索引,视图,用户,权限,内部的统计信息等

workload

- OLTP(On-line Transaction Processing)
    简单查询,每次读取或者更新数据库中很小一部分数据

-  OLAP(On-line Analytical Processing)
复杂查询,常常读取分析大批量数据

tuple存储形式

- N-array tuple以行的形式存储
    - 优点:插入更新删除快,对需要整个tuple的查询友好
    - 缺点:对于全表扫描或者tuple一部分字段的查询不友好
- Column store:每页存储相同字段的值。
    - 优点:可以对数据进行压缩,降低字段查询时的系统io。
    - 缺点:小数据的增删改查比较费时