第7章 数据库技术基础
- 数据库系统与文件系统的区别是:对于应用程序的高度独立性,数据的充分共享性,和操作方便性。
- 数据模型的三要素是:数据结构,数据操作以及数据的约束条件。
- 关系模型与网状模型层次模型的最大差别是用主码而不是用指针导航数据,用户只须使用简单的查询语句就可以对数据库进行操作,无须涉及存储结构和访问技术等细节。
- DML分为宿主型和自含型两类。宿主型是指把DML语句嵌入某种主语言(C、COBOL等)中使用。自含型是指可以单独使用的DML语句,供用户交互使用。
- 描述概念模式的数据定义语言称为schema DDL。
- 用户使用数据操纵语言DML对数据库进行操作,实际上是对外模式的外部记录进行操作。
- 数据的物理独立性是指当数据库的内模式发生改变时,数据的逻辑结构不变。
- 数据的逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。
- 并行体系结构的数据库系统由多个物理上连在一起的CPU组成,而分布式系统的各个CPU在地理上是分开的。
- 事务的ACID性质:原子性(atomicity),一致性(consistency),隔离性(isolation)和持久性(durability)。
- 并发控制的主要技术是封锁,分为排他锁(写锁)和共享锁(读锁)。
- 数据仓库,由此得到一个事实表,多维表以及从事实表到多维表的参照外码的模式称为星状模式。
- 更复杂的含有多级维表。。。雪花模式。
- 含有不止一个事实表。。。事实星状模式。
- 数据仓库通常含有3层体系结构。底层为数据仓库数据库,中间层为OLAP服务器,顶层为前端工具。
- 将数据挖掘工具与传统数据分析工具进行比较,可以发现传统数据分析工具的分析重点在于向管理人员提供过去已经发生了什么,描述过去的事实。而挖掘工具则在于挖掘预测未来的情况,解释过去所发生的事实的原因。
第8章 关系数据库
- 关系的完整性共分为3类:实体完整性、参照完整性(引用完整性)和用户定义完整性。
- 一般连接是从关系的水平方向运算,而自然连接不仅要从关系的水平方向,而且要从关系的垂直方向运算。因为自然连接要去掉重复属性,如果没有重复属性,那么自然连接就变成笛卡尔积。
- 外连接运算是连接运算的扩展,可以处理缺失的信息。外连接运算有三种:左外连接,右外连接和全外连接。
- 元组演算和域演算直接跳过了,感觉偏课本。
- 优化的准则
- 提早执行选取运算。
- 合并乘积与其后的选择运算为连接运算。
- 将投影运算与其后的其他运算同时进行,以避免重复扫描关系。
- 将投影运算和其前后的二目运算结合起来,使得没有必要为去掉某些字段再扫描一遍关系。
- 在执行连接前对关系做适当的预处理,就能快速的找到要连接的元组:索引连接法和排序合并连接法。
- 存储公共子表达式。