关系图
基本概念和术语
- 数据:是信息的载体,是描述客观事物的属性的数、字符以及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。
- 数据元素: 数据元素是数据的基本单位,通常作为一个整体进行考虑和处理。一个数据元素可由若干个数据项组成,数据项是构成数据元素不可分割的最小单位。例如,学生记录就是一个数据元素,它由学号、姓名、性别等数据项组成。
- 数据对象: 数据对象是具有相同性质的数据元素的集合,是数据的一个子集。例如,整数数据对象是集合N={0,+-1,+-2,...}
- 数据类型: 数据类型是一个值的集合和定义在此集合上一组操作的总称。包含{原子类型:不能再分、结构类型:可在分解为若干成分、抽象数据类型}
- 数据结构: 在任何问题中,数据元素都不是孤立存在的,而是他们之间存在着某种关系,这种数据元素相互之间的关系称为结构。数据结构是相互之间存在一种或多种特定关系的数据元素的集合。数据结构包括三方面的内容:逻辑结构、存储结构和数据的运算。数据的逻辑结构和存储结构是密不可分的两个方面,一个算法的设计取决于所选定的逻辑结构,而算法的实现依赖于所采用的存储结构。
数据结构三要素
-
集合: 结构中的元素之间除了“同属于一个集合”的关系外,别无其他关系。
-
线性结构: 结构中的元素只存在一对一的关系。
-
树形结构: 结构中的数据元素之间存在一对多的关系。
-
图状或网状结构: 结构中的数据存在多对多的关系。
-
数据的存储结构是指数据结构在计算机中的表示(又称为映像),也称为物理结构。它包括数据元素表示和关系的表示。数据的存储结构是逻辑结构用计算机语言的实现,它依赖于计算语言。数据的存储结构主要有:顺序存储、链式存储、索引存储、散列存储。
-
顺序存储: 把逻辑上相邻的元素存储在物理位置上也相邻的存储单元里,元素之间的关系由存储单元的邻接关系来体现。其优点是可以实现随机存取,每个元素占用最少的存储空间;缺点是只能使用相邻的一整块存储单元,因此可能产生较多的外部碎片。
-
链接存储: 不要求逻辑上相邻的元素在物理位置上也相邻,借助指示元素存储地址的指针表示元素之间的逻辑关系。其优点是不会出现碎片现象,充分利用所有存储单元;缺点是每个元素因存储指针而占用额外的存储空间,并且只能实现顺序存取。
-
索引存储: 在存储元素信息的同时,还建立附加的索引表。索引表中的每一项称为索引项,索引项的一般形式是:(关键字,地址)。其优点是检索速度快;缺点是增加了附加的索引表,会占用较多的存储空间。另外,在增加和删除数据时要修改索引表,因而会花费较多的时间。
-
散列存储: 根据元素的关键字直接计算出钙元素的存储地址,又称为Hash存储。其优点是检索、增加和删除节点的操作都很快;缺点是如果散列函数不好可能出现元素存储单元的冲突,而解决冲突会增加时间和空间开销。