1 数据结构有什么用?
先思考这个问题,假如你开发一个客服电话系统,其中有一个菜单排队模块,功能主要是要设计一张客户排队表,每有一个客户来电,就需要添加记录客户的编号、姓名、电话等信息,并能够实现查询和删除,你将如何设计这张客户排队表?
这时候就要用到数据结构了,一般最先想到的就是使用数组,但是实际数组并不理想,因为要考虑溢出,又要考虑新增(插入)和删除后的数据移动。如果比较熟练掌握数据结构的话,就该想到使用数据结构中的 “队列结构”,很适合这种情况。
2 基本概念和术语
下面介绍一些数据结构中的基本概念和术语。
1. 数据
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。 数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
比如我们现在常用的搜索引擎,一般会有网页、图片、视频等分类。 MP3 就是声音数据,图片当然是图像数据,视频就不用说了,而网页其实指的就是全部数据的搜索,包括最重要的数字和字符等文字数据。
2. 数据元素
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。 也被称为记录。 比如,在人类中,什么是数据元素呀?当然是人了。
3. 数据项
数据项:一个数据元素可以自若干个数据项组成。比如人这样的数据元素,可以有眼、耳、鼻、嘴、 手、脚这些数据项,也可以有姓名、年龄、性别、出生地址、联系电话等数据项,具体有哪些数据项,要视你做的系统来决定。
4. 数据对象
数据对象:是性质相同的数据元素的集合,是数据的子集。
什么叫性质相同呢,是指数据元素具有相同数量和类型的数据项,比如,还是刚才的例子,人都有姓名、生日、性别等相同的数据项。
既然数据对象是数据的子集,在实际应用中,处理的数据元素通常具有相同性质, 在不产生混淆的情况下,我们都将数据对象简称为数据。
好了,有了这些慨念的铺垫,我们的主角登场了。说了数据的定义,那么数据结构中的结构又是什么呢?
5. 数据结构
结构,简单的理解就是关系,比如分子结构,就是说组成分子的原子之间的排列方式。严格点说,结构是指各个组成部分相互搭配和排列的方式,在现实世界中,不同数据元素之间不是独立的,而是存在特定的关系,我们将这些关系称为结构。 那数据结构是什么?
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。 |
为编写出一个 "好" 的程序,必须分析待处理对象的特性及各处理对象之间存在的关系。这也就是研究数据结构的意义所在。
3 逻辑结构与存储结构
按照视点的不同, 我们把数据结构分为逻辑结构和存储结构。
3.1 逻辑结构
逻辑结构:是指数据对象中数据元素之间的相互关系。 逻辑结构分为以下四种:
- 集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。
- 线性结构:线性结构中的数据元素之间是一对一的关系。
- 树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。
- 图形结构:图形结构的数据元素是多对多的关系。
3.2 存储结构
说完了逻辑结构,我们再来说说数据的存储结构(很多书中也叫做物理结构)。
存储结构:是指数据的逻辑结构在计算机中的存储形式。 |
数据元素的存储结构形式有两种:顺序存储和链式存储。
1. 顺序存储结构
顺序存储结构:是把数据元素放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
这种存储结构其实很简单,说白了, 就是排队占位。大家都按顺序排好,每个人占一小段空间,大家谁也别插谁的队,数组就是这样的顺序存储结构。
可实际上,总会有人插队,有人会放弃排队。所以这个队伍当中会添加新元素,也有可能会去掉老元素,整个结构时刻都处于变化中。显然,面对这样时常要变化的结构,顺序存储是不科学的。 这时候就要考虑用到链式存储结构了。
2. 链式存储结构
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。数据元素的存储关系并不能反映其逻辑关系,因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到相关联数据元素的位置。
显然,链式存储就灵活多了,数据存在哪里不重要,只要有一个指针存放了相应的地址就能找到了。
逻辑结构是面向问题的,而物理结构就是面向计算机的,其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。
4 抽象数据类型
4.1 数据类型
数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
数据类型是按照值的不同进行划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能进行的操作。
C 语言中,按照取值的不同,数据类型可以分为两类:
- 原子类型:是不可以再分解的基本类型,包括整型、实型、字符型等。
- 结构类型:由若干个类型组合而成,是可以再分解的。例如,整型数组是由若干整型数据组成的。
4.2 抽象数据类型
抽象是指抽取出事物具有的普遍性的本质。它是抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节,只保留实现目标所必需的信息。对已有的数据类型进行抽象,就有了抽象数据类型。
抽象数据类型不仅仅指那些已经定义并实现的数据类型,还可以是计算机编程者在设计软件程序时自己定义的数据类型。例如 “超级玛丽” 中的马里奥,定义的操作:走(前进、后退、上、下)、跳、打子弹等。
事实上, 抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。抽象数据类型把实际生活中的问题分解为多个规模小且容易处理的问题, 然后建立一个计算机能处理的数据模型,并把每个功能模块的实现细节作为一个独立的单元,从而使具体实现过程隐藏起来。
描述抽象数据类型的标准格式:
5 总结
本章介绍了数据结构的一些相关概念。
由这些概念,给出了数据结构的定义:数据结构是相互之间存在一种或多种特定关系的数据元素的集合。同样是结构,从不同的角度来讨论,会有不同的分类:
参考:
《大话数据结构 - 第1章》数据结构绪论