数据结构分类
数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成
常用的数据结构有:数组,栈,链表,队列,树,图,堆,散列表等,如果所示:
一、数组
数组是可以再内存中连续存储多个元素的结构,在内存中的分配也是连续的,数组中的元素通过数组下标进行访问,数组下标从0开始
注意:代码部分我都选用了python或者go
例如下面这段代码就是将数组的第一个元素赋值为1
data:=[1]int{1}
优点:
1.按照索引查询元素速度快
2.按照索引遍历数组方便
缺点:
1.数组的大小固定后就无法扩容了
2.数组只能存储一种类型的数据
3.添加,删除的操作慢,因为要移动其他的元素
适用场景:
频繁查询,对存储空间要求不大,很少增加和删除的情况
二、栈
栈是一种特殊的线性表,仅能在线性表的一端操作,栈顶允许操作,栈底不允许操作。栈的特点是:先进后出,或者说是后进先出,从栈顶放入元素的操作叫入栈,取出元素叫出栈
栈的结构就像一个集装箱,越先放进去的东西越晚才能拿出来,所以栈常用于实现递归功能方面的场景,例如斐波那契数列
三、队列
队列与栈一样,也是一种线性表,不同的是,队列可以在一端添加元素,在另一端操取出元素,也就是:先进先出,从一端放入元素的操作叫入队,另一端取出元素的操作叫出队
使用场景:因为队列先进先出的特点,在多线程阻塞队列管理中非常适用
四、链表
链表是物理存储单元上非连续的,非顺序的储存结构,数据元素的逻辑顺序是通过链表的指针地址实现,每个元素包含两个节点,一个是存储元素的数据域(内存空间),另一个是指向下一个节点地址的指针域,根据指针的指向,链表能形成不同的结构,例如单链表,双向链表,循环链表等
链表的优点:
链表是很常用的一种数据结构,不需要初始化容量,可以任意加减元素
添加或者删除元素时只需要改变前后两个元素节点的指针域指向地址即可,所以添加,删除很快
缺点:
因为含有大量的指针域,占用空间较大
查找元素需要遍历链表来查找,非常耗时
适用场景:数据量较小,需要频繁添加删除操作
五、树
树是一种数据结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合,把它叫做树,是因为它看起来像一棵树,也就说它是根朝上,而也朝下,它具有以下特点:
每个节点有零个或多个子节点
没有父节点的是根节点
每一个非根节点有且只有一个父节点
除了根节点外,每个子节点可以有多个不相交的子树
在日常的应用中,我们讨论和用的更多的是树中特殊的结构,称为二叉树
二叉树是树的特殊一种,具有如下特点:
1.每个节点最多有两颗子树,节点的度最大为2
2.左子树和右子树是有顺序的,次序不能颠倒
3.即使某节点只有一个子树,也要区分左右子树
二叉树是一种比较有用的折中方案,它添加,删除元素都很快,并且在查找方面也有很多的算法优化,所以二叉树即有链表的好处,也有数组的好处,是两者的优化方案,在处理大批量的动态数据方面非常有用
扩展:
二叉树有很多扩展的数据结构,包括平衡二叉树,红黑树,B+树等,这些数据结构二叉树的基础上延伸了很多的功能,在实际应用中广泛用到,例如mysql的数据库索引结构用的就是B+树,还有HashMap的底层源码中用到了红黑树。这些二叉树的功能强大,但算法上比较复杂,想学习的话还是需要花时间去深入的
六、散列表
散列表,也叫哈希表,是根据关键码和值,直接进行访问的数据结构,通过key和value来映射到集合中的一个位置,这样就可以很快找到集合中的对应元素
记录的存储位置=f(key)
这里的对应关系f成为散列函数,又称为哈希(hash函数),而散列表就是把key通过一个固定的算法既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里,这种存储空间可以充分利用数组的查找优势来查找元素,所以查找的速度很快。
python的哈希表:https://www.cnblogs.com/kumata/p/9157738.html
七、堆
堆是一种比较特殊的数据结构,可以被看做一棵树的数组对象,具有以下的性质:
-
堆中某个节点的值总是不大于或不小于其父节点的值;
-
堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。
堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4...n/2),满足前者的表达式的成为小顶堆,满足后者表达式的为大顶堆,这两者的结构图可以用完全二叉树排列出来,示例图如下:
因为堆有序的特点,一般用来做数组中的排序,称为堆排序
八、图
图是由结点的有穷集合V和边的集合E组成。其中,为了与树形结构加以区别,在图结构中常常将结点称为顶点,边是顶点的有序偶对,若两个顶点之间存在一条边,就表示这两个顶点具有相邻关系。
按照顶点指向的方向可分为无向图和有向图:
图是一种比较复杂的数据结构,在存储数据上有着比较复杂和高效的算法,分别有邻接矩阵 、邻接表、十字链表、邻接多重表、边集数组等存储结构,这里不做展开,读者有兴趣可以自己学习深入