树:树是n(n>=0)个结点的有限集。n=0时称为空树。在任意一颗非空树中:
(1) 有且仅有一个特定的称为根(Root)的结点;
(2) 当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、….、Tn,其中每一个集合本身又是一棵树,并且称为根的子树。
对于树还需要强调两点:
1、n>0时根节点是唯一的,不可能存在多个根节点
2、m>0时,子树的个数没有限制,但他们不一定是互不相交的。
对比线性表与树的结构,他们有很大的不同:
树的结点包含一个数据及若干指向其子树的分支。结点拥有的子树称为结点的度。度为0的结点称为叶结点或终端结点;度不为0的结点称为非终端结点或分支结点。除根节点之外,分支结点也称为内部节点。树的度是树内个结点的度的最大值。
结点之间的关系:
结点的子树的根称为该结点的孩子,相应地,该节点称为孩子的双亲。同一个双亲的孩子之间互称为兄弟。结点的祖先是从根到该结点所经分支上的所有结点,所以对于H来说,DBA都是他的祖先。反之,以某节点为根的子树中的任一结点都称为该结点的子孙。B的子孙有DGHI,如下图所示:
结点的层次是从根开始定义起,根为第一层,根的孩子为第二层。若某结点在第L,则其的根节点就在L+1层。树中结点的最大层次称为树的深度或高度。
如果将树中结点的各子树堪称从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树。
森林是m(M>=0)棵互不相交的树的集合,队树中每个结点而言,其子树的集合即为森林。
二叉树是n(n>=0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根节点和两颗互不相交的、分别称为根节点的左子树和右子树的二叉树组成。
二叉树的特点:
每个结点最多有两颗子树,所以二叉树中不存在度大于2的结点。
左子树和右子树是有顺序的,次序不能任意颠倒。
即使树中某结点只有一颗子树,也要区分它是左子树还是右子树。
二叉树的性质:
性质1:在二叉树的第i层上之多有2^(i-1)个结点(i>=1)
性质2:深度为k的二叉树之多有2^(k)-1个结点(k>=1)
性质3:对任何一颗二叉树T,如果其终端结点数位n0,度为2的结点数为n2
则n0=n2+1.
性质4:具有n个结点的完全二叉树的深度为[log(2)N]+1.
性质5:如果对一颗有n个结点的完全二叉树(其深度为[log(2)N]+1)的结点按层序编号(从第1层到第[log(2)N]+1层,每层从左到右),对任一结点i有:
- 如果i=1,则结点i是二叉树的根,无双亲;如果i>1,则其双亲是结点[i/2]
- 如果2i>n,则结点i无左孩子(结点i为叶子结点);否则其左孩子是结点2i.
- 如果2i+1>n,则结点i无右孩子;否则其右孩子是结点2i+1.
二叉树的顺序存储结构就是用一维数组存储二叉树中的结点,并且结点的存储位置,也就是数组的下标要能体现结点之间的逻辑关系,比如双亲和孩子的关系,左右兄弟的关系等。
二叉树的遍历:
前序遍历:
规则是若二叉树为空,则空操作返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树。如下图:遍历顺序是:ABCDGHCETF
中序遍历:规则是若树为空,则空操作返回,否则从根节点开始,中序遍历根节点的左子树,然后是访问根节点,最后中序遍历右子树。如下图,遍历顺序为GDHBAEICF
后序遍历:规则是若树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后是访问根结点。遍历顺序为:GHDBIEFCA
层序遍历:规则是若树为空,则空操作返回,否则从树的第一层,也就是根节点开始访问,从上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。遍历的顺序为:ABCDEFGH.
二叉树遍历的性质:
已知前序遍历序列和中序遍历序列,可以唯一确定一颗二叉树。
已知后序遍历序列和中序遍历序列,可以唯一确定一颗二叉树。
已知前序和后序遍历,是不能确定一颗二叉树的。
若果所用的二叉树需经常遍历或查找结点时需要某种遍历序列中的前驱和后继,那么采用二叉链表的存储结构就是非常不错的选择。