mirror of
https://github.com/Didnelpsun/CS408.git
synced 2026-02-13 07:36:07 +08:00
6.1 KiB
6.1 KiB
树
基本概念
树的基本概念
- 树:n个结点的有限集(树是一种递归的数据结构,适合于表示具有层次的数据结构)。是递归定义的。
- 根结点:只有子结点没有父结点的结点。除了根结点外,树任何结点都有且仅有一个前驱。
- 分支结点:有子结点也有父结点的结点。
- 叶子结点:没有子结点只有父结点的结点。
- 空树:结点数为0的数。
- 子树:当n>1时,其余结点可分为m个互不相交的有限集合,每个集合本身又是一棵树,其就是根结点的子树。
- 结点的度:一个结点的孩子(分支)个数。
- 树的度:树中结点的最大度数。
- 结点的层次(深度):从上往下数。
- 结点的高度:从下往上数。
- 树的高度(深度):多少层。
- 两结点之间的路径:由两个结点之间所经过的结点序列构成。
- 两结点之间的路径长度:路径上所经过的边的个数。
- 树的路径长度:指树根到每个结点的路径长的总和,根到每个结点的路径长度的最大值是树的高。
- 有序树:树各结点的子树从左至右有次序不能互换。
- 无序树:树各结点的子树从左至右无次序可以互换。
森林的基本概念
- 森林时m棵互不相交的树的集合。
- 一颗树可以被分为森林。
树的性质
- 结点数=总度数+1。
- 树的度m代表至少一个结点度是为m,且一定是非空树,至少有m+1个结点;而m叉树指所有结点的度都小于等于m,可以是空树。
- 度为m的树以及m叉树第i层至多有$m^{i-1}$个结点。
- 高度为h的m叉树至多有$\dfrac{m^h-1}{m-1}$个结点。
- 高度为h的m叉树至少有$h$个结点,度为m的树至少有$h+m-1$个结点。
- 具有n个结点的m叉树最小高度为$\lceil\log_m(n(m-1)+1)\rceil$。已知高度最小时所有结点都有m个孩子,所以$\dfrac{m^{h-1}-1}{m-1}<n<\leqslant\dfrac{m^h-1}{m-1}$,从而得到$h-1<\log_m(n(m-1)+1)\leqslant h$。
二叉树
二叉树的基本概念
- 二叉树是n个结点构成的有限集合。
- 二叉树可以为空二叉树,也可以是由一个根结点和两个互不相交的被称为根的左子树和右子树构成。左子树和右子树又分别是一棵二叉树,左右子树不能颠倒。
- 满二叉树:一棵高度为h,含有$2^h-1$个结点的二叉树;只有最后一层有叶子结点,不存在度为1的结点;按层序从1开始编号,结点i的左孩子为$2i$,右孩子为$2i+1$,父结点如果有为$\lfloor\dfrac{i}{2}\rfloor$。
- 完全二叉树:当且仅当其每个结点都与高度h满二叉树编号1到n的结点一一对应时该二叉树就是完全二叉树;只有最后两层有叶子结点,最多只有一个度为1的结点,且一定为左孩子;$i\leqslant\lfloor\dfrac{n}{2}\rfloor$为分支结点,$i>\lfloor\dfrac{n}{2}\rfloor$为叶子结点。
- 二叉排序树:左子树上所有结点的关键字均小于根结点的关键字;右子树上所有结点的关键字均大于根结点的关键字;左右子树又各是一棵二叉排序树。
- 平衡二叉树:树上任一结点的左子树和右子树的深度之差不超过1。
二叉树的性质
- 设非空二叉树中度为0、1和2的结点个数分别为$n_0$,$n_1$、$n_2$,则$n_0=n_2+1$(叶子结点比二分结点多一个)。假设树中结点的总数为$n$,则$n=n_0+n_1+n_2$,又根据树的结点等于总度数+1得到$n=n_1+2n_2+n_0$,所以相减就得到结论。
- 二叉树的第$i$层至多有$2^{i-1}$个结点。
- 高度为$h$的二叉树至多有$\dfrac{m^h-1}{m-1}$个结点。
- 具有$n$个结点的完全二叉树的高度$h=\lceil\log_2(n+1)\rceil$或$\lfloor\log_2n\rfloor+1$。$2^{h-1}-1<n\leqslant2^h-1$。
- 完全二叉树最多只有一个度为1的结点,度为0度为2的结点的个数和一定为奇数;若完全二叉树有$2k$个结点,则必然$n_1=1$,$n_0=k$,$n_2=k-1$,若完全二叉树有$2k-1$个结点,则必然$n_1=0$,$n_0=k$,$n_2=k-1$。
二叉树存储结构
顺序存储
如果是完全二叉树,可以按照顺序进行存储,如果$i$有左孩子则$2i\leqslant n$,若有右孩子则$2i+1\leqslant n$,若有叶子或分支结点则$i>\lfloor\dfrac{n}{2}\rfloor$。
如果不是完全二叉树,则让二叉树的编号与完全二叉树相对应再存入数组,其他的结点为空,这种存储方法会浪费较多内存,最坏情况下高度为$h$,且只有$h$个结点的单支树也需要$2^h-1$个存储单元。
链式存储
链式树具有两个分别指向左右子树的指针。
如果要保存父结点的位置,可以添加一个父结点指针,从而变成三叉链表。
二叉树的遍历
遍历是按照某种次序将所有结点都访问一遍。
顺序遍历
顺序遍历就是深度优先的遍历,分为三种:
- 先序遍历:根左右NLR。
- 中序遍历:左根右LNR。
- 后序遍历:左右根LRN。
根据算算数表达式的分析树的不同先序、中序、后序遍历方式可以得到前缀、中缀、后缀表达式。
若树的高度为$h$,则时间复杂度为$O(h)$。
层序遍历
层序遍历就是广度优先的遍历。
- 初始化一个辅助队列。
- 根结点入队。
- 若队列非空,则队头结点出队,访问该结点,如果有并将其左右孩子入队。
- 重复步骤3直至队列空。
遍历序列构造二叉树
若只给出一棵二叉树的前/中/后/层序遍历序列中的一种不能唯一确定一棵二叉树。只有给出中序遍历序列才可能推出唯一二叉树,因为无法确定根结点相对于左右结点的位置:
- 前序+中序。
- 后序+中序。
- 层序+中序。
前序+中序
前序:根+左+右;中序:左+根+右。所以根据三个部分对应相同可以推出。
后序+中序
后序:左+根+右;中序:左+根+右。所以根据三个部分对应相同可以推出。
层序+中序
层序:根+左根+右根;中序:左+根+右。所以根据根结点和左右子树的根结点来确定。