Add tSort, prim, dijkstra to Graph conclusion.

This commit is contained in:
Shine wOng
2019-06-12 20:01:45 +08:00
parent de60cf868d
commit 880c2746f1

View File

@@ -172,3 +172,146 @@ DFS的时间复杂度也与BFS一致。
> dfs的应用。
dfs是图遍历算法中最重要的一个。大量与图相关的算法都是由dfs导出的比如连通分量分解拓扑排序等。此外dfs还可以用来做带权图的最短路径算法框架。
## 拓扑排序
> 什么是拓扑排序?
事物之间往往会有一个依赖关系,因此形成一个了先后次序关系。比如我得先学好`Vector``List`,才能来学习依赖于两者的树,从而才能学习依赖于树的图结构。它们之间的这种次序就构成了一个拓扑顺序。
对于一般的有向图而言就是要找到一个线性序列使得对于任意个顶点x排在它后面的顶点一定不会是当前顶点的前驱顶点。这个序列表示在访问x之前x的所有前驱顶点一定要首先被访问。这个序列就是原图的一个拓扑排序(Topological Sort)。
要注意拓扑排序通常都是研究有向图,因为它反映了事物的一个先后次序。无向图不具有这样一个先后的次序,研究它的拓扑排序是没有意义的。
> 有向无环图与拓扑排序。
接下来要解决的一个问题就是,什么样的图具有拓扑排序?因为直观上来看,有环图必然是没有拓扑排序的。因此,接下来我们重要要研究的是就是有向无环图(DAG, Directed Acyclic Graph)。
那么所有的DAG都具有拓扑排序吗答案是是的为了证明这个答案我劝你还是学完离散数学再来吧......
> 拓扑排序的构造方法。
根据拓扑排序的定义进行构造。拓扑排序的每一步,都是寻找依赖项已经完成访问的顶点。因此,作为拓扑排序的起点,必然是一个入度为零的顶点,表示该顶点不依赖于任何其他顶点。从这里我们也可以看出,拓扑排序并不是唯一的,因为同时没有依赖的顶点可能有多个,此时它们都可以等效地加入拓扑排序的序列中。
在将任意一个准备被访问的顶点加入拓扑排序序列中后相当于图中依赖于该顶点的其他顶点已经满足了对其的依赖关系因此可以将该顶点从图中删除以及删除与该顶点有联系的所有边。接下来的图仍然是一个DAG从而可以将算法递归地进行下去直到图中不再有任何顶点为止。
> 基于dfs的拓扑排序算法
其实我们对比拓扑排序的定义以及dfs遍历的次序可以发现它们之间具有某种相似性。对于拓扑排序而言每次是选择入度为零的顶点加入拓扑排序序列而对于dfs而言只有当一个顶点的所有邻居都访问完毕后这个顶点才会被标记`VISITED`这样dfs中第一个被访问的顶点必然是出度为零的顶点而倘若没访问结束一个顶点就将该顶点删除那么dfs每一步都是访问出度为零的顶点。可以看出dfs的访问次序恰好是拓扑排序的逆序。
其实上面的结论并不是偶然而是由dfs的特性决定的--在dfs中对于当前顶点x总是需要优先访问完所有依赖于它的顶点才能进行对x的访问。这恰好是拓扑排序的对称情况。
为了完成对图的拓扑排序只需要逆序输出它的dfs访问序列就可以了。为此我们需要引入一个栈用以延迟缓冲。
```cpp
template <typename Tv, typename Te>
bool Graph<Tv, Te>::tSort(int x, Stack<int> &S){
status(x) = DISCOVERED;
for(int w = firstNeighbor(x); w != -1; w = nextNeighbor(x, w)){
switch(status(w)){
case UNDISCOVERED:
if(!tSort(w, S)) return false;
break;
case DISCOVERED:
return false;//cyclic graph
case VISITED:
default:
break;
}
}
status(x) = VISITED;
S.push(x);
}
```
代码执行结束后,拓扑排序序列就存储在栈`S`中。需要注意的是利用dfs的环路检测的性质可以轻易地判断当前图是否是一个DAG一旦发现一个环路就可以立即终止循环并且报告不可拓扑排序。
由于该算法是采用dfs的框架其时间复杂度也和dfs一样为$O(n + e)$。
## 双连通域的分解
## 优先级搜索
## 最小支撑树
> 什么是最小支撑树(MST, Minimal Spanning Tree)
沿用之前对树的定义,树是一个极大无环图和极小连通图。最小支撑树也满足这样的定义。
对于任意一个无向连通图而言,例如若干城市和它们之间的道路组成的网络,从某一个城市出发到达另一个城市往往具有若干条不同的道路,所谓条条大路通罗马。这个网络的一棵支撑树,就是只通过最少的路径数,就能将该网络的所有城市都连接起来的若干通路。如果再考虑这些不同的通路之间具有不同的权重,例如时间成本不同,具有最小权重和的一棵支撑树,就是最小支撑树(MST)。
> 如何建立连通图的最小支撑树?
据邓公所说,蛮力算法需要$O(n^{n-2})$的时间复杂度是根据Cayley公式我还比较懵......
首先考虑一种较为一般的情况。考虑图G顶点集VV的一个非平凡子集U以及U的补集V\U构成了G的一个割。最小支撑树总是会采用每一割的最短跨越边。
根据上面的性质,就可以得到构造最小支撑树的算法:总是将原图视作一个割,两个顶点集分别是已经加入到最小支撑树中的顶点和未加入的顶点。通过找到这个割的最短跨越边,从而将一个新的顶点加入到最小支撑树中。这样不断地迭代,知道最小支撑树覆盖了全图的所有顶点。
这里比较复杂的问题是如何快速地找到当前割的最短跨越边为此可以模仿dijkstra算法维护一个数组来保存所有未加入最小支撑树的顶点到最小支撑树的路径每加入一个新的顶点将这个数组进行更新。这里并没有真正地用一个数组而是用每个顶点的`priority`字段来保存这个信息。
```cpp
template <typename Tv, typename Te>
void Graph<Tv, Te>::primPU(int x){
for(int w = firstNeighbor(x); w != -1; w = nextNeighbor(x, w))
if(status(w) == UNDISCOVERED){
if(weight(x, w) < priority(w)) priority(w) = weight(x, w);
parent(w) = x;
}
}
```
通过优先级搜索的框架,即可以完成最小支撑树的生成。
## 最短路径
最短路径的定义与应用意义不言而喻,我们直接讨论如何求得最短路径的算法。
> 最短路径树
在任意一个带权网络中,考察从源点到其余各个顶点的最短路径,它们之间并不组成任何回路。因此将它们组合在一起,可以构成最短路径树(SPT, Shortest Path Tree)。
需要注意的是SPT和MST不一样。
> Dijkstra算法
首先来考虑最短路径具有的若干性质。
考虑从源点s到任意顶点v的最短路径其路径上还有若干其他顶点。那么该路径上从s到这些顶点的一段也是从s到这些顶点的最短路径。这个性质是容易证明的因为否则的话从s到v还有一条更短的路径这与一开始的假设矛盾。
从上面的性质可以看出为了构造从s到某一顶点的最短路径首先需要构造从s到该顶点路径上更前面顶点的最短路径。将图中各点按距离s的远近次序由近到远排个序就构成了最短路径子树序列。
因此为了构造从源点s到所有其他顶点的最短路径需要依次找到距离s最近的$u_1, $u_2, ..., u_k$,从而完成最短路径树的构造。
+ 首先需要找到距离s最近的顶点$u_1$。实际上,$u_1$是s的邻居中距离s最近的顶点。这是因为倘若存在s的非邻居顶点$x$距离s的距离比$u_1$更近,那么它必然通过某个顶点$y$与s连接$y$是s的邻居顶点。所以$x$到s的距离为
$$
dist(x, s) = dist(x, y) + dist(y, s)
$$
。而
$$
dist(y, s) > dist(u_1, s)
$$
,所以$x$到s的距离实际上比$u_1$远,故$u_1$才是距离s最近的顶点。
+ 已知$u_k$找到接下来距离s最近的顶点$u_{k + 1}$。这个顶点就是所有的与
s以及$u_1$到$u_k$连通的顶点中距离s最近的一个。这个的证明和前面的原理一致可以自己试试。
至此我们已经归纳地证明了最短路径树序列的构造方法而这个算法就是Dijkstra算法。
同样地,找到当前的具有最短距离的顶点,具有一定的困难。为此,同样引入一个数组来保存前面已经保存了的距离信息,一旦有新的顶点加入最短路径序列中,就将这个数组进行更新。
```cpp
template <typename Tv, typename Te>
void Graph<Tv, Te>::dijkstraPU(int x){
for(int w = firstNeighbor(x); w != -1; w = nextNeighbor(x, w)){
if(status(w) == UNDISCOVERED){
if(weight(x, w) + priority(x) < priority(w))
priority(w) = weight(x, w) + priority(x);
parent(w) = x;
}
}
}
```