Prim 算法YYDS
工信部五措施严管域名 未备案域名不予解析,韩国著名精细改脸型专家“王锦城”,像图论算法这种高级算法虽然不算难,但是阅读量普遍比较低,我本来是不想写 Prim 算法的,但考虑到算法知识结构的完整性,我还是想把 Prim 算法的坑填上,这样所有经典的图论算法就基本完善了。
Prim 算法和 Kruskal 算法都是经典的最小生成树算法,阅读本文之前,希望你读过前文Kruskal 最小生成树算法,了解最小生成树的基本定义以及 Kruskal 算法的基本原理,这样就能很容易理解 Prim 算法逻辑了。
图论的最小生成树问题,就是让你从图中找若干边形成一个边的集合mst,这些边有以下特性:
那么 Kruskal 算法是使用什么逻辑满足上述条件,计算最小生成树的呢?
首先,Kruskal 算法用到了贪心思想,来满足权重之和尽可能小的问题:
先对所有边按照权重从小到大排序,从权重最小的边开始,选择合适的边加入mst集合,这样挑出来的边组成的树就是权重和最小的。
其次,Kruskal 算法用到了Union-Find 并查集算法,来保证挑选出来的这些边组成的一定是一棵「树」,而不会包含环或者形成一片「森林」:
如果一条边的两个节点已经是连通的,则这条边会使树中出现环;如果最后的连通分量总数大于 1,则说明形成的是「森林」而不是一棵「树」。
首先,Prim 算法也使用贪心思想来让生成树的权重尽可能小,也就是「切分定理」,这个后文会详细解释。
其次,Prim 算法使用BFS 算法思想 和 visited 布尔数组避免成环,来保证选出来的边最终形成的一定是一棵树。
Prim 算法不需要事先对所有边排序,而是利用优先级队列动态实现排序的效果,所以我觉得 Prim 算法类似于 Kruskal 的动态过程。
「切分」这个术语其实很好理解,就是将一幅图分为两个不重叠且非空的节点集合:
红色的这一刀把图中的节点分成了两个集合,就是一种「切分」,其中被红线切中的的边(标记为蓝色)叫做「横切边」。
当然,一幅图肯定可以有若干种切分,因为根据切分的定义,只要你能一刀把节点分成两部分就行。
对于任意一种「切分」,其中权重最小的那条「横切边」一定是构成最小生成树的一条边。
这应该很容易证明,如果一幅加权无向图存在最小生成树,假设下图中用绿色标出来的边就是最小生成树:
那么,你肯定可以找到若干「切分」方式,将这棵最小生成树切成两棵子树。比如下面这种切分:
你会发现,任选一条蓝色的「横切边」都可以将这两棵子树连接起来,构成一棵生成树。
给定一幅图的最小生成树,那么随便给一种「切分」,一定至少有一条「横切边」属于最小生成树。
假设这条「横切边」不是权重最小的,那说明最小生成树的权重和就还有再减小的余地,那这就矛盾了,最小生成树的权重和本来就是最小的,怎么再减?所以切分定理是正确的。
既然每一次「切分」一定可以找到最小生成树中的一条边,那我就随便切呗,每次都把权重最小的「横切边」拿出来加入最小生成树,直到把构成最小生成树的所有边都切出来为止。
嗯,可以说这就是 Prim 算法的核心思路,不过具体实现起来,还是要有些技巧的。
因为你没办法让计算机理解什么叫「随便切」,所以应该设计机械化的规则和章法来调教你的算法,并尽量减少无用功。
我们思考算法问题时,如果问题的一般情况不好解决,可以从比较简单的特殊情况入手,Prim 算法就是使用的这种思路。
按照「切分」的定义,只要把图中的节点切成两个不重叠且非空的节点集合即可算作一个合法的「切分」,那么我只切出来一个节点,是不是也算是一个合法的「切分」?
是的,这是最简单的「切分」,而且「横切边」也很好确定,就是这个节点的边。
既然这是一个合法的「切分」,那么按照切分定理,这些「横切边」AB, AF中权重最小的边一定是最小生成树中的一条边:
好,现在已经找到最小生成树的第一条边(边AB),然后呢,如何安排下一次「切分」?
然后又可以从这个切分产生的横切边(图中蓝色的边)中找出权重最小的一条边,也就又找到了最小生成树中的第二条边BC:
接下来呢?也是类似的,再围绕着A, B, C这三个点做切分,产生的横切边中权重最小的边是BD,那么BD就是最小生成树的第三条边:
Prim 算法的逻辑就是这样,每次切分都能找到最小生成树的一条边,然后又可以进行新一轮切分,直到找到最小生成树的所有边为止。
这样设计算法有一个好处,就是比较容易确定每次新的「切分」所产生的「横切边」。
比如回顾刚才的图,当我知道了节点A, B的所有「横切边」(不妨表示为cut({A, B})),也就是图中蓝色的边:
是否可以快速算出cut({A, B, C}),也就是节点A, B, C的所有「横切边」有哪些?
在进行切分的过程中,我们只要不断把新节点的邻边加入横切边集合,就可以得到新的切分的所有横切边。
当然,细心的读者肯定发现了,cut({A, B})的横切边和cut({C})的横切边中BC边重复了。
不过这很好处理,用一个布尔数组inMST辅助,防止重复计算横切边就行了。
很简单,用一个优先级队列存储这些横切边,就可以动态计算权重最小的横切边了。
// 类似 visited 数组的作用,记录哪些节点已经成为最小生成树的一部分
明白了切分定理,加上详细的代码注释,你应该能够看懂 Prim 算法的代码了。
这里我们可以再回顾一下本文开头说的 Prim 算法和Kruskal 算法的联系:
Kruskal 算法是在一开始的时候就把所有的边排序,然后从权重最小的边开始挑选属于最小生成树的边,组建最小生成树。
Prim 算法是从一个起点的切分(一组横切边)开始执行类似 BFS 算法的逻辑,借助切分定理和优先级队列动态排序的特性,从这个起点「生长」出一棵最小生成树。
这个不难分析,复杂度主要在优先级队列pq的操作上,由于pq里面装的是图中的「边」,假设一幅图边的条数为E,那么最多操作O(E)次pq。每次操作优先级队列的时间复杂度取决于队列中的元素个数,取最坏情况就是O(logE)。
所以这种 Prim 算法实现的总时间复杂度是O(ElogE)。回想一下Kruskal 算法,它的时间复杂度主要是给所有边按照权重排序,也是O(ElogE)。
不过话说回来,和前文Dijkstra 算法类似,Prim 算法的时间复杂度也是可以优化的,但优化点在于优先级队列的实现上,和 Prim 算法本身的算法思想关系不大,所以我们这里就不做讨论了,有兴趣的读者可以自行搜索。
接下来,我们实操一波,把之前用 Kruskal 算法解决的力扣题目运用 Prim 算法再解决一遍。
第一题是力扣第 1135 题「最低成本联通所有城市」,这是一道标准的最小生成树问题:
每座城市相当于图中的节点,连通城市的成本相当于边的权重,连通所有城市的最小成本即是最小生成树的权重之和。
那么解法就很明显了,我们先把题目输入的connections转化成邻接表形式,然后输入给之前实现的Prim算法类即可:
一是题目给的节点编号是从 1 开始的,所以我们做一下索引偏移,转化成从 0 开始以便Prim类使用;
二是如何用邻接表表示无向加权图,前文图论算法基础说过「无向图」其实就可以理解为「双向图」。
这样,我们转化出来的graph形式就和之前的Prim算法类对应了,可以直接施展 Prim 算法计算最小生成树。
很显然这也是一个标准的最小生成树问题:每个点就是无向加权图中的节点,边的权重就是曼哈顿距离,连接所有点的最小费用就是最小生成树的权重和。
所以我们只要把points数组转化成邻接表的形式,即可复用之前实现的Prim算法类:
这道题做了一个小的变通:每个坐标点是一个二元组,那么按理说应该用五元组表示一条带权重的边,但这样的话不便执行 Prim 算法;所以我们用points数组中的索引代表每个坐标点,这样就可以直接复用之前的 Prim 算法逻辑了。
到这里,Prim 算法就讲完了,整个图论算法也整的差不多了,更多精彩文章,敬请期待。
栏目导航
阅读排行
安徽成人高考成绩公布即日起可线上查分11-21
YY第一季度财报背后:直播行业国内红利结束垂直化和国际化开启新01-14
Prim 算法YYDS02-23
天津:2022年普通高考相关事项早知道12-02
江西財經大學舉行江西省虛擬現實(VR)産業技術創新戰略聯盟成立12-09
往届高考考生号怎么查询12-10
新建5G基站智慧用电解决方案之多回路导轨表选型12-03
昆明街头一轿车自燃 交警请绿化浇水车帮忙灭火01-15
灞桥区城市管理和综合执法局持续开展“大擦洗 大冲洗”活动02-17
美媒:中国潜艇武装到牙齿 美航母别想随心所欲 中国潜11-15