JavaScript中数据结构与算法(五)：经典KMP算法

2019-11-02 15:54:11

字体：大中小

来源：转载

供稿：网友

　　这篇文章主要介绍了JavaScript中数据结构与算法(五)：经典KMP算法,本文详解了KMP算法的方方面在,需要的朋友可以参考下

　　KMP算法和BM算法

　　KMP是前缀匹配和BM后缀匹配的经典算法，看得出来前缀匹配和后缀匹配的区别就仅仅在于比较的顺序不同

　　前缀匹配是指：模式串和母串的比较从左到右，模式串的移动也是从左到右

　　后缀匹配是指：模式串和母串的的比较从右到左，模式串的移动从左到右。

　　通过上一章显而易见BF算法也是属于前缀的算法，不过就非常霸蛮的逐个匹配的效率自然不用提了O(mn)，网上蛋疼的KMP是讲解很多，基本都是走的高大上路线看的你也是一头雾水，我试图用自己的理解用最接地气的方式描述

　　KMP

　　KMP也是一种优化版的前缀算法，之所以叫KMP就是Knuth、Morris、Pratt三个人名的缩写，对比下BF那么KMP的算法的优化点就在“每次往后移动的距离”它会动态的调整每次模式串的移动距离，BF是每次都+1，

　　KMP则不一定

　　如图BF与KMP前置算法的区别对比

　　我通过图对比我们发现：

　　在文本串T中搜索模式串P，在自然匹配第6个字母c的时候发现二等不一致了，那么BF的方法，就是把整个模式串P移动一位，KMP则是移动二位.

　　BF的匹配方法我们是知道的，但是KMP为什么会移动二位，而不是一位或者三位四位呢?

　　这就上一张图我们讲解下，模式串P在匹配了ababa的时候都是正确的，当到c的时候才是错误，那么KMP算法的想法是：ababa是正确的匹配完成的信息，我们能不能利用这个信息，不要把"搜索位置"移回已经比较过的位置，继续把它向后移，这样就提高了效率。

　　那么问题来了, 我怎么知道要移动多少个位置?

　　这个偏移的算法KMP的作者们就给我们总结好了：

　　代码如下:

　　移动位数 = 已匹配的字符数 - 对应的部分匹配值

　　偏移算法只跟子串有关系，没文本串没毛线关系，所以这里需要特别注意了

　　那么我们怎么理解子串中已匹配的字符数与对应的部分匹配值?

　　已匹配的字符：

　　代码如下:

　　T : abababaabab

　　p : ababacb

　　p中红色的标记就是已经匹配的字符，这个很好理解

　　部分匹配值：

　　这个就是核心的算法了，也是比较难于理解的

　　假如：

　　代码如下:

　　T：aaronaabbcc

　　P：aaronaac

　　我们可以观察这个文本如果我们在匹配c的时候出错，我们下一个移动的位置就上个的结构来讲，移动到那里最合理?

　　代码如下:

　　aaronaabbcc

　　aaronaac

　　那么就是说：在模式文本内部，某一段字符头尾都一样，那么自然过滤的时候可以跳过这一段内容了，这个思路也是合理的

　　知道了这个规律，那么给出来的部分匹配表算法如下：

　　首先，要了解两个概念："前缀"和"后缀"。 "前缀"指除了最后一个字符以外，一个字符串的全部头部组合;"后缀"指除了第一个字符以外，一个字符串的全部尾部组合。

　　"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度”

　　我们看看aaronaac的如果是BF匹配的时候划分是这样的

　　BF的位移: a,aa,aar,aaro,aaron,aarona,aaronaa,aaronaac

　　那么KMP的划分呢?这里就要引入前缀与后缀了

　　我们先看看KMP部分匹配表的结果是这样的：

　　代码如下:

　　a a r o n a a c

　　[0, 1, 0, 0, 0, 1, 2, 0]

上一篇：浅谈javascript构造函数与实例化对象

下一篇：使用javascript提交form表单方法汇总

学习交流

索泰发布一款GTX 1070 Mini迷你版本:小机

索泰发布一款GTX 1070 Mini迷你版本:小机箱大爱...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

荣耀总裁赵明乌镇演讲：荣耀首款5G手机V30下月发布

2019-10-23 09:17:05

搜狐张朝阳：回归媒体是搜狐重新崛起的关键

2019-10-21 09:20:02

华为轮值董事长郭平：虚拟技术创造现实价值

2019-10-21 09:00:12

滴滴英文服务上线两周年用户已超200万

2019-09-26 08:57:12

华为推出全球至快AI训练集群Atlas900

2019-09-25 08:46:36

马斯克：特斯拉正组建中国技术团队

2019-09-25 08:15:43

疑难解答

图片精选

网友关注