动画:浅谈什么是 Sunday 算法

约定不等于承诺〃 2021-11-09 02:04 455阅读 0赞

点击蓝色“五分钟学算法”关注我哟

加个“星标”,一起学算法

640?wx\_fmt=jpeg

作者 | 程序员小吴

来源 | 五分钟学算法

Sunday 算法 是 Daniel M.Sunday 于 1990 年提出的字符串模式匹配。

其效率在匹配随机的字符串时不仅比其它匹配算法更快,而且 Sunday 算法 的实现比 KMP、BM 的实现容易很多!

Sunday 算法KMP 算法 一样是从前往后匹配,在匹配失败时关注的是主串中参加匹配的最末位字符的下一位字符。

  • 如果该字符没有在模式串中出现则直接跳过,即移动位数 = 模式串长度 + 1;
  • 否则,其移动位数 = 模式串长度 - 该字符最右出现的位置(以0开始) = 模式串中该字符最右出现的位置到尾部的距离 + 1。

举个例子来理解一下它的操作过程。

假定现在要在主串substring searching xiaowu 中查找模式串 search

1.刚开始时,把模式串与文本串左边对齐:

640?wx\_fmt=png

640?wx\_fmt=png

2.结果发现在第 2 个字符处发现不匹配,不匹配时关注文本串中参加匹配的最末位字符的下一位字符,即绿色的字符 i,因为模式串 search 中并不存在 i,所以模式串直接跳过一大片,向右移动位数 = 匹配串长度 + 1 = 6 + 1 = 7,从 i 之后的那个字符(即字符 n)开始下一步的匹配,如下图:

640?wx\_fmt=png

3.结果第一个字符就不匹配,再看文本串中参加匹配的最末位字符的下一位字符,是 ‘r’ ,它出现在模式串中的倒数第 3 位,于是把模式串向右移动 3 位( r 到模式串末尾的距离 + 1 = 2 + 1 =3),使两个 ‘r’ 对齐,如下:

640?wx\_fmt=png

640?wx\_fmt=png

640?wx\_fmt=png

4.匹配成功。

回顾整个过程,我们只移动了两次模式串就找到了匹配位置,缘于 Sunday 算法每一步的移动量都比较大,效率很高。

文中开头提到 Sunday 算法 的实现比 KMP、BM 的实现容易很多,那它到底有多容易呢?这个问题将在下一章 BM 算法 中揭晓。

References

[1] 字符串匹配算法之Sunday算法: https://www.jianshu.com/p/2e6eb7386cd3


本文相关阅读推荐:

毕业十年后,我忍不住出了一份程序员的高考试卷

一道腾讯面试题:厉害了我的杯

十大经典排序算法动画与解析,看我就够了

这或许是东半球分析十大排序算法最好的一篇文章

面试官,我会写二分查找法!对,没有 bug 的那种!

看《长安十二时辰》可以了解哪些算法知识

GitHub 标星 3w+,很全面的算法和数据结构知识

640?wx\_fmt=png

发表评论

表情:
评论列表 (有 0 条评论,455人围观)

还没有评论,来说两句吧...

相关阅读

    相关 算法

    时间:2017年3月1日16:26:12 [《我的博客地图》][Link 1]     接触编程之前,早已听说过算法一事,但从来没有深入研究过。当进入了前端开发领域的工作之

    相关 IOC 什么 IOC?

    本文以文字为主题,并没有代码案例,仅限于记录自己对于 IOC 的理解,文中也啥特别高深的东西,大牛和大佬可以忽略本文,以免浪费您宝贵的时间 什么是 IOC ?      I