【数据结构】了解KMP算法和部分匹配值、以及next函数值

最近生活发生了很多变化,没变的是自己还是咸鱼一条,害~~

1、什么是 KMP 算法

KMP算法是一种改进的字符串匹配算法。

2、KMP算法的思想

KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。

3、KMP算法的具体实现

实现一个next()函数,函数本身包含了模式串的局部匹配
信息

4、部分匹配值的定义

“部分匹配值”就是”前缀”和”后缀”的最长的共有元素的长度。

4.1 “前缀”和”后缀”的定义

“前缀”指除了最后一个字符以外,一个字符串的全部头部
组合;
“后缀”指除了第一个字符以外,一个字符串的全部尾部组
合。

4.2 相关例子

以”ABCDABD”为例,
-”A”的前缀和后缀都为空集,共有元素的长度为0;
-”AB”的前缀为[A],后缀为[B],共有元素的长度为0;
-”ABC”的前缀为[A, AB],后缀为[BC, C],共有元素的长度0; -”ABCD”的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元
素的长度为0;
-”ABCDA”的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA,
DA, A],共有元素为”A”,长度为1;
-”ABCDAB”的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为
[BCDAB, CDAB, DAB, AB, B],共有元素为”AB”,长度为2; -”ABCDABD”的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后
缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。

【数据结构】了解KMP算法和部分匹配值、以及next函数值

5、移动位数的计算

公式(移动位数 = 已匹配的字符数 – 对应的部分匹配
值 )

6、next函数值相关计算题

例:在字符串的KMP模式匹配算法中,需先求解模式串p的
next函数值,其定义如下。若模式串p为”abaabaca”,则其
next函数值为(B)

【数据结构】了解KMP算法和部分匹配值、以及next函数值
A.01111111 B.01122341
C.01234567 D.01122334
解:
给定的字符串叫做模式串T。j表示next函数的参数,其值是从
1到n。而k则表示一种情况下的next函数值。p表示其中的某
个字符,下标从1开始。看等式左右对应的字符是否相等。
【数据结构】了解KMP算法和部分匹配值、以及next函数值
1、j=1时,next[1]=0;
2、j=2时,k的取值为(1,j)的开区间,所以整数k是不存在的,
那就是第三种情况,next[2]=1;
3、j=3时,k的取值为(1,3)的开区间,k从最大的开始取值,
然后带入含p的式子中验证等式是否成立,不成立k取第二大
的值。现在是k=2,将k导入p的式子中得,p1=p2,即
“a”=”b”,显然不成立,舍去。k再取值就超出范围了,所以
next[3]不属于第二种情况,那就是第三种了,即next[3]=1;
4、j=4时,k的取值为(1,4)的开区间,先取k=3,将k导入p
的式子中得,p1p2=p2p3,不成立。 再取k=2,得p1=p3,成
立。所以next[4]=2;
5、j=5时,k的取值为(1,5)的开区间,先取k=4,将k导入p
的式子中得,p1p2p3=p2p3p4,不成立。 再取k=3,得
p1p2=p3p4,不成立。 再取k=2,得p1=p4,成立。所以
next[5]=2;
6、j=6时,k的取值为(1,6)的开区间,先取k=5,将k导入p
的式子中得,p1p2p3p4=p2p3p4p5,不成立。 取k=4,得
p1p2p3=p3p4p5,不成立。再取k=3,将k导入p的式子中得,
p1p2=p4p5,成立。所以next[6]=3;
7、j=7时,k的取值为(1,7)的开区间,先取k=6,将k导入p
的式子中得,p1p2p3p4p5=p2p3p4p5p6,不成立。 再取k=5, 得 p1p2p3p4=p3p4p5p6 ,不成立。 再取k=4,得
p1p2p3=p4p5p6 ,成立。所以next[7]=4;
8、j=8时,k的取值为(1,8)的开区间, 先取k=7,将k导入
p的式子中得,p1p2p3p4p5p6=p2p3p4p5p6p7,不成立。 再 取k=6,得p1p2p3p4p5=p3p4p5p6p7,不成立。… 再取k=2, 得p1=p7,不成立。k再取值就超出范围了,所以next[8]不属
于第二种情况,那就是第三种了,即next[8]=1;
【数据结构】了解KMP算法和部分匹配值、以及next函数值

Original: https://www.cnblogs.com/dusucyy/p/16612320.html
Author: 1scy
Title: 【数据结构】了解KMP算法和部分匹配值、以及next函数值

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/569517/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Prometheus 使用Python推送指标数据到Pushgateway

    使用Python推送指标数据到Pushgateway 需求描述 实践环境 Python 3.6.5 Django 3.0.6 prometheus-client 0.11.0 代码…

    Java 2023年6月16日
    082
  • Java8新特性-Optional类

    Optional 类(java.util.Optional) 是一个 容器类,代表一个值存在或不存在,原来用 nu…

    Java 2023年6月8日
    070
  • JAVA_AesCBC例子

    java;gutter:true; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; im…

    Java 2023年5月29日
    077
  • SSM 集成 Freemarker 模板引擎

    在前后端分离的大趋势下,项目开发过程中,应尽量减少前端和后台的依赖和耦合,前端和后台尽可能采用 ajax 进行交互;但是全站 ajax,不利于网站 SEO,所以引入模板引擎,尽量减…

    Java 2023年6月5日
    084
  • mysql 常用函数

    CONCAT(s1,s2) 例子:SELECT CONCAT (“SQL “,”Runoob “,”Gooogle &#…

    Java 2023年6月5日
    062
  • 跟着 Guava、Spring 学习如何设计观察者模式

    文章首发在公众号(龙台的技术笔记),之后同步到掘金和个人网站:xiaomage.info 今天讲解一篇行为型设计模式,什么是行为型?行为型主要负责设计 类或对象之间的交互。工作中常…

    Java 2023年6月14日
    078
  • QT 如何保证类的线程安全?(让多线程不再崩渍)

    1.什么是类的线程安全(或线程安全的类)?了解多线程的人太概都知道,类地线是玄全比可重入更加严格、它要求在不回线程同过调用类回一实侧的成局画数、而不会发程序的递溃。2.哪些情况下不…

    Java 2023年5月30日
    085
  • Mybatis系列全解(四):全网最全!Mybatis配置文件XML全貌详解

    封面:洛小汐作者:潘潘 做大事和做小事的难度是一样的。两者都会消耗你的时间和精力,所以如果决心做事,就要做大事,要确保你的梦想值得追求,未来的收获可以配得上你的努力。 ; 前言 上…

    Java 2023年6月13日
    076
  • 通过调试来理解形参与实参的区别

    刚开始学习模块化程序设计时,估计大家都被形参和实参搞迷糊过,尤其是遇到形参名和实参名一样时,更加晕头转向,出现一种”是谁把值传给了我,而我又传给了谁”的疑惑…

    Java 2023年6月8日
    090
  • Docker 常用操作

    .Docker的基本操作 1.镜像操作 1.1.镜像名称 首先来看下镜像的名称组成: 镜名称一般分两部分组成:[repository]:[tag]。 在没有指定tag时,默认是la…

    Java 2023年6月7日
    087
  • HashMap原理

    Java7 : 数组 + 链表 Java8: 数组 + 链表 + 红黑树 (链表超过8则转为红黑树,小于6则变会链表) >> 加快查询. 源码如下: 参数解释: DEF…

    Java 2023年6月8日
    061
  • 哈工大软件构造实验中JUnit的使用

    防扒链接: 何以牵尘的博客_CSDN博客-哈工大课内学习,哈工大精品课程笔记领域博主何以牵尘擅长哈工大课内学习,哈工大精品课程笔记,等方面的知识https://blog.csdn….

    Java 2023年6月9日
    071
  • Linux常用命令及使用帮助

    转自吾爱破解,略有改动,发帖人已经找不到了,侵删 命令描述 保存不退出 不保存退出 强制退出 表示不保存退出,保留源文件,而另存为其他的文件,可以用 大写Z,保存退出 命令提示符 …

    Java 2023年6月5日
    091
  • Java UUID的底层原理

    UUID的几个核心特定: 全局时空唯一性固定长度128比特,也就是16字节(1 byte = 8 bit)分配速率极高,单机每秒可以生成超过1000万个UUID(实际上更高) UU…

    Java 2023年5月29日
    086
  • hdu 1385 Minimum Transport Cost (floyd算法)

    貌似···················· 这个算法深的东西还是很不熟悉!继续学习!!!! ++++++++++++++++++++++++++++ ==============…

    Java 2023年5月29日
    079
  • 使用idea将整个项目打包为公共组件到本地maven库

    1、在idea工程右侧找到mavenproject Original: https://www.cnblogs.com/holly8/p/16642361.htmlAuthor: …

    Java 2023年6月14日
    076
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球