LeetCode 28. 实现strStr()

2023年6月11日上午7:18 • 数据库 • 阅读 77

实现strStr()函数。

给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串出现的第一个位置（下标从0开始）。如果不存在，则返回-1 。

说明：

当needle是空字符串时，我们应当返回什么值呢？这是一个在面试中很好的问题。

对于本题而言，当needle是空字符串时我们应当返回0。这与C语言的strstr()以及Java的indexOf()定义相符。

示例1：

输入：haystack = “hello”, needle = “ll”
输出：2
示例 2：

输入：haystack = “aaaaa”, needle = “bba”
输出：-1

方法一：暴力匹配

我们可以让字符串(\textit{needle})与字符串(\textit{haystack})的所有长度为m的子串均匹配一次。

为了减少不必要的匹配，我们每次匹配失败即立刻停止当前子串的匹配，对下一个子串继续匹配。如果当前子串匹配成功，我们返回当前子串的开始位置即可。如果所有子串都匹配失败，则返回-1。

class Solution {
    public int strStr(String haystack, String needle) {
        int n = haystack.length(), m = needle.length();
        for (int i = 0; i + m

时间复杂度：(O(n \times m))，其中n是字符串(\textit{haystack})的长度，m是字符串(\textit{needle}) 的长度。最坏情况下我们需要将字符串(\textit{needle})与字符串(\textit{haystack})的所有长度为m的子串均匹配一次。
空间复杂度：O(1)。我们只需要常数的空间保存若干变量。

方法二：Knuth-Morris-Pratt 算法

(\text{Knuth-Morris-Pratt}) 算法，简称 (\text{KMP}) 算法，由 (\text{Donald Knuth}、\text{James H. Morris}和 \text{Vaughan Pratt}) 三人于 1977 年联合发表。

(\text{Knuth-Morris-Pratt}) 算法的核心为前缀函数，记作 (\pi(i))，其定义如下：

对于长度为 m 的字符串 s，其前缀函数 (\pi(i)(0 \leq i < m)) 表示 s 的子串 s[0:i] 的最长的相等的真前缀与真后缀的长度。特别地，如果不存在符合条件的前后缀，那么 (\pi(i) = 0)。其中真前缀与真后缀的定义为不等于自身的的前缀与后缀。

我们举个例子说明：字符串 aabaaab 的前缀函数值依次为 0,1,0,1,2,2,3。

(\pi(0) = 0)，因为 a 没有真前缀和真后缀，根据规定为 0（可以发现对于任意字符串 (\pi(0)=0) 必定成立）；
(\pi(1) = 1)，因为 aaaa 最长的一对相等的真前后缀为 a，长度为 1；
(\pi(2) = 0)，因为 aab 没有对应真前缀和真后缀，根据规定为 0；
(\pi(3) = 1)，因为 aaba 最长的一对相等的真前后缀为 a，长度为 1；
(\pi(4) = 2)，因为 aabaa 最长的一对相等的真前后缀为 aa，长度为 2；
(\pi(5) = 2)，因为 aabaaa 最长的一对相等的真前后缀为 aa，长度为 2；
(\pi(6) = 3)，因为 aabaaab 最长的一对相等的真前后缀为 aab，长度为 3。

有了前缀函数，我们就可以快速地计算出模式串在主串中的每一次出现。

如何求解前缀函数

长度为 m 的字符串 s 的所有前缀函数的求解算法的总时间复杂度是严格 O(m) 的，且该求解算法是增量算法，即我们可以一边读入字符串，一边求解当前读入位的前缀函数。

为了叙述方便，我们接下来将说明几个前缀函数的性质： (\pi(i) \leq \pi(i-1) + 1)。

依据 (\pi(i)) 定义得：(s[0:\pi(i)-1]=s[i-\pi(i)+1:i])。
将两区间的右端点同时左移，可得：(s[0:\pi(i)-2] = s[i-\pi(i)+1:i-1])。
依据 (\pi(i-1)π(i−1)) 定义得：(\pi(i-1) \geq \pi(i) – 1)，即 (\pi(i) \leq \pi(i-1) + 1)。
如果 (s[i]=s[\pi(i-1)])，那么 (\pi(i)=\pi(i-1)+1)。
依据 (\pi(i-1)) 定义得：(s[0:\pi(i-1)-1]=s[i-\pi(i-1):i-1])。
因为 (s[\pi(i-1)]=s[i])，可得 (s[0:\pi(i-1)]=s[i-\pi(i-1):i])。
依据 (\pi(i)) 定义得：(\pi(i)\geq\pi(i-1)+1)，结合第一个性质可得 (\pi(i)=\pi(i-1)+1)。
这样我们可以依据这两个性质提出求解 (\pi(i)) 的方案：找到最大的 j，满足 (s[0:j-1]=s[i-j:i-1])，且 (s[i]=s[j])（这样就有 (s[0:j]=s[i-j:i])，即 (\pi(i)=j+1)）。

注意这里提出了两个要求：

j 要求尽可能大，且满足 s[0:j-1]=s[i-j:i-1]；
j 要求满足 s[i]=s[j]。
由 (\pi(i-1)) 定义可知：

( s[0:π(i−1)−1]=si−π(i−1):i−1 )

那么 (j = \pi(i-1)) 符合第一个要求。如果 (s[i]=s[\pi(i-1)])，我们就可以确定 (\pi(i)) 。

否则如果 (s[i]\neq s[\pi(i-1)]) ，那么 (\pi(i) \leq \pi(i-1))，因为(j=\pi(i)-1)，所以(j

当 (s[i]\neq s[\pi(i-1)])时，我们可以修改我们的方案为：找到最大的 j，满足 (s[0:j-1]=s[\pi(i-1)-j:\pi(i-1)-1])，且 (s[i]=s[\pi(i-1)])（这样就有 (s[0:j]=s[\pi(i-1)-j:\pi(i-1)])，即 (\pi(i)=\pi(i-1)+1)）。

注意这里提出了两个要求：

j 要求尽可能大，且满足 (s[0:j-1]=s[\pi(i-1)-j:\pi(i-1)-1])；
j 要求满足 (s[i]=s[j])。
由 (\pi(\pi(i-1)-1)) 定义可知 (j = \pi(\pi(i-1)-1))) 符合第一个要求。如果 (s[i]=s[\pi(\pi(i-1)-1)])，我们就可以确定 (\pi(i))。

此时，我们可以发现 j 的取值总是被描述为 (\pi(\pi(\pi(\ldots)-1)-1))) 的结构（初始为 (\pi(i-1))）。于是我们可以描述我们的算法：设定 (\pi(i)=j+1)，j 的初始值为 (\pi(i-1))。我们只需要不断迭代 j（令 j 变为 (\pi(j-1))）直到 (s[i]=s[j]) 或 j=0 即可，如果最终匹配成功（找到了 j 使得 (s[i]=s[j])），那么 (\pi(i)=j+1)，否则 (\pi(i)=0)。

时间复杂度部分，注意到(\pi(i)\leq \pi(i-1)+1)，即每次当前位的前缀函数至多比前一位增加一，每当我们迭代一次，当前位的前缀函数的最大值都会减少。可以发现前缀函数的总减少次数不会超过总增加次数，而总增加次数不会超过 m 次，因此总减少次数也不会超过 m 次，即总迭代次数不会超过 m 次。
空间复杂度部分，我们只用到了长度为 m 的数组保存前缀函数，以及使用了常数的空间保存了若干变量。

如何解决本题

记字符串 (\textit{haystack}) 的长度为 n，字符串 (\textit{needle}) 的长度为 m。

我们记字符串 (\textit{str} = \textit{needle} + # + \textit{haystack})，即将字符串 (\textit{needle}) 和 (\textit{haystack}) 进行拼接，并用不存在于两串中的特殊字符 # 将两串隔开，然后我们对字符串 (\textit{str}) 求前缀函数。

因为特殊字符 ## 的存在，字符串 \textit{str}str 中 \textit{haystack}haystack 部分的前缀函数所对应的真前缀必定落在字符串 (\textit{needle}) 部分，真后缀必定落在字符串 (\textit{haystack}) 部分。当 \textit{haystack}$ 部分的前缀函数值为 m 时，我们就找到了一次字符串 (\textit{needle}) 在字符串 (\textit{haystack}) 中的出现（因为此时真前缀恰为字符串 (\textit{needle})）。

实现时，我们可以进行一定的优化，包括：

我们无需显式地创建字符串 (\textit{str})。
为了节约空间，我们只需要顺次遍历字符串 (\textit{needle})、特殊字符 ## 和字符串 (\textit{haystack}) 即可。
也无需显式地保存所有前缀函数的结果，而只需要保存字符串 (\textit{needle}) 部分的前缀函数即可。
特殊字符 ## 的前缀函数必定为 0，且易知 (\pi(i) \leq) m（真前缀不可能包含特殊字符 ##）。
这样我们计算 (\pi(i)) 时，(j=\pi(\pi(\pi(\ldots)-1)-1)) 的所有的取值中仅有 (\pi(i-1)) 的下标可能大于等于 m。我们只需要保存前一个位置的前缀函数，其它的 j 的取值将全部为字符串 (\textit{needle}) 部分的前缀函数。
我们也无需特别处理特殊字符 ##，只需要注意处理字符串 \textit{haystack}$ 的第一个位置对应的前缀函数时，直接设定 j 的初值为 0 即可。
这样我们可以将代码实现分为两部分：

第一部分是求 (\textit{needle}) 部分的前缀函数，我们需要保留这部分的前缀函数值。
第二部分是求 (\textit{haystack}) 部分的前缀函数，我们无需保留这部分的前缀函数值，只需要用一个变量记录上一个位置的前缀函数值即可。当某个位置的前缀函数值等于 m 时，说明我们就找到了一次字符串 (\textit{needle}) 在字符串 (\textit{haystack}) 中的出现（因为此时真前缀恰为字符串 (\textit{needle})，真后缀为以当前位置为结束位置的字符串 (\textit{haystack}) 的子串），我们计算出起始位置，将其返回即可。

class Solution {
    public int strStr(String haystack, String needle) {
        int n = haystack.length(), m = needle.length();
        if (m == 0) {
            return 0;
        }
        int[] pi = new int[m];
        for (int i = 1, j = 0; i < m; i++) {
            while (j > 0 && needle.charAt(i) != needle.charAt(j)) {
                j = pi[j - 1];
            }
            if (needle.charAt(i) == needle.charAt(j)) {
                j++;
            }
            pi[i] = j;
        }
        for (int i = 0, j = 0; i < n; i++) {
            while (j > 0 && haystack.charAt(i) != needle.charAt(j)) {
                j = pi[j - 1];
            }
            if (haystack.charAt(i) == needle.charAt(j)) {
                j++;
            }
            if (j == m) {
                return i - m + 1;
            }
        }
        return -1;
    }
}

时间复杂度：O(n+m)，其中 n 是字符串(\textit{haystack}) 的长度，m 是字符串(\textit{needle}) 的长度。我们至多需要遍历两字符串一次。
空间复杂度：O(m)，其中 m 是字符串(\textit{needle}) 的长度。我们只需要保存字符串(\textit{needle}) 的前缀函数。

Original: https://www.cnblogs.com/ciel717/p/16635664.html
Author: 夏尔_717
Title: LeetCode 28. 实现strStr()

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/599186/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【黄啊码】这种PHP验证码你值得拥有（注：支持中文）

csharp;gutter:true; width = $width; $this->height = $height; $this->codeNum = $codeN…

数据库 2023年6月16日
0095
红黑树添加删除

上一篇写了234树对比红黑树,和红黑树某些情况需要调整的原因,这篇就只写红黑树的添加和删除红黑树 JAVA技术交流群:737698533 性质每个节点要么红色要么黑色根节点是…

数据库 2023年6月16日
0056
MySQL实战45讲 9

09 | 普通索引和唯一索引，应该怎么选择？每个人都有一个唯一的身份证号，而且业务代码已经保证了不会写入两个重复的身份证号。如果市民系统需要按照身份证号查姓名，就会执行类似这样的…

数据库 2023年5月24日
00111
事务的ACID特性

技术是为了解决问题而生的，通过事务我们可以解决以下问题：多个操作不是一个整体操作，出现了部分执行成功的情况，导致数据的状态不一致问题（原子性）一组操作只有部分完成，没有全部完成…

数据库 2023年6月11日
0098
详谈 MySQL 8.0 原子 DDL 原理

柯煜昌青云科技研发顾问级工程师目前从事 RadonDB 容器化研发，华中科技大学研究生毕业，有多年的数据库内核开发经验。文章字数 3800+，阅读时间 15 分钟背景 My…

数据库 2023年6月11日
00145
【MySQL】笔记（2）— 部分 DQL 语句；条件查询；排序；分组函数；单行处理函数；group by ，having ；

1.简单的查询语句（DQL）： select 字段名1,字段名2,字段名3,…. from 表名; 注意：1、任何一条sql语句都以”;”结尾；…

数据库 2023年5月24日
00111
21浙比武

可以将获得的windows镜像先挂载获取SAM和SYSTEM注册表文件，然后使用mimikatz 提取windows的密码ntml哈希值 <span class=”ne-te…

数据库 2023年6月11日
0079
Win10系统-接口自动化测试持续集成

使用工具：jdk+jmeter+Ant+jenkins jdk-1.8.0_241版本【安装参考链接：https://blog.51cto.com/u_15463439/52268…

数据库 2023年6月14日
0099
【Kubernetes系列】Kubernetes相关概念介绍

Pod 是可以在 Kubernetes 中创建和管理的、最小的可部署的计算单元。是一组（一个或多个）容器；这些容器共享存储、网络、以及怎样运行这些容器的声明。 Pod 中的内容…

数据库 2023年6月6日
0086
【java框架】SpringBoot(11) — SpringBoot利用监听事件，实现异步操作

请出主角：Spring当中的事件机制没错，本节主要讲的是Spring中事件机制：ApplicationEventPublisher，实现监听ApplicationEvent，最后…

数据库 2023年6月6日
00140
我竟然才知道slf4j里还有个MDC

大家好久不见，我是walking。今天给大家带来一个日志方面的知识——MDC，不知道大家认识不，反正我是最近刚知道的😂 初见MDC 前两天看项目中的代码，无意中看到一个自定义的线程…

数据库 2023年6月11日
00152
MySQL实战45讲 9

09 | 普通索引和唯一索引，应该怎么选择？每个人都有一个唯一的身份证号，而且业务代码已经保证了不会写入两个重复的身份证号。如果市民系统需要按照身份证号查姓名，就会执行类似这样的…

数据库 2023年6月16日
00112
JSP的文件上传和下载

文件的上传和下载文件的上传和下载，是非常常见的功能。很多的系统中，或者软件中都经常使用文件的上传和下载。比如：微信头像，就使用了上传。邮箱中也有附件的上传和下载功能。文件的上传…

数据库 2023年6月11日
0092
MySQL索引：B+树索引

MySQL索引：B+树索引 B+树索引是传统意义上的索引，这是目前关系型数据库系统中查找最为常用和最为有效的索引。B+树索引的构造类似于二叉树，根据键值快速找到数据 B树 B+树是…

数据库 2023年5月24日
0088
一个校验接口引发的思考–我真的了解Response吗

一个校验接口最近，我需要对接一个外部接口，基本功能是：校验指定的门店是否完善了货运信息。接口大致是这样的： POST https://******/Dealer/CheckCar…

数据库 2023年6月6日
00111
解决数据库报错Error 1390: Prepared statement contains too many placeholders的问题

今天，当您开发一个项目时，您试图一次插入大量数据，但出现了以下错误： [En] Today, when you were developing a project, you tri…

数据库 2023年5月24日
00109

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

LeetCode 28. 实现strStr()

方法一：暴力匹配

方法二：Knuth-Morris-Pratt 算法

大家都在看