• 代码随想录算法训练营day9 | 28. 实现 strStr()、459.重复的子字符串


    28. 实现 strStr()

    暴力解法:双重循环,外层是haystack字符串,内层是needle字符串

    KMP算法:当haystack字符串和needle字符串已经匹配部分之后,如果下一个不匹配后,暴力法将会从头开始匹配,已经匹配的部分不能被充分利用

    KMP算法能够充分利用已经匹配的部分,首先对needle求最长公共前后缀next,因为对已经匹配上的部分得到最长公共前后缀后可以确定移动位置;然后循环haystack字符串,与needle进行匹配,利用求得的next得到needle下一个匹配的位置

    如何求最长公共前后缀
    1. 初始化
    2. 处理前后缀不相同的情况
    3. 处理前后缀相同的情况

    使用 前缀表统一减一的方式

    初始化
    1. int j = -1;
    2. next[0] = j;

    定义两个指针i和j,j指向前缀末尾位置,i指向后缀末尾位置。

    next[i] 表示 i(包括i)之前最长相等的前后缀长度(其实就是j)

    处理前后缀情况

    需要注意:前后缀不相同的情况一定要放在相同的前面,不然有时就会漏处理第一个字符的情况,因为回退到j==-1后需要比较s[i]和s[j + 1]的情况才能确定第一个字符的情况

    1. void getNext(int* next, const string& s){
    2. int j = -1;
    3. next[0] = j;
    4. for(int i = 1; i < s.size(); i++) { // 注意i从1开始
    5. while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
    6. j = next[j]; // 向前回退
    7. }
    8. if (s[i] == s[j + 1]) { // 找到相同的前后缀
    9. j++;
    10. }
    11. next[i] = j; // 将j(前缀的长度)赋给next[i]
    12. }
    13. }
    字符串与模式串进行匹配

    求完最长公共前后缀之后就可以循环haystack字符串,与needle进行匹配

    1. int j = -1; // 因为next数组里记录的起始位置为-1
    2. for (int i = 0; i < s.size(); i++) { // 注意i就从0开始
    3. while(j >= 0 && s[i] != t[j + 1]) { // 不匹配
    4. j = next[j]; // j 寻找之前匹配的位置
    5. }
    6. if (s[i] == t[j + 1]) { // 匹配,j和i同时向后移动
    7. j++; // i的增加在for循环里
    8. }
    9. if (j == (t.size() - 1) ) { // 文本串s里出现了模式串t
    10. return (i - t.size() + 1);
    11. }
    12. }
    前缀表统一减一的方式
    1. class Solution:
    2. def strStr(self, haystack: str, needle: str) -> int:
    3. next = [-1] * len(needle)
    4. self.getNext(needle, next)
    5. j = -1
    6. for i in range(len(haystack)):
    7. while haystack[i] != needle[j + 1] and j >= 0:
    8. j = next[j]
    9. if haystack[i] == needle[j + 1]:
    10. j += 1
    11. if j == len(needle) - 1:
    12. return i - j
    13. return -1
    14. def getNext(self, s, next):
    15. j = -1
    16. next[0] = j
    17. for i in range(1, len(s)):
    18. while s[j + 1] != s[i] and j >= 0:
    19. j = next[j]
    20. if s[j + 1] == s[i]:
    21. j += 1
    22. next[i] = j
    前缀表不减一的方式
    1. class Solution:
    2. def strStr(self, haystack: str, needle: str) -> int:
    3. next = [0] * len(needle)
    4. self.getNext(needle, next)
    5. j = 0
    6. for i in range(len(haystack)):
    7. while haystack[i] != needle[j] and j > 0:
    8. j = next[j-1]
    9. if haystack[i] == needle[j]:
    10. j += 1
    11. if j == len(needle):
    12. return i - j + 1
    13. return -1
    14. def getNext(self, s, next):
    15. j = 0
    16. next[0] = j
    17. for i in range(1, len(s)):
    18. while s[j] != s[i] and j > 0:
    19. j = next[j-1]
    20. if s[j] == s[i]:
    21. j += 1
    22. next[i] = j

    注:两种思想是一样的,只是实现有点差别

    459.重复的子字符串

    两个字符串拼接,去除首尾元素,如果包含原字符串则说明是重复的子字符串

    1. class Solution:
    2. def repeatedSubstringPattern(self, s: str) -> bool:
    3. # 使用find, s+s,去除第一位和最后一位,还能找到s说明有重复子串
    4. if len(s) <= 1:
    5. return False
    6. ss = s[1:] + s[:-1]
    7. return ss.find(s) != -1

    使用KMP算法,推理过程比较复杂,主要在于 next[-1] != -1 and len(s) % (len(s) - (next[-1]+1)) == 0 这一步的判断

    1. class Solution:
    2. def repeatedSubstringPattern(self, s: str) -> bool:
    3. if len(s) <= 1:
    4. return False
    5. # 得到next数组
    6. next = [-1] * len(s)
    7. self.getNext(s, next)
    8. if next[-1] != -1 and len(s) % (len(s) - (next[-1]+1)) == 0:
    9. return True
    10. return False
    11. def getNext(self, s, next):
    12. j = -1
    13. next[0] = j
    14. for i in range(1, len(s)):
    15. while s[i] != s[j+1] and j >= 0:
    16. j = next[j]
    17. if s[i] == s[j+1]:
    18. j += 1
    19. next[i] = j

  • 相关阅读:
    MySQL数据表的基本操作和基于 MySQL数据表的基本操作的综合实例项目
    SRS之StateThreads学习
    基于SSM的图书商城系统的设计与实现
    QT_C++_多线程
    这五个步骤,网络有故障,自己都能解决
    “最熟悉的陌生人”之Elsevier出版社全解说
    【支付】支付安全
    JavaEE——spring MVC请求处理
    Java Double valueOf(double d)方法具有什么功能呢?
    WPS—JS宏笔记记录
  • 原文地址:https://blog.csdn.net/sunflowers11/article/details/138201029