• 找出字符串中第一个匹配项的下标


    题目链接

    找出字符串中第一个匹配项的下标

    题目描述

    注意点

    • haystack 和 needle 仅由小写英文字符组成

    解答思路

    • 使用KMP算法,相比于普通地将整个字符串分成多块大小为needle.length()的子串找到第一个与needle匹配的子串,其可以在判断出任意一个子串不是匹配项时,无需从haystack下一位和needle第一位开始判断,而是根据needle中相同的前缀,直接排除一定不是匹配项的下标,转而从有可能匹配的位置开始判断,其时间复杂度相比于O(mn)缩短到了O(m + n)
    • KMP算法第一个关键点在于找到needle中相同的前缀,其思路为:建立两个指针i = 1,j = 0,遍历needle,如果i和j处的字符相同,则next[i] = j,且将i和j都向右移动一位;如果i和j处的字符不同,则将j移动至next[j - 1]处,直到i和j处的字符相同或j = 0为止,示例如abeabeabg对应的next数组为000123450
    • KMP算法第二个关键点在于根据next优化查询匹配项的步骤,其思路为:建立两个指针i = 0,k = 0,遍历haystack,如果i和k处的字符相同,则将i和k都向右移动一位;如果i和j处的字符不同,则将k移动至next[k - 1]处,直到i和k处的字符相同或k = 0为止,其保证排除掉一定不是匹配项的下标。示例如在abeabeabeabeabg找到abeabeabg,其会在i = 8,k = 8时判断出当前子串不匹配,随后将指针k移动至5,从指针i = 9,k = 6再一次开启匹配项的判断

    代码

    class Solution {
        public int strStr(String haystack, String needle) {
            // abeabeabeabeabg
            // abeabeabg
            // 000123450
            int m = haystack.length();
            int n = needle.length();
            if (n > m) {
                return -1;
            }
            // 找到needle中相同的前缀
            int[] next = new int[n];
            int j = 0;
            for (int i = 1; i < n; i++) {
                // needle[i] != needle[j],则j = next[j - 1],直到j = 0或needle[i] = needle[j]为止
                while(j > 0 && needle.charAt(i) != needle.charAt(j)) {
                    j = next[j - 1];
                }
                // needle[i] = needle[j],next[i] = j + 1,i++,j++
                if (needle.charAt(i) == needle.charAt(j)) {
                    j++;
                    next[i] = j;
                } else {
                    next[i] = 0;
                }
            }
            int k = 0;
            for (int i = 0; i < m; i++) {
                while (k > 0 && haystack.charAt(i) != needle.charAt(k)) {
                    k = next[k - 1];
                }
                if (haystack.charAt(i) == needle.charAt(k)) {
                    k++;
                }
                if (k == n) {
                    return i - k + 1;
                }
            }
            return -1;
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41

    关键点

    • KMP算法的思想
    • 注意边界问题
  • 相关阅读:
    HTTP协议
    代码随想录算法训练营第1天|二分查找|移除元素
    R语言使用attach函数绑定dataframe数据(可以直接使用列名称访问数据)
    向excel中导入mysql中的数据表
    【Spring Boot 集成应用】Spring Boot与MongoDB的集成配置使用
    javascript算法排序之桶排序
    opengl 学习(三)-----着色器
    微服务中的服务发现是什么?
    css实现箭头
    浅析基于EasyCVR视频技术构建工业园区视频安防大数据监管平台的方案
  • 原文地址:https://blog.csdn.net/weixin_51628158/article/details/133906718