• 459. 重复的子字符串(力扣LeetCode)


    459. 重复的子字符串

    题目描述

    给定一个非空的字符串 s ,检查是否可以通过由它的一个子串重复多次构成。

    示例 1:

    输入: s = “abab”
    输出: true
    解释: 可由子串 “ab” 重复两次构成。

    示例 2:

    输入: s = “aba
    输出: false

    示例 3:

    输入: s = “abcabcabcabc”
    输出: true
    解释: 可由子串 “abc” 重复四次构成。 (或子串 “abcabc” 重复两次构成。)

    提示:

    • 1 <= s.length <= 104
    • s 由小写英文字母组成

    暴力

    这段代码的工作原理如下:

    1. 外层循环每次将字符串s的下一个字符加入到子串a中,这个子串可能是重复的单元。
    2. 内层循环尝试用子串a去匹配整个字符串s。
    3. 如果在某次内层循环中,a成功地匹配了整个s(其中count用于跟踪a在s中重复的次数),那么函数返回true。
    4. 如果a在任何点上失败(字符不匹配),内层循环将会中断,并且外层循环继续尝试下一个可能的子串。

    该算法是一个基本的解法,对于每个可能的子串进行尝试,时间复杂度为O(n^2),其中n是字符串s的长度。在最坏的情况下,例如当字符串为全部由相同字符组成时,这个解法可能会比较慢。更高效的算法可能会使用KMP算法或字符串哈希来降低复杂度。

    // 定义解决方案类
    class Solution {
    public:
        // repeatedSubstringPattern成员函数,接受一个字符串s
        bool repeatedSubstringPattern(string s) {
            // a用于存储当前正在检查的子串
            string a="";
    
            // 循环遍历字符串的前半部分
            // 如果s能由子串重复构成,那么子串的长度不会超过s长度的一半
            for(int i=0; i < s.size() / 2; i++) {
                // 将当前字符添加到子串a中
                a += s[i];
    
                // count用于记录当前已匹配的字符数
                int count = 0;
                // k用于在子串a中的比较位置
                int k = 0;
                
                // 遍历整个字符串s
                for(int j = 0; j < s.size(); j++) {
                    // 如果字符匹配,增加已匹配的字符数,移动k到下一个位置
                    if(s[j] == a[k]) {
                        count++;
                        k++;
                        // 如果已匹配字符数等于子串a的长度
                        if(count == a.size()) {
                            // 如果此时已经到达s的末尾,则返回true
                            if(j == s.size() - 1)
                                return true;
                            // 重置已匹配字符数和子串a的比较位置
                            count = 0;
                            k = 0;
                        }
                    } else {
                        // 一旦遇到不匹配的情况,立即跳出内层循环
                        break;
                    }
                }
            }
            // 如果循环结束都没有找到符合条件的子串,返回false
            return false;
        }
    };
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45

    移动匹配

    当一个字符串s:abcabc,内部由重复的子串组成,那么这个字符串的结构一定是这样的:
    在这里插入图片描述
    也就是由前后相同的子串组成。

    那么既然前面有相同的子串,后面有相同的子串,用 s + s,这样组成的字符串中,后面的子串做前串,前面的子串做后串,就一定还能组成一个s,如图:
    在这里插入图片描述
    所以判断字符串s是否由重复子串组成,只要两个s拼接在一起,里面还出现一个s的话,就说明是由重复子串组成。

    当然,我们在判断 s + s 拼接的字符串里是否出现一个s的的时候,要刨除 s + s 的首字符和尾字符,这样避免在s+s中搜索出原来的s,我们要搜索的是中间拼接出来的s。

    代码如下:

    // 定义解决方案类
    class Solution {
    public:
        // 定义成员函数repeatedSubstringPattern,它接受一个字符串s
        bool repeatedSubstringPattern(string s) {
            // 创建一个新字符串t,由字符串s重复拼接一次得来,这样任何s的重复子串模式都会在新字符串t中出现两次
            string t = s + s;
    
            // 从t的开头删除一个字符,这是为了除去原始字符串的单独完整出现
            t.erase(t.begin());
            // 从t的尾部删除一个字符,同样是为了确保消除原始字符串的单独完整出现
            t.erase(t.end() - 1);
    
            // 在新字符串t中寻找原始字符串s
            // 如果发现s存在于t中(并且不是在开头或者结尾,因为那些位置已经被删除了)
            // 那么说明s可以由它的一个子串通过重复多次构成
            if (t.find(s) != -1) return true;
    
            // 如果在t中找不到s作为子串,说明s不能由它的子串通过重复构成,返回false
            return false;
        }
    };
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 时间复杂度: O(n)
    • 空间复杂度: O(1)
    • 不过这种解法还有一个问题,就是 我们最终还是要判断 一个字符串(s + s)是否出现过 s 的过程,大家可能直接用contains,find 之类的库函数。 却忽略了实现这些函数的时间复杂度(暴力解法是m * n,一般库函数实现为 O(m + n))。

    如果我们做过 28. 找出字符串中第一个匹配项的下标 题目的话,其实就知道,实现一个 高效的算法来判断 一个字符串中是否出现另一个字符串是很复杂的,这里就涉及到了KMP算法。

    KMP算法

    详细解析可以看这篇文章:459.重复的子字符串

    // 定义解决方案类
    class Solution {
    public:
        // repeatedSubstringPattern成员函数接受一个字符串s
        bool repeatedSubstringPattern(string s) {
            // 获取字符串的长度
            int len = s.size();
    
            // 定义next数组,大小与s的长度相同
            int next[len];
    
            // 用私有成员函数getnext来填充next数组
            getnext(next, s);
    
            // 检查next数组的最后一个元素
            // 如果next[len-1]不为0,并且s的长度能够被(s的长度 - next[len-1])整除
            // 则s由重复的子串构成
            if (next[len - 1] != 0 && (len % (len - next[len - 1]) == 0))
                return true; // 存在重复的子串模式
    
            // 如果不满足上述条件,则不存在重复的子串模式
            return false;
        }
    
    private:
        // 定义getnext函数,用于填充next数组
        void getnext(int* next, string& s) {
            // 初始化j为0(j代表当前正在比较的s的前缀的长度)
            int j = 0;
    
            // next数组的第一项总是0,因为一个字符没有前缀和后缀
            next[0] = 0;
    
            // 遍历字符串s的每个字符,计算next数组的值
            for (int i = 1; i < s.size(); i++) {
                // 如果当前字符与前缀的下一个字符不匹配,回退到前一个匹配的位置
                while (j > 0 && s[i] != s[j])
                    j = next[j - 1];
    
                // 如果当前字符匹配前缀的下一个字符,j增加1
                if (s[i] == s[j])
                    j++;
    
                // 将j作为next数组的当前元素的值
                next[i] = j;
            }
        }
    };
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49

    这段代码的逻辑是这样的:

    1. 在主函数repeatedSubstringPattern中,我们首先创建一个与输入字符串s等长的next数组。
    2. 然后调用getnext函数来填充next数组。这个函数计算字符串s的每个前缀的最长相等前后缀长度。
    3. 接下来检查next数组的最后一个元素(next[len - 1])。如果这个值不为0,并且s的长度能被s长度减去next[len - 1]的结果整除,那么字符串s就是由重复的子串构成的。

    简单来说,如果s是由重复的子串构成的,那么next数组的最后一个元素将会是一个不为0的值,这个值是重复子串的长度的整数倍。例如,对于字符串s = “abcabc”,next数组的最后一个值是3,表明有一个长度为3的子串重复出现了。由于字符串长度为6,6 % (6 - 3) 等于0,这意味着字符串可以由长度为3的子串重复两次构成,符合题目的要求。

  • 相关阅读:
    【Redis入门笔记 01】redis 安装 & 配置
    基于卡尔曼滤波的二维目标跟踪(Matlab代码实现)
    HMS Core Discovery第17期直播预告|音随我动,秒变音色造型师
    AI 脸部美容,一键让你变瘦变美变老变年轻
    超声波检测(AE)
    2>&1到底是什么意思?
    一键关闭 Win11 系统广告「GitHub 热点速览」
    Qt自己画个Y轴,如何和qcustomplot建立的X轴原点对齐?
    带你了解如何防御DDoS攻击
    在虚拟机安装JDK
  • 原文地址:https://blog.csdn.net/m0_73841621/article/details/136331354