• Leetcode刷题解析——串联所有单词的子串


    1. 题目链接:30. 串联所有单词的子串

    2. 题目描述:

    给定一个字符串 s 和一个字符串数组 words words 中所有字符串 长度相同

    s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

    • 例如,如果 words = ["ab","cd","ef"], 那么 "abcdef""abefcd""cdabef""cdefab""efabcd", 和 "efcdab" 都是串联子串。 "acdbef" 不是串联子串,因为他不是任何 words 排列的连接。

    返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

    示例 1:

    输入:s = "barfoothefoobarman", words = ["foo","bar"]
    输出:[0,9]
    解释:因为 words.length == 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
    子串 "barfoo" 开始位置是 0。它是 words 中以 ["bar","foo"] 顺序排列的连接。
    子串 "foobar" 开始位置是 9。它是 words 中以 ["foo","bar"] 顺序排列的连接。
    输出顺序无关紧要。返回 [9,0] 也是可以的。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    示例 2:

    输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
    输出:[]
    解释:因为 words.length == 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。
    s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
    所以我们返回一个空数组。
    
    • 1
    • 2
    • 3
    • 4
    • 5

    示例 3:

    输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
    输出:[6,9,12]
    解释:因为 words.length == 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。
    子串 "foobarthe" 开始位置是 6。它是 words 中以 ["foo","bar","the"] 顺序排列的连接。
    子串 "barthefoo" 开始位置是 9。它是 words 中以 ["bar","the","foo"] 顺序排列的连接。
    子串 "thefoobar" 开始位置是 12。它是 words 中以 ["the","foo","bar"] 顺序排列的连接。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    提示:

    • 1 <= s.length <= 104
    • 1 <= words.length <= 5000
    • 1 <= words[i].length <= 30
    • words[i]s 由小写英文字母组成

    3. 算法思路:

    1. 这段代码使用滑动窗口的思想来解决字符串匹配的问题。给定一个主串s和一个模式串words,如果s中存在一个子串,该子串包含words中所有单词且顺序一致,那么这个子串就是words的一个"串联子串"。代码的目标是在s中寻找所有的串联子串的起始位置。

    2. 首先,用一个哈希表hash1来保存模式串words中所有单词的频次。然后遍历字符串s的所有可能起始位置,记为x

    3. 接下来,构建一个新的哈希表hash2,用于维护滑动窗口内的单词频次。滑动窗口的起始位置为x,终止位置为y,窗口的长度是len(words中单词长度的总和)。每次移动窗口时,将窗口右边的单词加入到hash2中,并更新对应单词的频次和计数count。如果窗口内的单词频次在hash1中存在且小于等于hash1中的频次,则count1

    4. 如果窗口的长度超过len*m(m是words中单词的个数),说明窗口左边的单词已经不在窗口范围内,需要移出窗口并更新hash2count。具体操作是:将窗口左边的单词移出窗口,并更新对应单词的频次和count

    5. 最后,当count等于m时,将窗口左边的起始位置加入到结果集ret中。

    6. 最后返回ret,即为所有串联子串的起始位置。

    请添加图片描述

    4. C++算法代码:

    class Solution {
    public:
        vector findSubstring(string s, vector& words) {
            vector ret;
            unordered_map hash1;//保存words里面所有单词的频次
            for(auto&s:words)hash1[s]++;
            int len=words[0].size();
            int m=words.size();
            for(int i=0;ihash2;//维护窗口内单词的频次
                for(int left=i,right=i,count=0;right+len<=s.size();right+=len)
                {
                    //进窗口+维护count
                    string in=s.substr(right,len);
                    hash2[in]++;
                    if(hash1.count(in)&&hash2[in]<=hash1[in])count++;
                    //判断
                    if(right-left+1>len*m)
                    {
                        //出窗口+维护count
                        string out=s.substr(left,len);
                        if(hash1.count(out)&&hash2[out]<=hash1[out])count--;
                        hash2[out]--;
                        left+=len;
                    }
                    //更新结果
                    if(count==m) ret.push_back(left);
                }
            }
              return ret;
        }
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
  • 相关阅读:
    Linux命令记录
    SSRF漏洞复现(redis)
    imx6ull - 制作烧录SD卡
    阅读 | 003《知识图谱发展报告2022》(二)知识表示学习
    技术周总结 08.05-08.11周日(scala git回滚)
    【Gan教程 】 什么是变分自动编码器VAE?
    windows USB设备驱动开发-双角色驱动
    C++ Reference: Standard C++ Library reference: C Library: cctype: islower
    白盒测试(路径覆盖、判定覆盖、条件覆盖)
    使用vscode开发uniapp项目常用的辅助插件,提升开发效率
  • 原文地址:https://blog.csdn.net/weixin_51799303/article/details/133968457