• Java&C++题解与拓展——leetcode30.串联所有单词的子串【么的新知识】


    每日一题做题记录,参考官方和三叶的题解

    题目要求

    在这里插入图片描述

    思路:滑动窗口

    • 用目标子串的大小作为窗口大小,遍历整个字符串找结果;
    • 为了便于剪枝,减少比较与开销,枚举起始点时
      • 可以将起点根据 当前下标与单词长度的取余结果进行分类,这样就不用频繁的建立新的哈希表和进行单词统计。

      • 每次记录当前窗口内出现的单词,用于和给出的 w o r d s words words比较判断;
      • 当长度超了窗口范围,把前面的单词丢出去维持窗口大小;
      • 同时注意比较每个加入的单词是否存在于 w o r d s words words中,不存在直接剪枝到下一轮判断。

    Java

    class Solution {
        public List<Integer> findSubstring(String s, String[] words) {
            int sl = s.length(), wl = words.length, ww = words[0].length();
            Map<String, Integer> freq = new HashMap<>();
            for (String w : words) // 统计每个单词及其出现的次数
                freq.put(w, freq.getOrDefault(w, 0) + 1);
            List<Integer> res = new ArrayList<>();
            for (int i = 0; i < ww; i++) {
                Map<String, Integer> win = new HashMap<>(); // 记录当前子串中出现的单词
                for (int j = i; j + ww <= sl; j += ww) {
                    String cur = s.substring(j, j + ww); // 当前单词
                    win.put(cur, win.getOrDefault(cur, 0) + 1);
                    if (j >= i + (wl * ww)) { // 长度超了
                        int idx = j - wl * ww;
                        String pre = s.substring(idx, idx + ww);
                        // 删掉第一个单词
                        if (win.get(pre) == 1)
                            win.remove(pre);
                        else
                            win.put(pre, win.get(pre) - 1);
                        if (!win.getOrDefault(pre, 0).equals(freq.getOrDefault(pre, 0))) // 单词不同,剪枝
                            continue;
                    }
                    if (!win.getOrDefault(cur, 0).equals(freq.getOrDefault(cur, 0))) // 单词不同,剪枝
                        continue;
                    if (win.equals(freq)) // win与freq中单词完全相同
                        res.add(j - (wl - 1) * ww);
                }
            }
            return res;
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 时间复杂度: O ( w l + w w × s l ) O(wl+ww\times sl) O(wl+ww×sl),统计单词及出现次数复杂度为 O ( w l ) O(wl) O(wl);枚举取余的结果( i i i循环)复杂度为 O ( w w ) O(ww) O(ww);每次循环最多处理长度为 s l sl sl的字符串。
      • 由于字符串长度固定且不超过 30 30 30,假定所有哈希操作均为 O ( 1 ) O(1) O(1)的;

    • 空间复杂度: O ( w l × w w ) O(wl\times ww) O(wl×ww)

    Rust

    use std::collections::HashMap;
    impl Solution {
        pub fn find_substring(s: String, words: Vec<String>) -> Vec<i32> {
            let mut res = Vec::new();
            let (wl, ww, sl) = (words.len(), words[0].len(), s.len());
            if sl == 0 || wl == 0 || sl < wl * ww {
                return res;
            }
            let sb = s.as_bytes();
            let mut freq = HashMap::with_capacity(ww * 2);
            words.into_iter().for_each(|w| *freq.entry(w).or_insert(0) += 1);
            (0..=sl - wl * ww).filter(|i| {
                let mut win = HashMap::new();
                (0..wl).for_each(|j| {
                    *win.entry(String::from_utf8(sb[(i + j * ww)..(i + (j + 1) * ww)].to_vec()).unwrap()).or_insert(0) += 1;
                });
                freq == win
            }).map(|i| i as i32).collect::<Vec<i32>>()        
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 时间复杂度: O ( w l + w w × s l ) O(wl+ww\times sl) O(wl+ww×sl),统计单词及出现次数复杂度为 O ( w l ) O(wl) O(wl);枚举取余的结果( i i i循环)复杂度为 O ( w w ) O(ww) O(ww);每次循环最多处理长度为 s l sl sl的字符串。
      • 由于字符串长度固定且不超过 30 30 30,假定所有哈希操作均为 O ( 1 ) O(1) O(1)的;

    • 空间复杂度: O ( w l × w w ) O(wl\times ww) O(wl×ww)

    C++

    【在用例86上卡了,返回了空……没太搞懂为啥,就换了官方的思路】

    • 记录窗口中出现的单词,并根据 w o r d s words words所需维护还需要的单词个数。
    • 也就是说前面的 w i n win win存的是窗口内已有的单词数(所以最后应该和 w o r d s words words相等),而C++里的存的是还需要的单词数(所以最后应该空)。
    class Solution {
    public:
        vector<int> findSubstring(string s, vector<string>& words) {
            vector<int> res;
            int sl = s.size(), wl = words.size(), ww = words[0].size();
            for (int i = 0; i < ww && i + wl * ww <= sl; i++) {
                unordered_map<string, int> win;
                for (int j = 0; j < wl; j++)
                    win[s.substr(i + j * ww, ww)]++; // 在窗口内
                for (string &w : words) {
                    if (--win[w] == 0) // 在word内
                        win.erase(w);
                }
                for (int k = i; k < sl - wl * ww + 1; k += ww) {
                    if (k != i) {
                        string cur = s.substr(k + (wl - 1) * ww, ww);
                        if (++win[cur] == 0)
                            win.erase(cur);
                        cur = s.substr(k - ww, ww);
                        if (--win[cur] == 0)
                            win.erase(cur);
                    }
                    if(win.empty()) // word中所有单词都在窗口中出现
                        res.emplace_back(k);
                }
            }
            return res;
        }
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 时间复杂度: O ( w w × s l ) O(ww\times sl) O(ww×sl)
    • 空间复杂度: O ( w l × w w ) O(wl\times ww) O(wl×ww)

    总结

    想到了滑动窗口但做起来依然不顺利,长度超了的判断里面那个剪枝没有注意到,还有各种小细节……这个取余枚举开头的操作很巧,要多多思考~


    欢迎指正与讨论!
  • 相关阅读:
    Day45 MySQL
    区间DP(基础+提高)
    2.5 表达式
    SSL证书过期了网站可以运行吗?
    C++ Reference: Standard C++ Library reference: C Library: cwchar: putwchar
    多线程浅谈
    laravel-实践
    国家地区简码手机号中文名对应表
    Go Slice 排除异己
    el-menu-item动态路径解决方案
  • 原文地址:https://blog.csdn.net/sinat_41135487/article/details/125426890