• [100天算法】-面试题 17.17.多次搜索(day 43)


    题目描述

    1. 给定一个较长字符串big和一个包含较短字符串的数组smalls,设计一个方法,根据smalls中的每一个较短字符串,对big进行搜索。输出smalls中的字符串在big里出现的所有位置positions,其中positions[i]为smalls[i]出现的所有位置。
    2. 示例:
    3. 输入:
    4. big = "mississippi"
    5. smalls = ["is","ppi","hi","sis","i","ssippi"]
    6. 输出: [[1,4],[8],[],[3],[1,4,7,10],[5]]
    7. 提示:
    8. 0 <= len(big) <= 1000
    9. 0 <= len(smalls[i]) <= 1000
    10. smalls的总字符数不会超过 100000
    11. 你可以认为smalls中没有重复字符串。
    12. 所有出现的字符均为英文小写字母。
    13. 来源:力扣(LeetCode)
    14. 链接:https://leetcode-cn.com/problems/multi-search-lcci
    15. 著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

    方法 1:Trie

    思路

    Trie 有两个思路方向,一个是把 big 存进 Trie 中,另一个是把 smalls 存进 Trie 中。

    但由于 Trie 这种数据结构非常消耗空间,所以,当我们要在一个长字符串中查找短字符串时,正确的直觉应该是把短字符串存到 Trie 中,保证 Trie 的高度要尽量的小。

    • 以 smalls 数组构建 Trie,并在结束节点记录每个短串在 smalls 数组中的下标;
    • 遍历 big,截取所有以 longest 为长度的子串(longest 是 smalls 中最长的单词长度),拿到 Trie 中去寻找所有匹配的短串,返回所有匹配到的下标,根据下标把当前子串的位置更新到对应的结果数组中。

    截取 longest 长度的字符子串这步并不是必须,但 JS 中函数参数是按值传递的,所以如果每次都传整个 big 字符串,感觉是不是也有点消耗空间?

    复杂度分析

    时间空间
    insertO(len(smalls)∗avg) avg 是短串的平均长度O(navg) n 是字符集大小,avg 是短串的平均长度
    searchO(maxLen(smalls)∗len(smalls))O(nm)

    代码

    Trie 的修改:

    • insert: 把单词的下标存在最后的节点中
    • search: 需要返回寻找路径中匹配到的所有单词的下标

    TypeScript Code

    search(word: string): Array {
        let crawl: TrieNode = this.root
    
        const res: Array = []
        for (let char of word) {
            const index: number = this._char2Index(char)
            if (!crawl.children[index]) return res
            crawl = crawl.children[index]
            if (crawl.pos > -1) res.push(crawl.pos)
        }
        return res
    }

    TypeScript Code

    function multiSearch(big: string, smalls: string[]): number[][] {
        // 把短字符串存进 Trie
        const trie: Trie = new Trie();
        smalls.forEach((word: string, index: number): void => {
            trie.insert(word, index);
        });
    
        const res: number[][] = Array(smalls.length)
            .fill(0)
            .map(() => []);
    
        // 找到 smalls 中最长字符串长度
        const longest: number = smalls.reduce(
            (res: number, word: string): number => Math.max(res, word.length),
            0,
        );
    
        // 遍历 big,将以 longest 为长度的子串拿到 Trie 中去找有没有匹配的短串
        // 有的话,会返回那个短串在 smalls 中对应的下标,那就把子串对应的开始下标 i 存在对应的结果数组里好了
        for (let i = 0; i < big.length; i++) {
            const indices = trie.search(big.slice(i, i + longest));
            indices.forEach(index => res[index].push(i));
        }
    
        return res;
    }

    方法 2:暴力法

    思路

    又写了下暴力法,先找出 smalls 中最长的单词长度 longest,遍历 big,然后在第二层循环中,枚举所有长度小于 longest 的子串,跟 smalls 中的词一一对比。

    代码

    JavaScript

    /**
     * @param {string} big
     * @param {string[]} smalls
     * @return {number[][]}
     */
    function multiSearch(big, smalls) {
        const longest = smalls.reduce((res, w) => Math.max(res, w.length), 0);
    
        const res = Array(smalls.length)
            .fill(0)
            .map(() => []);
    
        for (let i = 0; i < big.length; i++) {
            for (let j = i + 1; j <= i + longest && j <= big.length; j++) {
                const subStr = big.slice(i, j);
                for (let k = 0; k < smalls.length; k++) {
                    if (smalls[k] === subStr) {
                        res[k].push(i);
                    }
                }
            }
        }
    
        return res;
    }
  • 相关阅读:
    Qt 防止程序多次运行
    第12章_数据库其它调优策略
    react-demo项目:支持使用scss(不使用create-react-app脚手架)
    Flink部署——Debugging(开发实用,建议收藏)
    鸿蒙开发 p60 pro手机支持 api9吗
    Java分支语句
    xml mysql 强制走区分大小写查询
    每天一个面试题:四种引用,弱引用防止内存泄漏
    客户端简单实现断路器
    信息系统项目管理师-沟通管理论文提纲
  • 原文地址:https://blog.csdn.net/xiaoshun007/article/details/134033887