• 力扣(LeetCode)792. 匹配子序列的单词数(C++)


    二分查找

    直观思考,本题可以将 w o r d s words words 中每个单词 w o r d word word 依次和目标字符串 s s s 比较,检查是否为子串。时间复杂度 n × ∑ i = 0 m − 1 w o r d s i n\times \sum_{i=0}^{m-1}words_i n×i=0m1wordsi n n n s s s 的长度, m m m w o r d s words words 的长度,问题规模 1 0 11 10^{11} 1011 , T L E TLE TLE

    注意到, s s s 中只有 26 26 26 个字母 , 类比哈希思想分桶,但是桶内键值对不唯一,就可以二分优化了。 a l p h a [ i ] alpha[i] alpha[i] 存储 i i i对应字母 的所有下标,那么 a l p h a alpha alpha 就存储了 26 26 26 个字母对应 s s s 的下标。只需一次遍历 s s s ,即可得到 a l p h a alpha alpha

    二分如下:遍历所有单词 w o r d word word ,遍历单词的字母 c c c ,记录位置 p p p ,表示 c c c 在目标串 s s s 中的位置,二分查找桶中第一个大于 p p p 的位置 i t it it , 如果找到,则令 p p p 等于这个位置,可以继续匹配 ; 如果查找越界,说明桶中没有足够字母,可行解- -,提前 b r e a k break break

    代码展示
    class Solution {
    public:
        int numMatchingSubseq(string s, vector<string>& words) {
            vector<vector<int>> alpha(26);
            for(int i = 0;i<s.size();i++) alpha[s[i]-'a'].emplace_back(i);//存所有s字母的下标//分了26个桶
            int ans = words.size();//初始认为所有word符合条件
            for(auto &word:words){//遍历words
                if(word.size()>s.size()){//剪枝
                    ans--;
                    continue;
                }
                int p = -1;//初始小于所有数//找第一个字符
                for(auto &c:word){
                    auto &pos = alpha[c-'a'];//桶
                    auto it = upper_bound(pos.begin(),pos.end(),p);//桶中第一个大于p的位置
                    if(pos.end()==it){//查无此字母
                        ans--;
                        break;//剪枝
                    }
                    p = it[0];//下标更新
                }
            }
            return ans;
        }
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    博主致语

    理解思路很重要!
    欢迎读者在评论区留言,作为日更博主,看到就会回复的。

    AC

    AC

    复杂度分析
    1. 时间复杂度: O ( l o g n × ∑ i = 0 m − 1 w o r d s i ) O(logn\times \sum_{i=0}^{m-1}words_i) O(logn×i=0m1wordsi) n n n s s s 的长度, m m m w o r d s words words 的长度。
    2. 空间复杂度: O ( n ) O(n) O(n) a l p h a alpha alpha 保存了 s s s 所有字母的下标, a l p h a alpha alpha 的空间复杂度 O ( n ) O(n) O(n)
  • 相关阅读:
    进程同步与互斥
    css3中有哪些伪类?
    维格云代码块入门教程
    关于f-stack转发框架的几点分析思考
    【面试HOT100】子串&&普通数组&&矩阵
    TeamTalk中对一条连接收发消息的封装。
    漫谈:C语言 C++ 函数返回值究竟是什么
    多商户商城系统功能拆解41讲-平台端应用-客服设置
    大数据开发(Spark面试真题-卷一)
    基于nodejs+vue食力派网上订餐系统
  • 原文地址:https://blog.csdn.net/Innocence02/article/details/127900764