• [LeetCode解题报告] 522. 最长特殊序列 II


    一、 题目

    1. 题目描述

    1. 最长特殊序列 II

    难度:中等

    给定字符串列表 strs ,返回其中 最长的特殊序列 。如果最长特殊序列不存在,返回 -1

    特殊序列 定义如下:该序列为某字符串 独有的子序列(即不能是其他字符串的子序列)

    s子序列可以通过删去字符串 s 中的某些字符实现。

    • 例如,“abc”“aebdc” 的子序列,因为您可以删除“aebdc”中的下划线字符来得到 “abc”“aebdc”的子序列还包括“aebdc”“aeb”“” (空字符串)。

    示例 1:

    输入: strs = ["aba","cdc","eae"]
    输出: 3
    
    
    • 1
    • 2
    • 3

    示例 2:

    输入: strs = ["aaa","aaa","aa"]
    输出: -1
    
    
    • 1
    • 2
    • 3

    提示:

    • 2 <= strs.length <= 50
    • 1 <= strs[i].length <= 10
    • strs[i] 只包含小写英文字母

    2. 原题链接

    链接: 522. 最长特殊序列 II

    二、 解题报告

    1. 思路分析

    这题难就难在下边这个显然上,剩下的都是套路。

    先说一个显然:如果s的子序列ss是一个特殊序列,那么s更是特殊序列。
    
    • 1
    • 因此本题只需要判断每个字符串是否是其它字符串的子序列。
    • 如果一个字符串不是任何一个其它字符串的子序列,这个字符串本身就是一个特殊序列,可以用来更新答案。
    • 最后取所有特殊字符串的长度求max即可,没有就置-1.
    子序列自动机
    • 由于枚举每两个点对,因此对每个字符串,都要检查n-1个别的串是否是它的子序列(不剪枝的情况)。
    • 对一个串多次检查子序列的方法,可以用到子序列自动机。
    • 判断子序列的朴素方法是用双指针i,j。i在原串上,j在模式串上。我们发现i向右移动时,一定优先取最近的(即最早出现)、等于p[j]的字符,复每次最坏匹配复杂度 O(n+m)。
    • 那么我们可以用dp的方式预处理出来每个字符下一个字符最早出现的位置,匹配时就可以直接i指针移动到下一个符合的字符,跳过大量无用比较。
    • 自动机构造复杂度 O(mc)*,c=26即为字典长度,m是原串长度。每次匹配复杂度为 O(n)。
    • 参考我的题解Python子序列自动机做法

    2. 复杂度分析

    • 显然枚举点对n^2是跑不了的。
    • 设字符串平均长度为m。
    • 双指针做法复杂度 T(n) = O(n×n×2m)
    • 自动机做法,每个字符串只需要构造一次自动机,耗费m×26,然后剩下n-1个串去匹配耗费m, 因此复杂度T(n) = O(n×(m×26+n×m)) = O(n×n×m+n×m×26)
    • 主要复杂度依然取决于外层n^2。
    • 省的时间不多 diff = n×n×m - n×m×26

    3. 代码实现

    子序列自动机

    class SubSequenceAuto:
        def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'):
            self.s,self.abc = s,abc
            self.n,abc_len = len(s),len(abc)
            self.abc_index = {v:k for k,v in enumerate(abc)}
            self.dp = [[self.n]*abc_len for _ in range(self.n+1)]
            dp = self.dp
            # dp.append([self.n]*abc_len)
            for i in range(self.n-1,-1,-1):
                dp[i] = dp[i+1][:]
                dp[i][self.abc_index[s[i]]] = i
                # for j in range(abc_len):
                #     dp[i][j] = i if s[i]==abc[j] else dp[i+1][j] 
        def query_is_sub_seq(self,t):
            dp = self.dp
            abc_index = self.abc_index
            n = self.n
            r = 0
            for c in t:
                r = dp[r][abc_index[c]]
                if r == n:
                    return False
                r += 1
            return True
    class Solution:
        def findLUSlength(self, strs: List[str]) -> int:
            """
            先说一个显然:如果s的子序列ss是一个特殊序列,那么s更是特殊序列。
            因此本题只需要判断每个字符串是否是其它字符串的子序列。
            判断子序列可以双指针,或者用子序列自动机。
            """
            n = len(strs)
            flags = [True] * n  # 每个字符串是否是特殊序列,初始化为0。如果他是别人的子序列,则置False
            # 以下判断j是不是i的子序列
            for i in range(n):
                sba = SubSequenceAuto(strs[i])
                for j in range(n):
                    if i == j or flags[j] ==False:
                        continue
                    if sba.query_is_sub_seq(strs[j]):
                        flags[j] = False 
            
            ans = -1
            for i in range(n):
                if flags[i]:
                    ans = max(ans,len(strs[i]))
            return ans
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47

    三、 本题小结

    1. 子序列自动机的做法可以优化判断子序列的时间,当字符串长度非常大时,优势才明显。但这题数据较弱,因此优势不明显。
    2. 有时间把子序列自动机模板写一下。

    四、 参考链接

  • 相关阅读:
    Swagger的界面太丑,试试knife4j的接口文档吧
    完整大数据集群配置(从配置虚拟机到实操)
    JAVA中的集合类型的理解及应用
    2022年全球市场氨苯蝶啶原料药总体规模、主要生产商、主要地区、产品和应用细分研究报告
    JAVA基础(四十二)——集合之Collection
    如何用Python做量化交易策略?
    Unity-性能优化
    九大装修收纳空间的设计,收藏备用!福州中宅装饰,福州装修
    梳理各个大厂春秋招分享,阿里/腾讯/美团/字节1万道Java中高级面试题
    C++——虚函数、虚析构函数、纯虚函数、抽象类
  • 原文地址:https://blog.csdn.net/liuliangcan/article/details/125481714