给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。
示例 1:
输入: s = “cbaebabacd”, p = “abc”
输出: [0,6]
解释:
起始索引等于 0 的子串是 “cba”, 它是 “abc” 的异位词。
起始索引等于 6 的子串是 “bac”, 它是 “abc” 的异位词。
示例 2:
输入: s = “abab”, p = “ab”
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 “ab”, 它是 “ab” 的异位词。
起始索引等于 1 的子串是 “ba”, 它是 “ab” 的异位词。
起始索引等于 2 的子串是 “ab”, 它是 “ab” 的异位词。
提示:
1 <= s.length, p.length <= 3 * 10^4
s 和 p 仅包含小写字母
解法:滑动窗口
参考官方题解:指路
思路:
根据题目要求,我们需要在字符串s寻找字符串p的异位词。因为字符串p的异位词的长度一定与字符串p的长度相同,所以我们可以在字符串s中构造一个长度为与字符串p的长度相同的滑动窗口,并在滑动中维护窗口中每种字母的数量;当窗口中每种字母的数量与字符串p中每种字母的数量相同时,则说明当前窗口为字符串p的异位词。
算法:
在算法的实现中,我们可以使用数组来存储字符串p和滑动窗口中每种字母的数量。
细节:
当字符串s的长度小于字符串p的长度时,字符串s中一定不存在字符串p的异位词。但是因为字符串s中无法构造长度与字符串p的长度相同的窗口,所以这种情况需要单独处理。
代码分析:
因为字符串中的字符全是小写字母,可以用长度为26的数组记录字母出现的次数
s_count = [0] * 26
p_count = [0] * 26
记录p字符串的字母频次p_count,和s字符串前len(p )个字母频次s_count
for i in range(p_len):
s_count[ord(s[i]) - 97] += 1
p_count[ord(p[i]) - 97] += 1
若p_cnt和s_cnt相等,则找到第一个异位词索引0
if s_count == p_count:
ans.append(0)
继续遍历s字符串索引为[len(p ), len(s))的字母,在s_count中每次增加一个新字母,去除一个旧字母
判断p_count和s_count是否相等,相等则在返回值res中新增异位词索引i+ 1
for i in range(s_len - p_len):
# 下面两行都是s_count
s_count[ord(s[i]) - 97] -= 1 #减1
s_count[ord(s[i + p_len]) - 97] += 1 #加1
if s_count == p_count:
ans.append(i + 1)
代码实现:
class Solution:
def findAnagrams(self, s: str, p: str) -> List[int]:
s_len, p_len = len(s), len(p)
if s_len < p_len:
return []
ans = []
s_count = [0] * 26
p_count = [0] * 26
for i in range(p_len):
# ord(字符串):返回该字符串的Unicode码,a的Unicode码为97
s_count[ord(s[i]) - 97] += 1
p_count[ord(p[i]) - 97] += 1
if s_count == p_count:
ans.append(0)
for i in range(s_len - p_len):
# 下面两行都是s_count
s_count[ord(s[i]) - 97] -= 1 #减1
s_count[ord(s[i + p_len]) - 97] += 1 #加1
if s_count == p_count:
ans.append(i + 1)
return ans