动态规划篇 —— 编辑距离
dp解法
1.状态定义
dp[i][j]定义为以下标i-1, j-1为结尾的字符串S 和 字符串T 的相同子序列的长度
dp数组仍然是多开一个空位,便于后序初始化
2.状态转移
if (s[i - 1] == t[j - 1]),
那么dp[i][j] = dp[i - 1][j - 1] + 1;,因为找到了一个相同的字符,相同子序列长度自然要在dp[i-1][j-1]的基础上加1
if (s[i - 1] != t[j - 1]),
此时相当于t要删除元素,t如果把当前元素t[j - 1]删除,那么dp[i][j] 的数值就是 看s[i - 1]与 t[j - 2]的比较结果了,即:dp[i][j] = dp[i][j - 1];
3.base case
dp[0][0] 和 dp[i][0], 和空子串相同子序列的长度肯定是0,所以初始化dp全为0就行了
4.遍历顺序以及解的所在
正序遍历,能否判断s 是 t 的子序列只用判断dp[m][n] == len(s), 如果说相同子序列长度等于s本身的长度说明是可以的
时间复杂度:O(n × m)
空间复杂度:O(n × m)
class Solution:
def isSubsequence(self, s: str, t: str) -> bool:
m, n = len(s), len(t)
dp = [[0] * (n+1) for _ in range(m+1)]
for i in range(1, m+1):
for j in range(1, n+1):
if s[i-1] == t[j-1]: dp[i][j] = dp[i-1][j-1] + 1
else: dp[i][j] = dp[i][j-1]
return dp[m][n] == len(s)
1.状态定义
dp[i][j]:以i-1为结尾的s子序列中出现以j-1为结尾的t的个数为dp[i][j]。
2.状态转移
这一类问题,基本是要分析两种情况
s[i - 1] 与 t[j - 1]相等
s[i - 1] 与 t[j - 1] 不相等
当s[i - 1] 与 t[j - 1]相等时,dp[i][j]可以有两部分组成:
一部分是用s[i - 1]来匹配,那么个数为dp[i - 1][j - 1]。
一部分是不用s[i - 1]来匹配,个数为dp[i - 1][j]。
dp[i][j] = dp[i - 1][j - 1] + dp[i - 1][j];
例如: s:bagg 和 t:bag ,s[3] 和 t[2]是相同的,但是字符串s也可以不用s[3]来匹配,即用s[0]s[1]s[2]组成的bag。
当然也可以用s[3]来匹配,即:s[0]s[1]s[3]组成的bag。
当s[i - 1] 与 t[j - 1]不相等时
dp[i][j]只有一部分组成,不用s[i - 1]来匹配,即:dp[i - 1][j]
3.base case
从递推公式dp[i][j] = dp[i - 1][j - 1] + dp[i - 1][j]; 和 dp[i][j] = dp[i - 1][j]; 中可以看出dp[i][0] 和dp[0][j]是一定要初始化的
dp[0][j]一定都是0,s如论如何也变成不了t
dp[i][0] 表示:以i-1为结尾的s可以随便删除元素,出现空字符串的个数。
那么dp[i][0]一定都是1,因为也就是把以i-1为结尾的s,删除所有元素,出现空字符串的个数就是1。
dp[0][0]应该是1,空字符串s,可以删除0个元素,变成空字符串t。
4.遍历顺序和解的位置
正序就行,解在dp[m][n]
class Solution:
def numDistinct(self, s: str, t: str) -> int:
m, n = len(s), len(t)
dp = [[0] * (n+1) for _ in range(m+1)]
for i in range(m+1):
dp[i][0] = 1
for j in range(1,n+1):
dp[0][j] = 0
for i in range(1, m+1):
for j in range(1, n+1):
if s[i-1] == t[j-1]: dp[i][j] = dp[i-1][j-1] + dp[i-1][j]
else: dp[i][j] = dp[i-1][j]
return dp[m][n]