• 编辑距离-leetcode-牛客


    dp 20 计算字符串的编辑距离

    题目描述
    leetcode版本

    给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数 。

    你可以对一个单词进行如下三种操作:

    插入一个字符
    删除一个字符
    替换一个字符

    牛客版本

    Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家 Levenshtein 提出的,故又叫 Levenshtein Distance 。

    例如:

    字符串A: abcdefg

    字符串B: abcdef

    通过增加或是删掉字符 ”g” 的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

    要求:给定任意两个字符串,写出一个算法计算它们的编辑距离。

    样例:
    "eat"
    "sea"
    2
    "algorithm"
    "altruistic"
    6
    "horse"
    "ros"
    3
    "intention"
    "execution"
    5
    
    思路

    首先是确定状态。确定什么样子的状态好呢?这种时候可以看看题目要的是什么?利用动态规划解题必然是需要得到的状态可以推导出结果。所以状态多跟要的相关。这题要的是两个字符串最短的编辑距离。那么我们就可以定义状态
    d p ( i , j ) : w o r d 1 前 i 个元素转换得到 w o r d 2 前 j 个元素的编辑距离 dp(i,j) : word1 前 i 个元素 转换得到 word2 前 j 个元素 的编辑距离 dp(i,j):word1i个元素转换得到word2j个元素的编辑距离
    在这里用前i个,而不是 到第i个只是为了编程方便。

    那么接下来的状态转移方程呢?

    考虑如下问题:

    如果word1[0…i-1] 到 word2[0…j-1] 的变换需要 k 步,那么word1[0…i] 到 word[0…j]需要多少步?

    答案是:

    如果 word1[i] == word[j],

    那么是k步。

    为什么是k步?这种时候可以从 (i-1,j) 或者dp(i,j-1)的状态到达吗?

    由于dp[i-1] [j-1] = k; 那么 对于dp(i-1,j) ,如果 i > j ,多补充了一个 元素 word2[j] ,可能刚好是word1中后面的元素,因此也就不再需要添加 一个元素 来让两个序列相等了。这样的话 dp(i-1,j) 的值就为k-1。如果新添加的这个元素 word2[j] 不是word1后续的元素,这样就需要 额外的删除和新增操作来让两个序列相等。这样dp(i-1,j) 的值就是k+1.

    对于dp(i,j-1) 同理可得,dp(i,j-1) = k-1 或 k+1.

    我们取最小值k-1做分析。

    而从这两个状态到最后的dp(i,j)状态,又多了一个元素。而我们知道word[i] == word[j] ,如果我们前面用k-1步变了之前的序列,那么就需要拿出一步 添加或者删除 新增的那个元素,此时次数为k步。

    如果之前都需要k+1步,那么从这两个状态到当前状态肯定不如从dp(i-1,j-1)更优。

    因此,取三个状态 的最小值,为k步。

    如果不相等,那么就需要把word[i] 变成 word[j], 那么就是k+1步;

    如果word1[0…i] 到 word2[0…j-1] 的变换需要 k 步,那么word1[0…i] 到 word[0…j]需要多少步?

    首先用k步,(这是最小的步数),把0到j-1变对,最后再用 删除 或者 添加 ,补全最后的 word1[i]。因此,需要k+1步。

    如果word1[0…i-1] 到 word2[0…j] 的变换需要 k 步,那么word1[0…i] 到 word[0…j]需要多少步?

    类似于上个问题,需要k+1步。

    当前序列只可能从上述三个状态转移而来,我们只需要去看这三个状态哪个消耗最少,用它就行。

    代码
    class Solution {
    public:
        int minDistance(string word1, string word2) {
            int n = word1.size(), m = word2.size();
            vector > dp(n+1, vector(m+1));
            for(int i = 0; i <= m; ++i) {//满足定义
                dp[0][i] = i;
            }
            for(int i = 0; i <= n; ++i) {
                dp[i][0] = i;
            }
            for(int i = 1; i <= n; ++i) {
                for(int j = 1; j <= m; ++j) {
                    if(word1[i-1] == word2[j-1]) {
                        dp[i][j] = dp[i-1][j-1];
                    } else {
                        dp[i][j] = min(dp[i-1][j], dp[i][j-1]) + 1;
                        dp[i][j] = min(dp[i][j], dp[i-1][j-1] + 1);
                    }
                }
            }
            // for(int i = 0; i <= n; ++i) {
            //     for(int j = 0; j <= m; ++j) {
            //         cout << dp[i][j] << ' ';
            //     }
            //     cout << endl;
            // }
            return dp[n][m];
        }
    };
    
  • 相关阅读:
    38 深度学习(二):tensorflow基础介绍
    Windows安装最新SonarQube版本
    智能客服话术设计思路
    C++中或运算符(||)执行的逻辑及顺序
    Hive 知识点八股文记录 ——(二)优化
    十、rem适配方案
    k8s--基础--22.11--storageclass--类型--Azure 文件
    好消息|又一省22年二建成绩查询时间公布
    JSON 对比工具
    angular 中引入html单页面
  • 原文地址:https://blog.csdn.net/SDDHDY/article/details/127045913