• 计算字符串的编辑距离(python)


    Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换
    成另一个所需要的最少操作次数,许可的编辑操作包括将一个字符替换成另一个字符,
    插入一个字符,删除一个字符,编辑距离的算法是首先由俄国科学家Levanshtein 提出的
    故又叫Levenshtein Distance。
    例如:
    字符串A : abcdefg
    字符串B : abcdef
    通过增加或是删掉字符“g” 的方式达到目的,这两种方案都需要一次操作。把这个操作
    所需要的次数定义为两个字符串的距离。
    要求: 给定任意连个字符串,写出一个算法计算它们的编辑距离。
    数据范围: 给定的字符串长度满足1<= len(str) <= 10000
    输入描述:
    每组用例一共2行,为输入的两个字符串
    输出描述:
    每组用例输出一行,代表字符串的距离
    示例:
    输入: abcdefg
    abcdef
    输出: 1

    • 这是一道动态规划的题,规律 就是
    • 1、某一点 处 string_a 和string_b 的位置相等,改点处的编辑距离是dp[row -1][col-1]
    • 2、如果不相等则等于相邻三个点的中最小的加+1
    • 填完表后,srring_a 到string_b 的编辑距离就是dp[n][m]
      填表如下图:
      在这里插入图片描述
      代码如下:
    def edit_distance():
        """编辑距离"""
        string_a = input()
        string_b = input()
        m = len(string_a)
        n = len(string_b)
        dp = [[0 for _ in range(m + 1)] for _ in range(n + 1)]
        # 从空位置变到string_a每个位置的距离
        for col in range(m + 1):
            dp[0][col] = col
        # 从空位置变到string_b 每个位置的距离
        for row in range(n + 1):
            dp[row][0] = row
    
        # 填表
        for row in range(1, n+1):
            for col in range(1, m+1):
                if string_a[col-1] != string_b[row-1]:
                    dp[row][col] = min(dp[row - 1][col], dp[row - 1][col-1], dp[row][col-1]) + 1
                else:
                    dp[row][col] = dp[row-1][col-1]
        print(dp[n][m])
    
    if __name__ == '__main__':
        edit_distance()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
  • 相关阅读:
    netstat 基本使用方法
    UWA Pipeline 2.3.2版本更新说明
    分布式与一致性协议之CAP(三)
    教你实现物联网HMI/网关的趋势功能
    golang的多表联合orm
    MySQL 回表
    中国游戏「二十年」:崛起、爆发与新机遇
    浅析Relaxed Ordering对PCIe系统稳定性的影响
    SpringBoot粗浅分析
    API网关是什么?
  • 原文地址:https://blog.csdn.net/weixin_44224529/article/details/125482941