72. 编辑距离

Difficulty
Hard
Tags
动态规划
Star
给你两个单词 word1word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
  • 插入一个字符
  • 删除一个字符
  • 替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros" 输出:3 解释: horse -> rorse (将 'h' 替换为 'r') rorse -> rose (删除 'r') rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution" 输出:5 解释: intention -> inention (删除 't') inention -> enention (将 'i' 替换为 'e') enention -> exention (将 'n' 替换为 'x') exention -> exection (将 'n' 替换为 'c') exection -> execution (插入 'u')
提示:
  • 0 <= word1.length, word2.length <= 500
  • word1word2 由小写英文字母组成

法1 动态规划

思路
典型的双序列题目。按照套路:
  1. 定义状态:
    1. dp[i][j] 为 序列s[0:1] 和序列t[0:j] 最短编辑距离
  1. 状态转移。外面两层大循环遍历ij;核心从s[i]t[j]的关系作为突破口,拼命往dp[i-1][j-1], dp[i][j-1], dp[i-1][j]转移
      • 如果s[i] == t[j] 那么当前编辑距离就等于子问题: s[0:i-1] 和序列t[0:j-1]的编辑距离,即dp[i][j]=dp[i-1][j-1]
      • 如果s[i] ≠ t[j] 那么就需要做编辑:
        • 替换操作。在子问题: 序列s[0:i-1] 和序列t[0:j-1] 最短编辑距离 的基础上执行替换s[i] 或者替换t[j]。即dp[i-1][j-1] + 1
        • 删除操作。在子问题 序列s[0:i-1] 和序列t[0:j] 最短编辑距离 的基础上执行删除操作,删除t[j];或者在子问题 序列s[0:i] 和序列t[0:j-1] 最短编辑距离 的基础上执行删除操作,删除s[i]。即dp[i-1][j] + 1 或者 dp[i][j+1] + 1
        • 增加操作。在子问题 序列s[0:i-1] 和序列t[0:j] 最短编辑距离 的基础上执行增加操作,增加t[j];或者在子问题 序列s[0:i] 和序列t[0:j-1] 最短编辑距离 的基础上执行增加操作,删除s[i]。即dp[i-1][j] + 1 或者 dp[i][j+1] + 1
  1. 状态初始化
    1. 对于dp[0][j] 或者dp[i][0],表示空序列与非空序列的最短编辑距离。所以初始化为对应位置非空序列长度即可。即dp[i][0] = i
题解
class Solution: def minDistance(self, word1: str, word2: str) -> int: dp = [[0] * (len(word2)+1) for _ in range(len(word1)+1)] for i in range(0, len(dp)): dp[i][0] = i for j in range(0, len(dp[0])): dp[0][j] = j for i in range(1, len(dp)): for j in range(1, len(dp[0])): if word1[i-1] == word2[j-1]: dp[i][j] = dp[i-1][j-1] else: dp[i][j] = min(dp[i-1][j], dp[i][j-1], dp[i-1][j-1]) + 1 return dp[-1][-1]