编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3
令f[i][j]表示a串前i个,b串前j个的编辑距离
状态转移:
若a串第i个与b串第j个相等,那么f[i][j]=f[i-1][j-1]
否则,f[i][j]可由3个状态转移而来:
①f[i-1][j-1]+1 把a[i]改为b[j] 等价于把b[j]改为a[i]
②f[i-1][j]+1 删去a[i] 等价于在b[j]前插入a[i]
③f[i][j-1]+1 删去b[j],等价于在a[i]前插入b[j]
初始化:f[0][i]=i f[i][0]=i
#include<cstdio> #include<cstring> #include<algorithm> using namespace std; char a[1001],b[1001]; int f[1001][1001]; int main() { scanf("%s%s",a+1,b+1); int la=strlen(a+1),lb=strlen(b+1); for(int i=1;i<=la;i++) f[0][i]=i; for(int i=1;i<=lb;i++) f[i][0]=i; for(int i=1;i<=la;i++) for(int j=1;j<=lb;j++) if(a[i]==b[j]) f[i][j]=f[i-1][j-1]; else f[i][j]=min(min(f[i-1][j],f[i][j-1]),f[i-1][j-1])+1; printf("%d",f[la][lb]); }