目录
最长公共子序列简介举例说明并分析代码块测试结果
最长公共子序列简介
一个给定序列的子序列是在该序列中删去若干元素后得到的序列,确切的说,若给定序列X={x0,x1…,xm-1}, 则另一序列Z={z0,z1,…,zk-1},X的子序列是指存在一个严格的下标序列{i0,i1…,ik-1},使得对于所有的j=0,1,…,k-1有Zj=Xij。例如序列Z={B,C,D,B}是序列X={A,B,C,B,D,A,B}的子序列,相应的递增下标序列维{1,2,4,6}。
最长公共子序列问题如何分解成子问题,设A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,并Z=“z0,z1,…,zk-1”为它们的最长公共子序列。求解最长公共子序列长度。
举例说明并分析
穷举搜索法是最容易想到的方法,对X的所有子序列,检查它是否也是Y的子序列,从而确定它是否为X和Y的公共子序列,并且在检查过程中记录最长的公共子序列,X的所有子序列都检查后即可求出X和Y的最长公共子序列,x的每个子序列相应与下标集{0,1,2,……,m-1}的一个子集,因此共有2的m次方个不同子序列,从而穷举法需要指数时间。 事实上,最长公共子序列问题具有最优子结构性质。
(1) 如果am-1=bn-1,则zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一个最长公共子序列;
(2) 如果am-1!=bn-1,则若zk-1!=am-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列;
(3) 如果am-1!=bn-1,则若zk-1!=bn-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列。
这样,在找A和B的公共子序列时,如有am-1=bn-1,则进一步解决一个子问题,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一个最长公共子序列;如果am-1!=bn-1,则要解决两个子问题,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列,再取两者中较长者作为A和B的最长公共子序列。
首先建立子问题最优值的递归关系。用c[i][j]记录序列Xi和Yj的最长公共子序列的长度,b[i][j]记录c[i][j]的值是由哪一个子问题的解得到的。 动态规划是自底向上进行递归的 那么在计算c[i][j]之前,c[i-1][j-1]和c[i-1][j]以及c[i][j-1]都应该知道
代码块
#include <stdio.h>#include<stdlib.h>#include <string.h>#define MAXLEN 100void LCSLength(char *x, char *y, int m, int n, int c[][MAXLEN], int b[][MAXLEN]){ int i, j; for (i = 0; i <= m; i++) c[i][0] = 0; //单个序列的最长公共子序列为0 for (j = 1; j <= n; j++) c[0][j] = 0; //单个序列的最长公共子序列为0 for (i = 1; i <= m; i++) { for (j = 1; j <= n; j++) { if (x[i-1] == y[j-1])//因为x序列和y序列的坐标都是从0开始的,所有最后一个下标为i-1,j-1; { c[i][j] = c[i - 1][j - 1] + 1; b[i][j] = 1; } else if (c[i - 1][j] >= c[i][j - 1]) { c[i][j] = c[i - 1][j]; //满足m-1!=n-1且k-1!=m-1情况从X{0,1,2...,m-2}和Y{0,1,2..,n-1}开始寻找 b[i][j] = 2; } else { c[i][j] = c[i][j - 1]; //满足m-1!=n-1且k-1!=n-1情况从X{0,1,2...,m-1}和Y{0,1,2..,n-2}开始寻找 b[i][j] = 3; } } }}void PRintLCS(int b[][MAXLEN], char *x, int i, int j){ if (i == 0 || j == 0) //递归到两个数组中任意一个的下标为0时结束 return; if (b[i][j] == 1) { PrintLCS(b, x, i - 1, j - 1); printf("%c ", x[i - 1]); } else if (b[i][j] == 2) PrintLCS(b, x, i - 1, j); else PrintLCS(b, x, i, j - 1);}int main(int argc, char **argv){ char x[MAXLEN] ; char y[MAXLEN] ; printf("请输入较长序列的数据:/n"); scanf("%s", x); getchar(); printf("请输入较短序列的数据:/n"); scanf("%s", y); int b[MAXLEN][MAXLEN]; int c[MAXLEN][MAXLEN]; int m, n; m = strlen(x); n = strlen(y); LCSLength(x, y, m, n, c, b); printf("最长公共子序列是:/n"); PrintLCS(b, x, m, n);//x数组必须是序列较长的数组 printf("/n长度是%d", c[m][n]); system("pause"); return 0;}
测试结果