📜  最长公共子序列的Python程序

📅  最后修改于: 2021-09-22 10:38:30             🧑  作者: Mango

LCS 问题陈述:给定两个序列,找出它们中存在的最长子序列的长度。子序列是以相同的相对顺序出现的序列,但不一定是连续的。例如,“abc”、“abg”、“bdf”、“aeg”、’”acefg”等都是“abcdefg”的子序列。所以一个长度为 n 的字符串有 2^n 个不同的可能子序列。

它是一个经典的计算机科学问题,是 diff(输出两个文件之间差异的文件比较程序)的基础,在生物信息学中有应用。

例子:
输入序列“ABCDGH”和“AEDFHR”的 LCS 是长度为 3 的“ADH”。
输入序列“AGGTAB”和“GXTXAYB”的 LCS 是长度为 4 的“GTAB”。

设输入序列分别为长度为 m 和 n 的 X[0..m-1] 和 Y[0..n-1]。并令 L(X[0..m-1], Y[0..n-1]) 为两个序列 X 和 Y 的 LCS 的长度。以下是 L(X[0..n-1]) 的递归定义。 m-1], Y[0..n-1])。

如果两个序列的最后一个字符匹配(或 X[m-1] == Y[n-1]),则
L(X[0..m-1], Y[0..n-1]) = 1 + L(X[0..m-2], Y[0..n-2])

如果两个序列的最后一个字符不匹配(或 X[m-1] != Y[n-1]),则
L(X[0..m-1], Y[0..n-1]) = MAX ( L(X[0..m-2], Y[0..n-1]), L( X[0..m-1], Y[0..n-2])

# A Naive recursive Python implementation of LCS problem
  
def lcs(X, Y, m, n):
  
    if m == 0 or n == 0:
       return 0;
    elif X[m-1] == Y[n-1]:
       return 1 + lcs(X, Y, m-1, n-1);
    else:
       return max(lcs(X, Y, m, n-1), lcs(X, Y, m-1, n));
  
  
# Driver program to test the above function
X = "AGGTAB"
Y = "GXTXAYB"
print ("Length of LCS is ", lcs(X, Y, len(X), len(Y)))
输出:
Length of LCS is  4

以下是 LCS 问题的列表实现。

# Dynamic Programming implementation of LCS problem
  
def lcs(X, Y):
    # find the length of the strings
    m = len(X)
    n = len(Y)
  
    # declaring the array for storing the dp values
    L = [[None]*(n + 1) for i in range(m + 1)]
  
    """Following steps build L[m + 1][n + 1] in bottom up fashion
    Note: L[i][j] contains length of LCS of X[0..i-1]
    and Y[0..j-1]"""
    for i in range(m + 1):
        for j in range(n + 1):
            if i == 0 or j == 0 :
                L[i][j] = 0
            elif X[i-1] == Y[j-1]:
                L[i][j] = L[i-1][j-1]+1
            else:
                L[i][j] = max(L[i-1][j], L[i][j-1])
  
    # L[m][n] contains the length of LCS of X[0..n-1] & Y[0..m-1]
    return L[m][n]
# end of function lcs
  
  
# Driver program to test the above function
X = "AGGTAB"
Y = "GXTXAYB"
print("Length of LCS is ", lcs(X, Y))
  
# This code is contributed by Nikhil Kumar Singh(nickzuck_007)
输出:
Length of LCS is  4

请参阅关于动态规划的完整文章 |设置 4(最长公共子序列)了解更多详情!

如果您希望与专家一起参加现场课程,请参阅DSA 现场工作专业课程学生竞争性编程现场课程