小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

【動(dòng)態(tài)規(guī)劃】最長(zhǎng)公共子序列與最長(zhǎng)公共子串

 黑塵子 2017-05-24

1. 問題描述

子串應(yīng)該比較好理解,至于什么是子序列,這里給出一個(gè)例子:有兩個(gè)母串

  • cnblogs
  • belong

比如序列bo, bg, lg在母串cnblogs與belong中都出現(xiàn)過并且出現(xiàn)順序與母串保持一致,我們將其稱為公共子序列。最長(zhǎng)公共子序列(Longest Common Subsequence, LCS),顧名思義,是指在所有的子序列中最長(zhǎng)的那一個(gè)。子串是要求更嚴(yán)格的一種子序列,要求在母串中連續(xù)地出現(xiàn)。在上述例子的中,最長(zhǎng)公共子序列為blog(cnblogs, belong),最長(zhǎng)公共子串為lo(cnblogs, belong)。

2. 求解算法

對(duì)于母串X=<x1,x2,?,xm>, Y=<y1,y2,?,yn>,求LCS與最長(zhǎng)公共子串。

暴力解法

假設(shè) m<n, 對(duì)于母串X,我們可以暴力找出2m個(gè)子序列,然后依次在母串Y中匹配,算法的時(shí)間復(fù)雜度會(huì)達(dá)到指數(shù)級(jí)O(n?2m)。顯然,暴力求解不太適用于此類問題。

動(dòng)態(tài)規(guī)劃

假設(shè)Z=<z1,z2,?,zk>XY的LCS, 我們觀察到

  • 如果xm=yn,則zk=xm=yn,有Zk?1Xm?1Yn?1的LCS;
  • 如果xmyn,則ZkXmYn?1的LCS,或者是Xm?1Yn的LCS。

因此,求解LCS的問題則變成遞歸求解的兩個(gè)子問題。但是,上述的遞歸求解的辦法中,重復(fù)的子問題多,效率低下。改進(jìn)的辦法——用空間換時(shí)間,用數(shù)組保存中間狀態(tài),方便后面的計(jì)算。這就是動(dòng)態(tài)規(guī)劃(DP)的核心思想了。

DP求解LCS

用二維數(shù)組c[i][j]記錄串x1x2?xiy1y2?yj的LCS長(zhǎng)度,則可得到狀態(tài)轉(zhuǎn)移方程

c[i,j]={0i=0 or j=0c[i?1,j?1]+1i,j>0 and  xi=yjmax(c[i,j?1],c[i?1,j])i,j>0 and xiyj

代碼實(shí)現(xiàn)

public static int lcs(String str1, String str2) {
    int len1 = str1.length();
    int len2 = str2.length();
    int c[][] = new int[len1+1][len2+1];
    for (int i = 0; i <= len1; i++) {
        for( int j = 0; j <= len2; j++) {
            if(i == 0 || j == 0) {
                c[i][j] = 0;
            } else if (str1.charAt(i-1) == str2.charAt(j-1)) {
                c[i][j] = c[i-1][j-1] + 1;
            } else {
                c[i][j] = max(c[i - 1][j], c[i][j - 1]);
            }
        }
    }
    return c[len1][len2];
}

DP求解最長(zhǎng)公共子串

前面提到了子串是一種特殊的子序列,因此同樣可以用DP來解決。定義數(shù)組的存儲(chǔ)含義對(duì)于后面推導(dǎo)轉(zhuǎn)移方程顯得尤為重要,糟糕的數(shù)組定義會(huì)導(dǎo)致異常繁雜的轉(zhuǎn)移方程??紤]到子串的連續(xù)性,將二維數(shù)組c[i,j]用來記錄具有這樣特點(diǎn)的子串——結(jié)尾為母串x1x2?xiy1y2?yj的結(jié)尾——的長(zhǎng)度。

得到轉(zhuǎn)移方程:

c[i,j]={0i=0 or j=0c[i?1,j?1]+1xi=yj0xiyj

最長(zhǎng)公共子串的長(zhǎng)度為 max(c[i,j]), i{1,?,m},j{1,?,n}。

代碼實(shí)現(xiàn)

public static int lcs(String str1, String str2) {
    int len1 = str1.length();
    int len2 = str2.length();
    int result = 0;     //記錄最長(zhǎng)公共子串長(zhǎng)度
    int c[][] = new int[len1+1][len2+1];
    for (int i = 0; i <= len1; i++) {
        for( int j = 0; j <= len2; j++) {
            if(i == 0 || j == 0) {
                c[i][j] = 0;
            } else if (str1.charAt(i-1) == str2.charAt(j-1)) {
                c[i][j] = c[i-1][j-1] + 1;
                result = max(c[i][j], result);
            } else {
                c[i][j] = 0;
            }
        }
    }
    return result;
}

3. 參考資料

[1] cs2035, Longest Common Subsequence.
[2] 一線碼農(nóng), 經(jīng)典算法題每日演練——第四題 最長(zhǎng)公共子序列.
[3] GeeksforGeeks, Dynamic Programming | Set 29 (Longest Common Substring).

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多