• [718. 最长重复子数组]


    [718. 最长重复子数组]

    给两个整数数组 AB ,返回两个数组中公共的、长度最长的子数组的长度。

    示例 1:

    输入:
    A: [1,2,3,2,1]
    B: [3,2,1,4,7]
    输出: 3
    解释: 
    长度最长的公共子数组是 [3, 2, 1]。
    

    说明:

    1. 1 <= len(A), len(B) <= 1000
    2. 0 <= A[i], B[i] < 100

    思路:动态规划

    ​ dp[i] [j] 表示以i, j 为结尾的连续公共子数组

    那么:

    dp[i][j] = A[i] == B[j] ? dp[i+1][j+1]+1 : 0;

    public int findLength(int[] A, int[] B) {
            int maxLen = 0;
            int[][] dp = new int[A.length+1][B.length+1];
    
            for (int i = A.length-1; i >= 0; i--) {
                for (int j = B.length-1; j >= 0; j--) {
                    dp[i][j] = A[i] == B[j] ? dp[i+1][j+1]+1 : 0;
                    maxLen = Math.max(maxLen, dp[i][j]);
                }
            }
    
            return maxLen;
        }
    

    思路二 :滑动窗口

    分别将AB数组按不同的偏移量对齐即可

    public int findLength(int[] A, int[] B) {
            int maxLen = 0;
            //A数组向前移
            for (int i = 0; i < A.length-1; i++) {
                //分别表示AB的指针和他们前一位的最大公共子数组长度
                int ai = i, bi = 0, last = 0;
                while (ai < A.length && bi < B.length){
                    last = A[ai++] == B[bi++] ? last+1: 0;
                    maxLen = Math.max(maxLen, last );
                }
            }
            //B数组向前移
            for (int i = 0; i < B.length-1; i++) {
                //分别表示AB的指针和他们前一位的最大公共子数组长度
                int ai = 0, bi = i, last = 0;
                while (ai < A.length && bi < B.length){
                    last = A[ai++] == B[bi++] ? last+1: 0;
                    maxLen = Math.max(maxLen, last );
                }
            }
    
            return maxLen;
        }
    

    思路三 :二分+hash

    如果数组 A 和 B 有一个长度为 k 的公共子数组,那么它们一定有长度为 j <= k 的公共子数组。这样我们可以通过二分查找的方法找到最大的 k。

    而为了优化时间复杂度,在二分查找的每一步中,我们可以考虑使用哈希的方法来判断数组 A 和 B 中是否存在相同特定长度的子数组。

    注意到序列内元素值小于 100100100 ,我们使用 Rabin-Karp 算法来对序列进行哈希。具体地,我们制定一个素数 base,那么序列 S 的哈希值为:

    形象地说,就是把 S 看成一个类似 base 进制的数(左侧为高位,右侧为低位),它的十进制值就是这个它的哈希值。由于这个值一般会非常大,因此会将它对另一个素数 mod 取模。

    当我们要在一个序列 S 中算出所有长度为 len 的子序列的哈希值时,我们可以用类似滑动窗口的方法,在线性时间内得到这些子序列的哈希值。例如,如果我们当前得到了 S[0:len] 的哈希值,希望算出 S[1:len+1] 的哈希值时,有下面这个公式:

    即删去最高位 S[0],其余位自动进一,并补上最低位 S[len+1]。
    

    在二分查找的每一步中,我们使用哈希表分别存储这两个数组的所有长度为 len 的子数组的哈希值,将它们的哈希值进行比对,如果两序列存在相同的哈希值,则认为两序列存在相同的子数组。为了防止哈希碰撞,我们也可以在发现两个子数组的哈希值相等时,进一步校验它们本身是否确实相同,以确保正确性。但该方法在本题中很难发生哈希碰撞,因此略去进一步校验的部分。

    class Solution {
        int mod = 1000000009;
        int base = 113;
    
        public int findLength(int[] A, int[] B) {
            int left = 1, right = Math.min(A.length, B.length) + 1;
            while (left < right) {
                int mid = (left + right) >> 1;
                if (check(A, B, mid)) {
                    left = mid + 1;
                } else {
                    right = mid;
                }
            }
            return left - 1;
        }
    
        public boolean check(int[] A, int[] B, int len) {
            long hashA = 0;
            for (int i = 0; i < len; i++) {
                hashA = (hashA * base + A[i]) % mod;
            }
            Set<Long> bucketA = new HashSet<Long>();
            bucketA.add(hashA);
            long mult = qPow(base, len - 1);
            for (int i = len; i < A.length; i++) {
                hashA = ((hashA - A[i - len] * mult % mod + mod) % mod * base + A[i]) % mod;
                bucketA.add(hashA);
            }
            long hashB = 0;
            for (int i = 0; i < len; i++) {
                hashB = (hashB * base + B[i]) % mod;
            }
            if (bucketA.contains(hashB)) {
                return true;
            }
            for (int i = len; i < B.length; i++) {
                hashB = ((hashB - B[i - len] * mult % mod + mod) % mod * base + B[i]) % mod;
                if (bucketA.contains(hashB)) {
                    return true;
                }
            }
            return false;
        }
        
        // 使用快速幂计算 x^n % mod 的值
        public long qPow(long x, long n) {
            long ret = 1;
            while (n != 0) {
                if ((n & 1) != 0) {
                    ret = ret * x % mod;
                }
                x = x * x % mod;
                n >>= 1;
            }
            return ret;
        }
    }
    
    因为我喜欢追寻过程中的自己
  • 相关阅读:
    富可视M310刷机包 MIUIV5 红米开发版 闪光 美化 稳定
    Windowsclient SSH 远程连接Windowsserver(PowerShell Server)
    数据结构与算法02--链表基础
    rhadoop linear regression 问题
    奇怪的git代理超时问题
    怎样利用Heartbeat与Floating IP在Ubuntu 14.04上创建高可用性设置
    IVS_原理
    NN入门
    算法体系
    CNN原理
  • 原文地址:https://www.cnblogs.com/IzuruKamuku/p/14359758.html
Copyright © 2020-2023  润新知