• [饭后算法系列] 数组中"和非负"的最长子数组


    1. 问题

    给定一列数字数组 a[n], 求这个数组中最长的 "和>=0" 的子数组. (注: "子数组"表示下标必须是连续的. 另一个概念"子序列"则不必连续)

    举个例子:

    数组 a[n] = {1, 2, -4, 5, -6, 1}, 最长的和非负的子数组为 {1, 2, -4, 5}, 其他子数组要么和<0, 要么长度<4

    2. 暴力法

    我们先来看看暴力解法和时间复杂度

    1. 如果我求出所有的数组前缀和 即P(i) = a[1]到a[i]的和

    2. 然后对于数组的所有子数组 a[i..j], 它的和为 P(j) - P(i-1)

    第一步预处理的时间复杂度为O(n). 第二步是暴力法的主体, 穷举了所有O(n^2)个子数组, 每个子数组和的计算需要时间O(1). 因此整个算法的时间复杂度就是O(n^2)

    由此可见, 任何优化必须使得复杂度小于 O(n^2)

    3. 算法优化

    算法是一门基于观察的学科, 让我们先从例子入手, 观察一下优化的方法

    对于数组a[n], 用动态规划法从第一个数开始往后遍历

    1 2 -4 5 -6 1
    (1,1) (2,3) (3,-1) (4,4) (5,-2) (6,-1)
      (1,2) (2,-2) (3,3) (4,-3) (5,-2)
        (1,-4) (2,1) (3,-5) (4,-4)
          (1,5) (2,-1) (3, 0)
            (1,-6) (2,-5)
              (1, 1)

    1. 遍历到第一个数1时, 填写(1,1), 表示第一个数的和为1

    2. 遍历到第二个数2时, 填写(2,3), 表示前两个数的和为3; 填写(1,2), 表示前一个数(即2自己)的和为2

    以此类推, 填完所有6列, 可以看到第4列的(4,4)是和为4>=0, 且长度最长的结果

    这个做法仍然需要O(n^2), 有什么办法优化呢?

    3.1 计算简化

    这个表格的计算是可以简化的:

      1 2 -4 5 -6 1
      0          
        -1        
          -3      
            1    
              -4  
                2
    sum 1 3 -1 4 -2 -1

    这是什么意思呢?

    假设运算到第k列的时候, 所有以a[k]结尾的子数组和记为b[k] = [sum(1..k), sum(2..k), ..., sum(k..k)]

    我只要记录b[k]的变形c[k]即可, c[k] = [0, -sum(1..1), -sum(1..2), ..., -sum(1..k-1)], 要从c[k]转回b[k], 我只要简单的把c中的每个元素值加上sum(1..k)

    这样做的好处是: 我从c[k]前进到c[k+1]的时候, 只要简单地在最后加一个元素-sum(1..k), 而不需要修改前面的元素. 这使得前进一步的开销为O(1)

    转化后, 我要找b[k]中>=0的元素, 等同于找c[k]中>=-sum(1..k)的元素, 这个查找过程怎么简化呢?

    3.2 单调优化

    这个过程是可以发现单调性优化的. 为了方便, 我把表格转回最开始的样子:

    1 2 -4 5 -6 1
    (1,1) (2,3) (3,-1) (4,4) (5,-2) (6,-1)
      (1,2) (2,-2) (3,3) (4,-3) (5,-2)
        (1,-4) (2,1) (3,-5) (4,-4)
          (1,5) (2,-1) (3, 0)
            (1,-6) (2,-5)
              (1, 1)

    被飘灰的这些格子, 在同一列中, 都有长度以及总和都比它大的另一个格子. 这些飘灰的格子一定不在最终的结果中.

    比如第3列中, (2,-2)的上面有(3,-1). 也就是-4往前加2个数的和为-2, 往前加3个数的和为-1. 如果最终答案包含了-4往前的2个数, 那我一定能够换成-4往前3个数, 总和比原来大了1, 且长度也比原来长

    去掉飘灰的这些格子后, 我们发现, 每一列的第二个数(和)是单调递增的.

    因为我要找每列第二个数(和)>=0的格子, 由于有了单调性之后, 我就能用二分查找了, 查找的复杂度为O(lgn)

    3.3 总结

    综合3.1和3.2, 在这个动态规划过程中, 遍历的每一步, 时间复杂度=O(1)+O(lgn), 总共遍历n次, 因此总的时间复杂度为O(nlgn)

    关键字: 算法, 动态规划, 数组

  • 相关阅读:
    Linux的inode的理解
    linux中ctrl+z和ctrl+c的区别
    linux后台运行和关闭、查看后台任务
    解决Could not get lock /var/cache/apt/archives/lock
    Spring Boot 2.1.5 正式发布,1.5.x 即将结束使命!
    【免费】某平台16980元编程课程资料下载,仅此1次
    秒杀系统架构分析与实战,一文带你搞懂秒杀架构!
    阿里数据库大牛的 MySQL 学习指南!
    Intellij IDEA 撸码最头大的问题。。
    Java 中的 SPI 机制是什么鬼?高级 Java 必须掌握!
  • 原文地址:https://www.cnblogs.com/testview/p/3615493.html
Copyright © 2020-2023  润新知