• 《算法设计手册》杂题3道


      最近找工作的事告一段落,发一些之前整理但未发表的文章。鉴于各个公司一般要求将所做笔试题和面试题保密,并要求在试卷上签署了相关协议,因此本人不会在后续博文中提及并分析,见谅。

    1.归纳法找递归函数的输出(原书P16~17,1.3.4节)

    归纳并证明下面函数的输出:

    int increment(int y) {
    
      if (y==0)
    
        return 1;
      if(y%2 == 1)
    
        return 2*increment(y/2);
      else
    
        return y+1;
    }

    解答:

      事实上increment(y)=y+1。

      证明:

    (1)(归纳法)y=0时输出1。

    (2)

    y为偶数时,输出y+1;

    y为奇数时,不妨令y=2m+1,那么2*increment((2m+1)/2) = 2*increment(m)。由于m<y且increment(m)=m+1 (归纳假设),那么输出为2*(m+1) = y+1。

    得证。

     

    2.动态数组的时间复杂度(原书P67,3.1.1节)

    用下面的方式实现动态数组:首先分配大小为1的连续空间,当需要填入第2个元素时,分配大小为2个连续空间,把原来的1个元素复制进新空间,再把新元素填入,销毁原空间;依次类推,动态数组的容量变化过程为1->2->4->8->...。当数组中一共有n个元素时,一共被复制了几次?

    解答:

    为简化分析,n此时是2的幂且刚好把数组填满。可以看出,其中1/2的元素没有被复制过,另外1/2在上次扩展时复制了一次。即,上次扩展时复制了n*(1/2)个元素。一共扩展了logn次,因此复制的总次数为:

    [n*(frac{1}{2}+frac{1}{4}+...+frac{1}{2^{logn}})]

    其中2^logn = n。由极限知识可知,当n→∞时,和为2n。因此n个元素的复制次数不超过2n次,保持了O(n)的时间复杂度。

    附注:

      Nginx封装的数据结构ngx_array_t就是一种动态数组,采用了类似的内存分配策略。

    3.最小堆第k小的元素与给定x的大小关系:kth>=x是否成立?(原书P116~117,4.3.2节)

    对一个数组实现的n个元素的最小堆和给定的实数x,判断堆中第k小元素是否大于等于x?(0<k<n)要求算法最坏时间复杂度为O(k)。(提示:没必要找出第k小元素的具体值)

    解答:

      最直接的两种解法:从堆中选取最小元素k次,时间复杂度O(klogn);检查堆中前k层所有元素,时间复杂度O(n,2^k)。这两种解法都不符合时间复杂度的要求。

      实际上是从根开始遍历所有值小于x的结点:

    //第一次调用时,i=1,count=k
    int heap_compare(heap *h,int i,int count,int x)
    {
        if((count<=0)||(i>h->size))
            return count;
        if(h->h[i]<x) {
            count = heap_compare(h,LEFT(i),count-1,x);
            count = heap_compare(h,RIGHT(i),count,x);
        }
        return count;
    }

      如果根大于等于x,那么其余所有元素都不可能小于x,第k小的元素必然大于等于x。这时返回值为k>0。(若k=1,那么第1小的元素就是根,结果不变)

      如果根小于x,需要对根的两个后继进行遍历。如果你没有看明白这段程序的含义,下面以几个例子来帮助理解这个函数在递归调用时发生了什么。假定k=3,x=3,即判断第3小的元素是否大于等于3。简单起见,结点以下标代替,根为1(与原书一致)。

      实例1:第k小的元素大于等于x。

      实例2:第k小的元素大于等于x。原图交换顺序。

      实例3:第k小的元素小于x。

      从上面三个例子可以看出:

      每找到一个小于x的元素都会消耗一个count,如果消耗完了k个,表示至少前k个都小于x。那么第k个必然小于x,后面不必再进行查找,返回值为0。

      反之,如果遍历所有小于k的元素时未消耗完k个count,表示小于x的元素不足k个,那么第k个必然大于等于x,返回值为正值。

      原代码中令人迷惑的地方在于count的使用,理清上面的两个关系就好理解了。虽然看上去这个函数对于一个结点的两个后继的处理地位不同,但实际上没有影响。

      至于时间复杂度,由于我们只遍历了所有小于x的结点以及它们的后继,而且遍历时不超过k个(用完k个就return 0),因此大约是3k个结点,时间复杂度只有O(k),符合要求。

      这道题曾在Amazon的面试中出现。

      stackoverflow上有一个变形:判断n元最大堆中第k大的元素是否大于给定的数x,处理方法类似。

  • 相关阅读:
    解决:ElasticSearch ClusterBlockException[blocked by: [FORBIDDEN/12/index readonly / allow delete (api)];
    Centos 常用命令
    Nodejs的path模块
    webpack externals
    F#反射获取名称的三种方法
    JDK源码阅读之:JDK8的 CHM 为何放弃分段锁
    Mysql基础之:MySQL各种类型索引的及其优缺点介绍
    Java高并发之:从浅入深掌握并发执行框架Executor
    如何读懂火焰图?+ 实例讲解程序性能优化
    Java高并发之:深入浅出线程池+高级选项的使用
  • 原文地址:https://www.cnblogs.com/wuyuegb2312/p/3257408.html
Copyright © 2020-2023  润新知