• 面试题_二分查找及其变形


       二分查找常用来查找指定有序集合中元素的位置,思路和代码都比较简单,所以大家都很熟练。二分查找貌似很多公司在面试或笔试的时候都会多少涉及到,经常会让你在纸上直接写代码,所以平常只知道原理而从来不自己写的人,可能不会太快写出来,或是代码有点小漏洞,所以经常敲敲常见的数据结构和代码还是很必要的。

    很多问题,只要涉及到有序的数据结构,就可以往二分查找的思路上靠。 下面的代码,可能不是很完善,仅供参考。

    经典二分查找的代码,在有序数组里面查找是否存在某个元素,如果存在,则返回相应元素所在索引号:

    int Find(int arr[], int key,int length)
    {
    assert(arr
    !=NULL&&length>0);
    int low=0,high=length,mid;
    while(low<=high)
    {
    mid
    =(low+high)/2;
    if(arr[mid]==key) return mid;
    else
    {
    if(arr[mid]>key) high=mid-1;
    else low=mid+1;
    }
    }
    return-1;
    }

    变形1:

    问题来了:在循环有序数组中查找指定元素,也就是说在类似这样的{12,16,18,20,41,100,1,4,6,9}数组中查找指定的元素。

      分析一下,这里所说的循环有序数组,就是把一个有序数组从某个(未知)位置处截为两段,把前一段放到后一段的后面(数组里的元素还是有序的,只不过最小值不一定是数组的第一个元素,而可能是其中的任何一项,从它开始逐项递增,到数组的最后一个元素时再回到第一个元素)。
    显然传统的二分法已经无法直接使用了,但考虑一下,如果已经知道分界点位置,那问题就简单多了,只要先判断一下待查元素是在分界点的左侧还是右侧,然后直接对那一侧的半个数组使用二分查找。

      那么重点就是判定待测元素在分界点的左侧还是右侧的问题了,可以发现每次取mid后,就会形成两种情况的子序列。一种情况是类似{4,6,9},他是一个正常有序的子集合,另一种情况是类似{12,16,18,20,41,100,1}的与源问题类似结构的相对复杂的子集合。显然第一种情况是简单的,那么判定待测元素在分界点的简单一侧会比较容易。

      第一种情况(arr[mid]>=arr[low]):当key<=arr[mid]&&key>=arr[low]时,待测元素肯定会在mid的左侧;其他情形则会在mid的右侧。

      第二种情况(arr[mid]<arr[low]):当key<=arr[low]&&key>=arr[mid]时,待测元素肯定会在mid的右侧,其他情形则会在mid的左侧。

      上面两个子条件的选择比较重要。

     最后给出代码:

    int find ( int * arr, int low , int high, int key)
    {
    	int mid ;
    	while(low<=high)
    	{
    		mid = (low+high)/2;
    		if (arr[mid] == key ) return mid;
    		if(arr[mid]>=arr[low])
    		{
    			if(key<=arr[mid]&&key>=arr[low]) high = mid -1;
    			else low = mid +1;	
    		}
    		else
    		{
    			if(key<=arr[high]&&key>=arr[mid]) low = mid + 1;
    			else high = mid -1;		
    		}
    	}
    	return -1;
    }
    

    变形2:假如集合中的元素有重复,要找到key首次出现的位置。

    int find(int * arr , int length, int key){
        int low = 0,high = length-1,mid;
        while(low <= high){
            mid = (low + high)/2;
            if (arr[mid] < key){
                low = mid + 1;
            }else if(arr[mid] > key){
                high = mid - 1;
            }else{
                if (mid == 0) return mid;
                if (mid >= 1 && arr[mid-1] != key) return mid;
                else high = mid - 1;
            }
        }
        return -1;
    }

    变形3:在一个有序的数组里,查找不小于key的最小的数的索引,如果key值存在,则返回key第一次出现的位置,如果不存在则返回-1。(类似的查找比key小的最大的数) 

    #include<iostream>
    using namespace std;
    
    int find(int * arr, int low, int high, int key){
        if(arr[low] >= key) return low;
        if (low > high) return -1;
        int mid = (low + high) / 2;
        if (arr[mid] < key) return find(arr,mid+1,high,key);
        else if(arr[mid] >= key){
            if(mid >= low && arr[mid-1]>=key)
                return find(arr,low, mid-1, key);
            return mid;
        }
    }
    int main(){
        int arr[] = {1,3,3,3,3,3,6,6,7,9,11,12};
        int length = sizeof(arr) / sizeof(int);
        cout<<"KEY"<<"\t"<<"索引"<<"\t"<<"对应值"<<endl;
        for(int i=0;i<15;i++){
            int idx = find(arr,0,length-1,i);
            if (idx >= 0)
                cout<<i<<"\t"<<idx<<"\t"<<arr[idx]<<endl;
            else cout<<i<<"\t"<<idx<<"\t"<<"None"<<endl;
        }
        return 0;
    }

    变形4:在一个有序的数组里,数据里面元素可能有重复的,查找指定key所在的索引范围。

    例如:int arr[] = {1,2,2,2,2,3,3,3,3,3,6,6,7,9,11,12}; 查找3的话,应该返回(5,9)

    分析一下: 一个思路是,先随意找到一个key所在的索引i,然后从i的左右两侧查找,直到左右两侧遇到不等于key的值为止,然后返回两边的索引号。

    但是,这样存在一个问题,考虑一下如果一个数组是{1,2,3,3,3,3,3,3,3,4},这样按照上面的想法就很扯淡了,因为与key相等的值太多了,比较代价太大。

    于是可以考虑,用两次二分查找,找两个边界,这里我们可以使用变形3中所写好的find函数,我们去找比key+1大的最小的索引right,以及比key大的最小值得索引left。

    返回结果,即为<left,right-1>

    这里有个问题必须指出,在变形3我们写的函数中,如果key存在则返回key第一次出现的位置。

    int find(int * arr, int low, int high, int key){
        if(arr[low] >= key) return low;
        if (low > high) return -1;
        int mid = (low + high) / 2;
        if (arr[mid] < key) return find(arr,mid+1,high,key);
        else if(arr[mid] >= key){
            if(mid >= low && arr[mid-1]>=key)
                return find(arr,low, mid-1, key);
            return mid;
        }
    }
    
    pair<int,int> findRange(int * arr, int length, int key){
        pair<int,int> res(-1,-1);
        int l = find(arr, 0,length-1, key);
        if(l<0 || arr[l] != key) return res;
        res.first = l;
        int r = find(arr, 0, length-1, key+1);
        if(r-1<0 || arr[r-1] != key) return res;
        res.second = r-1;
        return res;
    }
    int main(){
        int arr[] = {1,2,2,2,2,3,3,3,3,3,6,6,7,9,11,12};
        int length = sizeof(arr) / sizeof(int);
        for (int i=0;i<15;i++){
            pair<int,int> res = findRange(arr, length,i);
            cout<<i<<"\t"<<res.first<<"\t"<<res.second<<endl;
        }
        return 0;
    }

  • 相关阅读:
    面向对象的思维
    343. 整数拆分
    413. 等差数列划分
    303. 区域和检索
    62. 不同路径
    char类型与int类型相加
    mybatis里面resultmap的问题
    easyui的datagrid如何获取一个对象里面的成员对象里面的属性?
    ==和equls的区别
    泛型的使用思想
  • 原文地址:https://www.cnblogs.com/coser/p/2013013.html
Copyright © 2020-2023  润新知