定义
二分查找又称折半查找,它是一种效率较高的查找方法。
二分查找要求:线性表是有序表,即表中结点按关键字有序,并且要用向量作为表的存储结构,不妨设有序表是递增有序的。
算法思想
设R[low..high]
是当前的查找区间
- 首先确定该区间的中点位置;
- 然后将待查的K值与R[mid].key比较:若相等,则查找成功并返回此位置,否则须确定新的查找区间,继续二分查找,具体方法如下:
(1) 若R[mid].key>K
,则由表的有序性可知R[mid..n].keys
均大于K,因此若表中存在关键字等于K的结点,则该结点必定是在位置mid左边的子表R[1..mid-1]
中,故新的查找区间是左子表R[1..mid-1]
。
(2) 若R[mid].key<K
,则要查找的K必在mid的右子表R[mid+1..n]
中,即新的查找区间是右子表R[mid+1..n]
。下一次查找是针对新的查找区间进行的。
因此,从初始的查找区间R[1..n]
开始,每经过一次与当前查找区间的中点位置上的结点关键字的比较,就可确定查找是否成功,不成功则当前的查找区间就缩小一半。这一过程重复直至找到关键字为K的结点,或者直至当前的查找区间为空(即查找失败)时为止。
实现
C++
循环实现
//循环实现
int binarySearch(vector<int> array, int target)
{
int len = array.size() -1 ;
int low = 0, high = len, middle;
while (low <= high)
{
middle = (low + high) / 2;
if (target == array[middle])
return middle;
else if (target > array[middle])
low = middle + 1;
else if (target < array[middle])
high = middle - 1;
}
return -1;
};
递归实现
//low:初始输入为0;high:初始输入为数组元素的个数
int binarySearchRec(vector<int> array, int low, int high, int target)
{
int middle = (low + high) / 2;
if (low > high)
return -1;
if (array[middle] == target)
return middle;
if (array[middle] > target)
return binarySearch(array, low, middle - 1, target);
if (array[middle] < target)
return binarySearch(array, middle + 1, high, target);
}
python
循环实现
def binarySearch(alist,item):
first = 0
last = len(alist) - 1
found = False
while first <= last and not found:
midpoint = (first + last) // 2
if alist[midpoint] == item:
found = True
else:
if item < alist[midpoint]:
last = midpoint -1
else:
first = midpoint +1
return found
递归实现
def binarySearchRec(alist,item):
if len(alist) == 0:
return False
else:
midpoint = len(alist) // 2
if alist[midpoint] == item:
return True
else:
if item < alist[midpoint]:
return binarySearchRec(alist[:midpoint],item)
else:
return binarySearchRec(alist[midpoint+1:], item)
总结
二分查找的优点:
折半查找的时间复杂度为(O(log n)),远远好于顺序查找的(O(n))。
二分查找的缺点:
虽然二分查找的效率高,但是要将表按关键字排序。而排序本身是一种很费时的运算。既使采用高效率的排序方法也要花费(O(n lg n))的时间。
适用情况
二分查找只适用顺序存储结构。为保持表的有序性,在顺序结构里插入和删除都必须移动大量的结点。因此,二分查找特别适用于那种一经建立就很少改动、而又经常需要查找的线性表。
对那些查找少而又经常需要改动的线性表,可采用链表作存储结构,进行顺序查找。链表上无法实现二分查找。