顺序查找
二分查找:在一个已经 完全排序(或者部分排序)的数组中 查找数字或者统计数字的出现次数-
就是每次缩小一般的范围进行查找或者统计 最后的循环结束的条件就是end-first=1,即二者相邻,若有其中之一为要找的值,则对了,若果都没有就没有了
我的想法是
1 先判断 首、尾 是不是要找的
1.1是 就最好啦
1.2 不是 看中间值是不是
1.2.1 是就最好啦
1.2.2不是 比大小 确定下一次要查找的范围 然后在这个范围内在进行重复上述步骤
插值查找:(二分查找升级版)
哈希查找
二叉排序树查找
2. 插值查找
二分查找法虽然已经很不错了,但还有可以优化的地方。
有的时候,对半过滤还不够狠,要是每次都排除十分之九的数据岂不是更好?选择这个值就是关键问题,插值的意义就是:以更快的速度进行缩减。
插值的核心就是使用公式:
value = (key - list[low])/(list[high] - list[low])
用这个value来代替二分查找中的1/2。
上面的代码可以直接使用,只需要改一句。
# 插值查找算法
# 时间复杂度O(log(n))
def binary_search(lis, key):
low = 0
high = len(lis) - 1
time = 0
while low < high:
time += 1
# 计算mid值是插值算法的核心代码
mid = low + int((high - low) * (key - lis[low])/(lis[high] - lis[low]))
print("mid=%s, low=%s, high=%s" % (mid, low, high))
if key < lis[mid]:
high = mid - 1
elif key > lis[mid]:
low = mid + 1
else:
# 打印查找的次数
print("times: %s" % time)
return mid
print("times: %s" % time)
return False
if __name__ == '__main__':
LIST = [1, 5, 7, 8, 22, 54, 99, 123, 200, 222, 444]
result = binary_search(LIST, 444)
print(result)
插值算法的总体时间复杂度仍然属于O(log(n))级别的。其优点是,对于表内数据量较大,且关键字分布比较均匀的查找表,使用插值算法的平均性能比二分查找要好得多。反之,对于分布极端不均匀的数据,则不适合使用插值算法。
八、散列表(哈希表)
散列表:所有的元素之间没有任何关系。元素的存储位置,是利用元素的关键字通过某个函数直接计算出来的。这个一一对应的关系函数称为散列函数或Hash函数。
采用散列技术将记录存储在一块连续的存储空间中,称为散列表或哈希表(Hash Table)。关键字对应的存储位置,称为散列地址。
散列表是一种面向查找的存储结构。它最适合求解的问题是查找与给定值相等的记录。但是对于某个关键字能对应很多记录的情况就不适用,比如查找所有的“男”性。也不适合范围查找,比如查找年龄20~30之间的人。排序、最大、最小等也不合适。
因此,散列表通常用于关键字不重复的数据结构。比如python的字典数据类型。
优点:最主要的优点是能在O(1)时间内查找某一元素,查找效率最高!但缺点树需要额外的空间,