查找(Searching)就是根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素(或记录)。
静态查找表:只做查找操作的查找表。
它的主要操作有:
(1)查询某个“特定的”数据元素是否在查找表中。
(2)检索某个“特定的”数据元素和各种属性。
对于静态查找,可以使用线性表结构来组织数据。
动态查找表:在查找过程中同时插入查找表中不存在的数据元素,或者从查找表中删除已经存在的某个数据元素。
它的主要操作有:
(1)查找时插入数据元素。
(2)查找时删除数据元素。
如果是动态查找,可以考虑二叉排序树查找技术。
1、顺序表查找:
又叫线性查找,是最基本的查找技术,它的查找过程是:从表中第一个(或者最后一个)记录开始,逐个进行记录的关键字和给定值比较,若某个记录的关键字和给定值相等,则查找成功,找到所查的记录;如果直到最后一个(或者第一个)记录,其关键字和估计值比较都不等时,则表中没有所查的记录,查找不成功。
2、有序表查找:
(1)折半查找 (2)插值查找 (3)斐波那契查找
3、线性索引查找:
(1)稠密索引
稠密索引是指在线性索引中,将数据集中的每个记录对应一个索引项。其中索引项一定是按照关键字码有序的排列。
(2)分块索引
为了减少索引项的个数,我们可以对数据集进行分块,使其分块有序,然后再对每一块建立一个索引项,从而减少索引项的个数。
分块有序,是把数据集的记录分成了若干块,并且这些块需要满足两个条件:
① 块内无序 ② 块间有序
分块索引的索引项结构分三个数据项:
① 最大关键码,它存储每一块中的最大关键字;
② 存储块中的记录个数,以便于循环时使用;
③ 用于指向块首数据元素的指针,便于开始对这一块中记录进行遍历。
(3)倒排索引
索引项的通用结构是次关键码和记录号表,其中记录号表存储具有相同次关键字的所有记录的记录号(可以是指向记录的指针或者该记录的主关键字)。这样的索引结构就是倒排索引。