MySQL源码数据结构hash

MySQL源码自定义了hash表，因为hash表具有O(1)的查询效率，所以，源码中大量使用了hash结构。下面就来看下hash表的定义：

【源代码文件include/hash.h mysys/hash.c】

typedef uint my_hash_value_type;

typedef uchar *(*my_hash_get_key)(const uchar *,size_t*,my_bool);
typedef void (*my_hash_free_key)(void *);
 
typedef struct st_hash {
  size_t key_offset,key_length;          /* Length of key if const length */
  size_t blength;
  ulong records;
  uint flags;
  DYNAMIC_ARRAY array;                    /* Place for hash_keys */
  my_hash_get_key get_key;
  void (*free)(void *);
  CHARSET_INFO *charset;
} HASH;
 
 
typedef struct st_hash_info {
  uint next;                         /* index to next key */
  uchar *data;                         /* data for current entry */
} HASH_LINK;

hash的特点：

1. hash的每一个元素都存放在array动态数组中

2. 给定一个key值，通过hash算法来计算它在array中的位置

3. array中的元素存放的是hash_link对象，而使用hash表的对象必须自己申请内存，把地址存放在hash_link->data中

4. 根据key获取一个元素hash_link->data时，需要强制转换成保存进去的类型。

5. hash表虽然使用calc_hash来计算hash值，但会按照array的位置（hash_mask函数）来进行存放。

用一个图来表示下：

下面看下hash表的函数：

1. _my_hash_init(HASH *hash, uint growth_size, CHARSET_INFO *charset,
              ulong size, size_t key_offset, size_t key_length,
              my_hash_get_key get_key,
              void (*free_element)(void*), uint flags)

hash：初始化一个hash表

growth_size:初始化hash->array的增长大小

get_key：需要自定义一个从record获取key的方法，然后hash表针对这个key计算hash

free_element:hash中的元素，只记录data的指针，需要自己定义free的方法

2. my_hash_free_elements(HASH *hash)

根据hash->elements的值，从array的0到elements来释放hash_link中的data。

最后hash->elements置为0。

3. my_hash_key(const HASH *hash, const uchar *record, size_t *length,

my_bool first)

根据record和hash中定义的get_key方法来获取key值。

4. my_hash_first(const HASH *hash, const uchar *key, size_t length,
HASH_SEARCH_STATE *current_record)

根据key，length值来查找hash中的data。如果有hash冲突，就返回第一个。

5. my_hash_insert(HASH *info, const uchar *record)

插入record到hash表中：

1. 如果需要hash_unique，会先使用my_hash_search进行查询。

2. 然后计算cacl_hash&&hash_mask来计算位置。

6. my_hash_element(HASH *hash, ulong idx)

获取在hash表位置是idx的元素。

为完待续.....

相关阅读:
软考下午题具体解释---数据流图设计
透视表提取不反复记录（4）-每一个物品的最大值
运用python抓取博客园首页的所有数据，而且定时持续抓取新公布的内容存入mongodb中
[经验总结]material design效果与开发总结
cocos2d-x 3.0 回调函数
P1334 瑞瑞的木板
P2776 [SDOI2007]小组队列
P1886 滑动窗口
P1160 队列安排
P1823 音乐会的等待

原文地址：https://www.cnblogs.com/xpchild/p/3715933.html

MySQL源码 数据结构hash

MySQL源码数据结构hash