• MySQL源码 数据结构hash


    MySQL源码自定义了hash表,因为hash表具有O(1)的查询效率,所以,源码中大量使用了hash结构。下面就来看下hash表的定义:
    【源代码文件include/hash.h mysys/hash.c】
     
    typedef uint my_hash_value_type;
    typedef uchar *(*my_hash_get_key)(const uchar *,size_t*,my_bool);
    typedef void (*my_hash_free_key)(void *);
     
    typedef struct st_hash {
      size_t key_offset,key_length;          /* Length of key if const length */
      size_t blength;
      ulong records;
      uint flags;
      DYNAMIC_ARRAY array;                    /* Place for hash_keys */
      my_hash_get_key get_key;
      void (*free)(void *);
      CHARSET_INFO *charset;
    } HASH;
     
     
    typedef struct st_hash_info {
      uint next;                         /* index to next key */
      uchar *data;                         /* data for current entry */
    } HASH_LINK;
     
    hash的特点:
         1. hash的每一个元素都存放在array动态数组中
         2. 给定一个key值,通过hash算法来计算它在array中的位置
         3. array中的元素存放的是hash_link对象,而使用hash表的对象必须自己申请内存,把地址存放在hash_link->data中
         4. 根据key获取一个元素hash_link->data时,需要强制转换成保存进去的类型。
         5. hash表虽然使用calc_hash来计算hash值,但会按照array的位置(hash_mask函数)来进行存放。
     
    用一个图来表示下:
         
     
    下面看下hash表的函数:
    1.  _my_hash_init(HASH *hash, uint growth_size, CHARSET_INFO *charset,
                  ulong size, size_t key_offset, size_t key_length,
                  my_hash_get_key get_key,
                  void (*free_element)(void*), uint flags)
     
    hash:初始化一个hash表
    growth_size:初始化hash->array的增长大小
    get_key:需要自定义一个从record获取key的方法,然后hash表针对这个key计算hash
    free_element:hash中的元素,只记录data的指针,需要自己定义free的方法
     
     
    2. my_hash_free_elements(HASH *hash)
      根据hash->elements的值,从array的0到elements来释放hash_link中的data。
      最后hash->elements置为0。
     
    3. my_hash_key(const HASH *hash, const uchar *record, size_t *length,
                my_bool first)
         根据record和hash中定义的get_key方法来获取key值。
     
    4. my_hash_first(const HASH *hash, const uchar *key, size_t length,
                         HASH_SEARCH_STATE *current_record)
     
         根据key,length值来查找hash中的data。如果有hash冲突,就返回第一个。
     
    5. my_hash_insert(HASH *info, const uchar *record)
         插入record到hash表中:
         1. 如果需要hash_unique,会先使用my_hash_search进行查询。
         2. 然后计算cacl_hash&&hash_mask来计算位置。
     
    6. my_hash_element(HASH *hash, ulong idx)
         获取在hash表位置是idx的元素。
     
    为完待续.....     
  • 相关阅读:
    软考下午题具体解释---数据流图设计
    透视表提取不反复记录(4)-每一个物品的最大值
    运用python抓取博客园首页的所有数据,而且定时持续抓取新公布的内容存入mongodb中
    [经验总结]material design效果与开发总结
    cocos2d-x 3.0 回调函数
    P1334 瑞瑞的木板
    P2776 [SDOI2007]小组队列
    P1886 滑动窗口
    P1160 队列安排
    P1823 音乐会的等待
  • 原文地址:https://www.cnblogs.com/xpchild/p/3715933.html
Copyright © 2020-2023  润新知