一. Double Write
1 Double Write介绍
• Double Write的目的是为了保证数据写入的可靠性, 避免partial write 的情况 ◦ partial write(部分写) ◾ 16K的页只写入了4K,6K,8K,12K的情况(此时是不完整、不干净的页); ◾ 不可以 通过redo log进行恢复; ◾ redo恢复的前提是该 页 必须是 完整、干净 的; • Double Write是 全局 的 • 共享表空间存在一个 段对象 double write,然后这个段 由2个区( 1M)组成 • 2M固定大小(both file and memory) • 页在刷新时,首先 顺序 的写入到double write • 然后再刷回磁盘(ibd)
# 有点类似 RAID-1 的机制,总有一份数据是正确的
# 简单说来,就是在脏页刷新到磁盘前,先要有个地方记录这个脏页的副本
1. 将脏页copy到Double Write Buffer对象中,默认2M大小; 2. 将Double Write Buffer中的对象 先写入 到共享表空间(ibdata1)中的Double Write; ◦ 2M循环覆盖 ◦ 顺序 写入(一次IO) 3. 再根据(space,page_no)写入到原来的ibd文件中; 4. 如果是在写到ibdata1中的Double Write时,发生宕机;此刻原来的ibd file 仍然是完整、干净的 ,下次启动后是可以用redo文件进行恢复的。 5. 如果是写到ibd文件时,发生了宕机;此刻在原来的 ibdata1中存在副本 ,可以直接覆盖到ibd文件(对应的页)中去,然后再进行redo进行恢复
redo是 物理逻辑 的, 物理 表示记录的日志针对的是 页( page) 的修改, 逻辑 表示记录日志的内容是逻辑的。
mysql> show variables like "%doublewrite%";
+--------------------+-------+
| Variable_name | Value |
+--------------------+-------+
| innodb_doublewrite | ON |
+--------------------+-------+
1 row in set (0.00 sec)
2. Double Write的开销
• 假设每个页大小为16K,则2M的Double Write中存放了128个页,在使用了Double Write之后,IO从原来的128次IO变成了 128 + 1 次IO,而 不是128 + 128 次IO。 • Double Write的2M数据是 顺序 刷入磁盘的,是 一次IO ,该次IO的大小为2M。 • 开启Double Write的性能降低5% ~ 25%(IO Bound场景下降的最厉害) • slave服务器同样 需要开启
3. Double Write可以关闭的前提
1. 支持 原子 写的设备 ◦ 磁盘 ◾ Funsion-IO ◾ 宝存 ◦ 文件系统 ◾ ZFS (Linux上不推荐使用) ◾ btrfs(Linux上不推荐使用) ◾ 使用 copy on wirte 机制, 不进行原地更新 ,而是开辟新的位置,写成功后,将原来的页 释放 ◾ 本质上的思路还是 保留一个副本 2. innodb_doublewrite=0 可以关闭double write功能
二. Insert/Change Buffer
1. Insert/Change Buffer介绍
• MySQL5.5版本以前叫做 insert buffer ,现在叫做 change buffer • 提高辅助索引的插入性能 • 非唯一 的二级索引(non-unique secondary index) • Insert/Change Buffer 是一个 持久化 的对象(在ibdata1中,同时也会写redo日志) • Insert/Change Buffer页是一棵B+树,每次最缓存 2K 的记录 • 开启后有30%的性能提升(默认开启) • MySQL5.5版本之前,最大可以设置为Buffer Pool的 1/2 ,现在最大只能设置为 1/4 • 当Insert Buffer进行 合并 的时候, 性能下降
mysql> show variables like "%change_buffer%"; +-------------------------------+-------+ | Variable_name | Value | +-------------------------------+-------+ | innodb_change_buffer_max_size | 25 | | innodb_change_buffering | all | +-------------------------------+-------+ 2 rows in set (0.00 sec)
2. Insert/Change Buffer举例
CREATE TABLE t ( a INT AUTO_INCREMENT, -- a 列是自增的 b VARCHAR(30), -- b 列是varchar PRIMARY KEY(a) -- a 是主键 key(b) -- b 是二级索引(如果是name之类的,可以看成是非唯一的) );
• 对于 主键 (a列),每次插入都要立即插入对应的 聚集索引 页中(在内存中就直接插入,不在内存就先读取到内存) • 对于 二级索引 (secondary index)(b列) 1. 在 没有 Insert/Change Buffer时,每次插入一条记录,就要读取一次页(读取内存,或者从磁盘读到内存),然后将记录插入到页中; 2. 在 有 Insert/Change Buffer时,当插入一条记录时, 先判断 记录对应要插入的 二级索引 (secondary index)页 是否 在Buffer Pool中: ◾ 如果该 二级索引 (secondary index)页 已经在Buffer Pool中 ,则 直接插入 ; ◾ 反之,先将其 Cache 起来,放到Insert/Change Buffer中,等到该 二级索引 (secondary index)页被 读到 时,将Insert/Change Buffer中该页对应的记录 合并 (Merge)进去,从而减少I/O操作;
Insert/Change Buffer就是用来 提升二级索引插入的性能 。 使用空间换时间,批量插入的方式(二级索引可以不急着插入,只要主键已经插入了即可)
3. Insert/Change Buffer 性能
1. 左图使开启了Insert/Change Buffer,而右图未开启; 2. 一开始都比较高是因为还没有全量的进行刷磁盘(脏页全部在Buffer Pool中,还没满) ◦ 如开始介绍时所说,当Insert Buffer进行合并的时候,性能进行下降 3. 开启Insert/Change Buffer后,insert的常量值在 5K 左右; 4. SSD场景下也建议开启;
4. Insert/Change Buffer 查看
mysql> show engine innodb statusG -- -----------省略其他输出------------- ------------------------------------- INSERT BUFFER AND ADAPTIVE HASH INDEX ------------------------------------- Ibuf: size 1, free list len 0, seg size 2, 0 merges -- 这里为0 ,可能是Buffer Pool足够大,
-- 数据页都缓存在内存中了,就用不到buffer了 merged operations: insert 0, delete mark 0, delete 0 discarded operations: insert 0, delete mark 0, delete 0
1. seg size: 页 的数量,例如当前页为8K,则 seg_size * 8K 就是Insert/Change Buffer使用的内存大小; 2. merges:合并了多少 页 ; 3. merged insert:插入了多少条 记录 ; ◦ insert / merges 就是插入的效率 (插入一条记录,就要读取一次页); 4. discarded operations:应该是很小的值,或者为0;当记录写入到Insert/Change Buffer后,对应的表被删除了,则相应的Buffer中的记录就应该被丢弃; 使用Insert/Change Buffer的前提时,需要 使用随机IO ,这时才放入Buffer中,如果页已经在Buffer Pool(内存)中,就 不需要 使用Insert/Change Buffer了
5. Change Buffer
• 从MySQL 5.5 以后,改名为Change Buffer,表示不仅仅适用于insert。 1. Insert 2. Delete-Marking(标记删除) 3. Purge(清除) 4. innodb_change_buffering = all ◾ all ◾ none (禁用) ◾ inserts ◾ deletes ◾ changes =(insert & delete-marking) ◾ purg
三. Adaptive Hash Index(自适应Hash索引)
• 搜索的时间复杂度 ◦ B+树 O(T),只能定位到该记录所在的页; ◦ 哈希表 O(1),可以直接定位到记录; • 可以自己判断是否是活跃的页,如果是活跃的页,可以自动做Hash,管理员无需人工干预; • MySQL5.6版本后,官方 不推荐 使用自适应Hash索引 ◦ CPU 使用率变高,但是性能没有提升; • MySQL5.7中增加了 innodb_adaptive_hash_index_parts ,增加分片,以减少竞争; • 只对等值的操作有意义;
四. Flush Neighbor Page (FNP)
• 刷新 脏页所在区 (extent)的 所有脏页 ,合并IO,随机转顺序的优化; ◦ 写入的数据太多 ◦ 如果业务确实是频繁更新,那刷新也会很频繁 • 对传统机械磁盘有意义; ◦ innodb_flush_neighbors={0|1|2} (>=MySQL 5.6) ◦ 0:表示关闭该功能 ◦ 1:表示刷新一个区内的脏页 ◦ 2:表示刷新几个 连续 的脏页 • SSD建议关闭次功能;
mysql> show variables like "%flush_neigh%"; +------------------------+-------+ | Variable_name | Value | +------------------------+-------+ | innodb_flush_neighbors | 2 | -- 非SSD建议使用2 +------------------------+-------+ 1 row in set (0.00 sec)