本文实例讲述了MySQL常用存储引擎功能与用法。
MySQL存储引擎主要有两大类:
1. 事务安全表:InnoDB、BDB。
2. 非事务安全表:MyISAM、MEMORY、MERGE、EXAMPLE、NDB Cluster、ARCHIVE、CSV、BLACKHOLE、FEDERATED等。
MySQL默认的存储引擎是MyISAM(5.7版本中默认为InnoDB)。
配置文件中设置默认存储引擎的参数:default-table-type。
查询当前数据库支持的存储引擎:
1
2
|
show engines; show variables like 'have%' ; |
查看当前的默认存储引擎:
1
|
show variables like '%table_type%' ; |
创建新表时指定存储引擎:
1
|
create table (...) engine=MyISAM; |
下面详细介绍4个比较常用的存储引擎:MyISAM、InnoDB、MEMORY和MERGE。
一、MyISAM
1. 数据文件:
MyISAM数据表在磁盘存储成3个文件,其文件名都和表名相同,扩展名分别是:
(1).frm:存储数据表结构定义。
(2).MYD:存储表数据。
(3).MYI:存储表索引。
其中,数据文件和索引文件可以放置在不同的目录,平均分布IO,获得更快的速度。指定索引文件和数据文件的路径,需要在创建表的时候通过data directory和index directory语句指定。(文件路径需要是绝对路径并且具有访问的权限)
MyISAM类型的表可能会损坏,原因可能是多种多样的,损坏后的表可能不能访问,会提示需要修复或者访问后返回错误的结果。可以使用check table语句来检查MyISAM表的健康,并用repair table语句修复已经损坏的MyISAM表。
2. 存储格式:
(1)静态表(默认):字段都是非变长的(每个记录都是固定长度的)。存储非常迅速、容易缓存,出现故障容易恢复;占用空间通常比动态表多。
(2)动态表:占用的空间相对较少,但是频繁的更新删除记录会产生碎片,需要定期执行optimize table或myisamchk -r命令来改善性能,而且出现故障的时候恢复比较困难。
(3)压缩表:使用myisampack工具创建,占用非常小的磁盘空间。因为每个记录是被单独压缩的,所以只有非常小的访问开支。
静态表的数据在存储的时候会按照列的宽度定义补足空格,在返回数据给应用之前去掉这些空格。如果需要保存的内容后面本来就有空格,在返回结果的时候也会被去掉。(其实是数据类型char的行为,动态表中若有这个数据类型也同样会有这个问题)
(静态表和动态表是根据正使用的列的类型自动选择的。)
3. 优劣势:
(1)优势:访问的速度快。
(2)不支持事务、也不支持外键。
4. 适用情况:
如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存储引擎是非常适合的。MyISAM 是在Web、数据仓库和其他应用环境下最常使用的存储引擎之一。
二、InnoDB
1. 存储方式:
InnoDB存储表和索引有以下两种方式:
(1)使用共享表空间存储:这种方式创建的表结构保存在.frm文件中,数据和索引保存在innodb_data_home_dir和innodb_data_file_path定义的表空间中,可以是多个文件。
(2)使用多表空间存储:这种方式创建的表结构仍然保存在.frm文件中,但是每个表的数据和索引单独保存在.idb文件中。如果是个分区表,则每个分区对应单独的.idb文件,文件名是“表名+分区名”,可以在创建分区的时候指定每个分区的数据文件的位置,以此来将表的IO均匀分布在多个磁盘上。
要使用多表空间的存储方式,需要设置参数innodb_file_per_table并重启服务器后才可以生效,而且只对新建的表生效。多表空间的数据文件没有大小限制,不需要设置初始大小,也不需要设置文件的最大限制、扩展大小等参数。即使在多表空间的存储方式下,共享表空间仍然是必须的,InnoDB把内部数据词典和工作日志放在这个文件中,所以备份使用多表空间特性的表时直接复制.idb文件是不行的,可以通过命令将数据备份恢复到数据库中:
1
2
|
ALTER TABLE tbl_name DISCARD TABLESPACE; ALTER TABLE tbl_name IMPORT TABLESPACE; |
但是这样只能恢复到表原来所在数据库中,如果需要恢复到其他数据库则需要通过mysqldump和mysqlimport来实现。
2. 数据文件:
InnoDB的数据文件由表的存储方式决定。
(1)共享表空间文件:由参数innodb_data_home_dir和innodb_data_file_path定义,用于存放数据词典和日志等。
(2).frm:存放表结构定义。
(3).idb:使用多表空间存储方式时,用于存放表数据和索引,若使用共享表空间存储则无此文件。
3. 外键约束:
InnoDB是MySQL唯一支持外键约束的引擎。外键约束可以让数据库自己通过外键保证数据的完整性和一致性,但是引入外键会使速度和性能下降。在创建外键的时候,要求父表必须有对应的索引,子表在创建外键的时候也会自动创建对应的索引。
外键约束使用示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
CREATE TABLE `dep` ( `id` smallint (6) NOT NULL AUTO_INCREMENT, ` name ` varchar (20) DEFAULT NULL , PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; CREATE TABLE `emp` ( `id` int (11) NOT NULL AUTO_INCREMENT, ` name ` varchar (20) DEFAULT NULL , `dep_id` smallint (6) NOT NULL , PRIMARY KEY (`id`), KEY `idx_fk_dep_id` (`dep_id`), CONSTRAINT `fk_emp_dep` FOREIGN KEY (`dep_id`) REFERENCES `dep` (`id`) ON UPDATE CASCADE ) ENGINE=InnoDB DEFAULT CHARSET=utf8; |
KEY :定义索引约束名称。
CONSTRAINT:定义外键约束名称。(在数据库中应是唯一的,若不指定系统会自动生成一个约束名)
ON:指定父表操作对子表的影响(不定义默认采用restrict)。
Restrict和no action:在子表有相关记录的情况下父表不能更新或删除。
Cascade:在父表更新或删除时,同时更新或删除子表对应的记录。
Set null:在父表更新或删除的时候,子表的对应字段被设置为null。
当某个表被其他表创建了外键参照,那么这个表的对应索引或者主键禁止被删除。在导入多个表的数据时,如果需要忽略表的导入顺序,可以暂时关闭外键的检查;在执行load data和alter table操作的时候,也可以通过暂时关闭外键约束来加快处理的速度。
关闭命令:
1
|
set foreign_key_checks=0; |
开启命令:
1
|
set foreign_key_checks=1; |
4. 优劣势:
(1)优势:提供了具有提交、回滚和崩溃恢复能力的事务安全。
(2)劣势:相比MyISAM,InnoDB写的处理效率差一些,并且会占用更多的磁盘空间以保留数据和索引。
5. 适用情况:
如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询以外,还包括很多的更新、删除操作,那么InnoDB 存储引擎应该是比较合适的选择。InnoDB 存储引擎除了有效地降低由于删除和更新导致的锁定,还可以确保事务的完整提交和回滚,对于类似计费系统或者财务系统等对数据准确性要求比较高的系统,InnoDB 都是合适的选择。
三、MEMORY
1. 数据文件:
每个MEMORY表只对应一个.frm磁盘文件,用于存储表的结构定义,表数据存放在内存中。默认使用HASH索引,而不是BTREE索引。
2. 优劣势:
(1)优势:访问速度非常快,因为数据是存在内存中的。
(2)劣势:一旦服务关闭,表中的数据就会丢失;对表的大小有限制。
3. 适用情况:
Memory存储引擎主要用在那些内容变化不频繁的代码表,或者作为统计操作的中间结果表,便于高效地对中间结果进行分析并得到最终的统计结果。
四、MERGE
1. 引擎原理:
Merge存储引擎是一组MyISAM表的组合,这些MyISAM表必须结构完全相同,merge表本身并没有数据,对merge类型的表可以进行查询、更新、删除的操作,这些操作实际上是对内部的实际的MyISAM表进行的。
通过insert_method子句定义merge表的插入操作:使用first或last可以使插入操作被相应地作用在第一或最后一个表上,不定义或定义为No表示不能对这个merge表进行插入操作。对merge表进行drop操作只是删除了merge的定义,对内部的表没有任何影响。
2. 数据文件:
(1).frm:存储表定义。
(2).MRG:存储组合表的信息,包括merge表由哪些表组成、插入新数据时的依据。可以通过修改.mrg文件来修改merge表,但是修改后要通过flush tables刷新。
3. 使用示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
CREATE TABLE `m1` ( `id` int (11) NOT NULL AUTO_INCREMENT, ` name ` varchar (20) DEFAULT NULL , PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8; CREATE TABLE `m2` ( `id` int (11) NOT NULL AUTO_INCREMENT, ` name ` varchar (20) DEFAULT NULL , PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8; CREATE TABLE `m` ( `id` int (11) NOT NULL AUTO_INCREMENT, ` name ` varchar (20) DEFAULT NULL , PRIMARY KEY (`id`) ) ENGINE=MRG_MyISAM DEFAULT CHARSET=utf8 INSERT_METHOD= LAST UNION =(`m1`,`m2`); |
4. 适用情况:
用于将一系列等同的MyISAM 表以逻辑方式组合在一起,并作为一个对象引用它们。MERGE 表的优点在于可以突破对单个MyISAM 表大小的限制,并且通过将不同的表分布在多个磁盘上,可以有效地改善MERGE 表的访问效率。这对于诸如数据仓储等VLDB环境十分适合。