一 . 基础规范
1.必须使用InnoDB存储引擎
解读:支持事务;支持行级锁;支持MVCC多版本控制;支持外键;死锁自动检测;并发性能更好、CPU及内存缓存页优化使得资源利用率更高。
2. 表字符集推荐使用utf8mb4
解读:utf8 是 Mysql 中的一种字符集,只支持最长三个字节的 UTF-8字符,也就是 Unicode 中的基本多文本平面(BMP)。任何不在基本多文本平面的 Unicode字符,都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上),和很多不常用的汉字,以及任何新增的 Unicode 字符等等。要在 Mysql 中保存 4 字节长度的 UTF-8 字符,需要使用 utf8mb4 字符集,utf8mb4是utf8的超集,有存储4字节例如表情符号时,使用它。
3. 数据表、数据字段必须加入中文注释
解读:方便大家对表的理解,方便DBA和开发的沟通,方便历史传承。
4. 禁止使用存储过程、视图、触发器、Event
解读:A.对数据库性能影响较大,互联网业务,能让站点层和服务层干的事情,不要交到数据库层,数据库擅长存储和索引。
B.调试,排错,迁移都比较困难,扩展性较差。
5. 禁止存储大文件或者大照片
解读:建议存储到专门的类型数据库中。
6.MySQL 服务配置时,明确server_id
In MySQL 5.7, a server ID had to be specified when binary logging was enabled, or the server would not start. In MySQL 8.0, the server_id
system variable is set to 1 by default. The server can be started with this default ID when binary logging is enabled, but an informational message is issued if you do not specify a server ID explicitly using the --server-id
option. For servers that are used in a replication topology, you must specify a unique nonzero server ID for each server.
二 . 命名规范
1. 库名,表名,列名必须用小写,采用下划线分隔
解读:A.数据库服务器端开了大小写敏感,提高数据库服务器性能
B.只有一套标准,避免Abc,ABC混淆(SQL)
2. 库名,表名,列名必须见名知义,长度不要超过32字符
解读:见名知义,便于理解;长度不要过长,便于书写。
三 . 表设计规范
1. 表必须有主键,推荐使用bigint,表数据量少也可使用unsigned int为主键
解读:删除无主键的表,如果是row模式的主从架构,从库会挂住
2. 主从表可使用自增bigint做主键,冗余无业务含义的字段做关联字段,并做非聚集索引
解读:A.如order表自增主键id,冗余order_no字段,order_detail表自增主键id,冗余order_no字段;orderorder_detail和通过order_no关联,并对order_no做非聚集索引
B.可有效减少数据文件和索引文件提示查询性能
3. 禁止使用外键,如果要保证完整性,应由应用程式实现
解读:外键使得表之间相互耦合,影响update/delete等SQL性能,有可能造成死锁,高并发情况下容易成为数据库瓶颈点
4. 建议将大字段,访问频度低的字段拆分到单独的表中存储,分离冷热数据
解读:会显著提升该表的查询性能
5. 表必须有字段create_by、create_time、modify_by、modify_time、disabled
解读:便于表的维护。
四 . 列设计规范
1. 根据业务区分使用tinyint/int/bigint,分别会占用1/4/8字
解读:数据量大时,表字段的类型会显著影响性能
2. 根据业务区分使用char/varchar
解读:A.字段长度固定,或者长度近似的业务场景,适合使用char,能够减少碎片,查询性能高
B.字段长度相差较大,或者更新较少的业务场景,适合使用varchar,能够减少空间
3. 根据业务区分使用datetime(3)/timestamp(3)
解读:A.前者占用8个字节,后者占用4个字节,存储年使用YEAR,存储日期使用DATE,存储时间使用datetime(3)
B.如果需要根据时区显示对应时区的时间,使用timestamp
C.Datetime(3)/timestamp(3)保存到毫秒级别,程序端select now(3)
4. 必须把字段定义为NOT NULL并设默认值
解读:A.NULL的列使用索引,索引统计,值都更加复杂,MySQL更难优化
B.NULL需要更多的存储空间
C.NULL只能采用IS NULL或者IS NOT NULL,不可使用=/!=/in/not in
5. 使用varchar(20)存储手机号,不要使用整数
解读:A.牵扯到国家代号,可能出现+/-/()等字符,例如+86
B.手机号不会用来做数学运算
C.varchar可以模糊查询,例如like ‘138%’
6. 使用TINYINT来代替ENUM
解读:ENUM增加新值要进行DDL操作
五 . 索引规范
1. 非聚集索引使用idx_[字段名]来命名
2. 单张表索引数量建议控制在5个以内
解读:A.互联网高并发业务,太多索引会影响写性能
B.生成执行计划时,如果索引太多,会降低性能,并可能导致MySQL选择不到最优索引
C.异常复杂的查询需求,可以选择其他等更为适合的方式存储
3. 尽量避免禁止使用唯一索引
解读:只是比非聚集索引快一个CPU查找的时间,但在delete,update时都要重新排序
4. 组合索引字段数不建议超过3个
解读:如果3个字段还不能极大缩小row范围,很可能是设计有问题
5. 不建议在频繁更新的字段上建立索引
6. 非必要不要进行JOIN查询,如果要进行JOIN查询,被JOIN的字段必须类型相同,并建立索引
解读: JOIN字段类型不一致,会导致全表扫描。
7. 理解组合索引最左前缀原则,避免重复建设索引,如果建立了(a,b,c),相当于建立了(a), (a,b), (a,b,c)
六 . SQL语句规范
1. 禁止使用select *,只获取必要字段
解读:A.select *会增加cpu/io/内存/带宽的消耗
B.指定字段能有效利用索引覆盖
C.指定字段查询,在表结构变更时,能保证对应用程序无影响
2. insert必须指定字段,禁止使用insert into T values()
解读:指定字段插入,在表结构变更时,能保证对应用程序无影响
3. 隐式类型转换会使索引失效,导致全表扫描
解读:一定要确保声明的类型和索引字段类型一致
4. 禁止在where条件列使用函数或者表达式
解读:导致不能命中索引,全表扫描
5. 禁止%开头的模糊查询
解读:导致不能命中索引,全表扫描
6. 尽可能不使用大表JOIN和子查询
解读:会占用大量的内存、IO、CPU,如果使用到要先缩小结果集在做join(超过1000万的表都应该考虑缩小结果集在做join)
7. 区分INNERLEFTRIGHTFULL JOIN,合理使用,JOIN尽量不超过3个表
解读:MySQL查询优化器很烂,可在测试环境构造不同的写法,查看对应的执行计划,得出最佳的方案,可使用测试环境最佳实践
8. 同一个字段上的OR必须改写为IN,IN的值必须少于50个
9. 应用程序必须捕获SQL异常
解读:方便定位线上问题