• python学习第41天


    一.索引树高度

    (1)表的数据量

    数据量越大,树的高度就会变高,理论上三层索引树的高度最为理想,可以支持百万级别的数据量
    解决: 可以使用分表(横切,竖切),分库,增加缓存,解决数据量大,查询慢
    

    (2)索引键值过长

    该索引字段存储数据太大,每个叶子节点最大存储16k,超过这个范围会新增加叶子节点和分支节点
    解决:前缀索引(截取前5个长度)
    

    (3)数据类型

    char(定长) varchar(变长) 从开辟空间速度来看,char快
    从数据结构上来看,varchar更为合理
    

    (4)注意点:

    (1) 避免使用select *,不确定表大小的时候,使用count(*) 查一下数据
    (2) 尽量使用数据类型较小的字段做索引
    (3) 重复值少的,区分度高的字段索引,性别这样的字段不要做索引
    (4) 在多表查询时使用join,尽量少的使用子查询
    

    二.执行计划分析

    执行计划:在一条sql执行之前,制定执行的方案

    desc/explain select * from s1

    (1)select_type

    simple 代表的是简单查询(单表查询,不包括子查询,union)
    primary sql嵌套中的主查询(最外层)
    subquery sql嵌套中的子查询(最里面)
    derived 衍生查询(把子查询结果作为一张临时表)

    (2)table

    在多表或者子查询时候,通过table分析出问题的表是谁

    (3)type

    显示执行计划的类型,优先级从低到高如下,优化时,至少达到range或者ref级别

    all < index < range < ref < eq_ref < const < system

    1)all 全表扫描(不走索引) 查询很慢

    (1)在大范围内查询 > < >= <= != between and  in like ...
    (2)where条件中有计算,有函数
    (3)数据类型不匹配
    (4)拼接条件使用or
    

    2)index 全索引扫描

    扫描整个索引树才能获取到所有数据,这样的索引失去了意义

    desc select count(*) from s1;
    

    3)range 索引范围扫描(注意点:范围太大,不能命中索引)

    desc select * from s1 where id<10;  #type = range
    desc select * from s1 where id<1000000  # type = all
    desc select * from s1 where id between 1 and 10; # type => range
    desc select * from s1 where id between 1 and 1000000 # type=>all
    desc select * from s1 where email like "%w%"; # type=all
    desc select * from s1 where email like "w%" ; # type=range(去掉左边的%会命中索引)
    

    如果范围过大,不能命中索引,如果范围适当,可以命中索引

    对in或者or这样的语句进行优化

    desc select * from s1 where id in (1,2);
    """优化:union all 比 union 速度快, union在合并数据之后,多一步去重操作"""
    desc select * from s1 where id = 1
    union all
    select * from s1 where id = 1;
    
    desc select * from s1 where id = 1
    union
    select * from s1 where id = 1;
    
    优化or条件
    desc select * from s1 where id = 10 or name = "aaaaa"
    
    desc select * from s1 where id = 10
    union all 
    select * from s1 where name = 'aaaaa';
    
    1. ref 普通索引查询(非唯一)
    desc select * from s1 where email = "xboyww10@oldboy";
    desc select * from s1 where id = 10; # 此时id设置是普通索引
    

    5)eq_ref 唯一性索引(联表)

    """要求: 应用在多表联查中,被关联的字段需要主键或者唯一,表之间的关系为一对一并且数据条数相同"""
    desc select student1.age from student1,class1 where student1.class_id = class1.id
    alter table class1 add primary key(id);
    delete from student1 where id = 3;
    

    6)const:主键或者唯一索引(单表)

    """ 针对于primary key  和 unique 索引等值查询 """
    desc select * from class1 where id = 1 # type => const
    desc select * from class1 where id > 1 # type => range
    

    7)system(了解)

    只有一条数据的系统表

    (4)possible_keys

    执行sql时,可能用到的索引

    (5)key

    执行sql时,实际用到的索引

    (6)key_len

    判断联合索引覆盖的长度(通过字节数可以判定出到底触发了哪些联合索引字段)

    在没有not null 约束的时候,默认预留一个字节,标记是空或者非空
    utf8 通常情况下,中文1个字符占用3个字节,字母占用1个字节,极个别的生僻字占4个字节
    varchar 每次存储数据的时候,系统底层默认会额外预留2个字节
    		  有not null(不为空)    没有not null(可为空)
    tinyint    1                     1+1
    int        4					 4+1
    char(5)    5*3				   	 5*3+1
    varchar(5) 5*3 + 2				 5*3+2+1
    
    # 把数据表中的数据导入
    +------+----+------+----+------+----+
    | n1   | n2 | n3   | n4 | n5   | n6 |
    +------+----+------+----+------+----+
    |    1 |  2 | a    | b  | aa   | bb |
    |    1 |  2 | a    | b  | aa   | bb |
    |    1 |  2 | a    | b  | aa   | bb |
    |    2 |  2 | a    | b  | cc   | dd |
    +------+----+------+----+------+----+
    +-------+------------+------+-----+---------+-------+
    | Field | Type       | Null | Key | Default | Extra |
    +-------+------------+------+-----+---------+-------+
    | n1    | int(11)    | YES  | MUL | NULL    |       |
    | n2    | int(11)    | NO   |     | NULL    |       |
    | n3    | char(5)    | YES  |     | NULL    |       |
    | n4    | char(5)    | NO   | MUL | NULL    |       |
    | n5    | varchar(5) | YES  |     | NULL    |       |
    | n6    | varchar(5) | NO   |     | NULL    |       |
    +-------+------------+------+-----+---------+-------+
    n1 -> 5B  n2 -> 4B n3 ->16B   5+4+16 = 25
    desc select * from t100 where n1 = 2 and n2 = 2 and n3 ="a"; # 命中n1 n2 n3
    desc select * from t100 where n1 = 1 and n2 = 2 and n3 ="a"; # 如果有重复数据,不会触发联合索引
    desc select * from t100 where n1 = 1 and n2 = 2 ;# 如果有重复数据,不会触发联合索引
    desc select * from t100 where n1 = 2 and n2 = 2 ;# n1 -> 5B  n2 -> 4B 命中n1 , n2
    desc select * from t100 where n1 = 2;# n1 -> 5B 命中n1
    desc select * from t100 where n1 = 2 and n3 = "a"; # n1 -> 5B 命中n1 没有命中n3
    desc select * from t100 where n2 = 2 and n3 = "a"; # 符合最左前缀原则,在没有n1的情况下不能触发;
    
    # 联合索引: index(a,b,c) -> a , ab , abc 创建了三组索引 ,符合最左前缀原则,第一个字段必须存在才能触发;
    

    三.事务处理的四项特征 ACID

    (1)ACID

    A.原子性:
    同一个事务中执行多条sql语句,要么全部成功,要么直接回滚,作为一个完整的整体,不能再继续分隔的最小个体

    C.一致性:
    a,i,d 都是为了保证数据的一致性才提出来的,比如约束,键在插入数据时,必须按照要求插入,保证规则上的一致性,
    上升到事务中,如果出现意外导致数据不统一,例如脏读,幻读,不可重读,最终要保证数据是一致的
    上升到主从数据库,主数据库增删改,从数据也要进行同步改变,保证数据的一致性;

    I.隔离性:
    lock + isolation锁,来处理事务的隔离级别
    一个事务和另外一个事务工作过程中彼此独立隔离

    D.持久性:
    把数据写到磁盘上,保证数据持久化存储不丢失.

    (2)隔离性: 隔离级别

    脏读 : 没提交的数据被读出来了
    不可重读 : 前后多次读取,结果数据内容不一样(同一个会话里,在不修改的情况下,永远只看到同样的一份数据)
    幻读 : 前后多次读取,结果数据的总量不一样

    RU : 读未提交 : 脏读,不可重读,幻读 READ-UNCOMMITTED
    RC : 读已提交 : 防止脏读,会出现不可重读和幻读 READ-COMMITTED
    RR : 可重复读 : 防止脏读,不可重读 ,可能会出现幻读 REPEATABLE-READ
    SR : 可串行化 : 防止一切(但是会把异步并发的程序变成同步程序,不能并发,性能差)

    # 查询当前mysql的隔离级别  (默认是RR)
    select @@tx_isolation;
    # 查询是否自动提交数据
    select @@autocommit;
    
    # 修改mysql配置文件
    D:MySQL5.7mysql-5.7.25-winx64my.ini
    # 更改隔离级别
    transaction_isolation =  READ-UNCOMMITTED 
    # 不让系统自动提交数据
    autocommit = 0
    
    # 重启mysql
    net stop mysql
    net start mysql
    
    # 1.脏读
    READ-UNCOMMITTED 
    先去调整设置,重启mysql ,尝试在一个窗口里通过事务,更改一条数据,开启另外一个窗口尝试读取,会出现问题
    
    # 2.不可重复读
    # 窗口1
    begin;
    update t1 set k1="abc" where id = 1
    select * from t1;
    commit;
    
    # 窗口2
    select * from t1; 数据也跟着改了是不可重读
    
    # 3.幻读
    # 窗口1
    begin;
    insert into t1 values(4,'c',50);
    select * from t1;
    commit;
    
    # 窗口2
    select * from t1; 数量也跟着增加了是幻读
    
    # 4.通过二次提交commit , 可以让多用户同步数据;
    commit;
    
    # 5.事务应用的计数(了解)
    (1) RR级别下,解决不可重读,使用mvcc技术,生成最新的mysql的系统备份(快照),然后读取快照
    (2) RR级别下,解决幻读,gap 间隙锁 next-lock 下一键锁
    
  • 相关阅读:
    mysql show的常见用法
    【转】在ubuntu下完美安装RTX(解决离线、乱码问题)(图片无法显示)
    bcdedit 替代easybcd 编辑grub
    Ruby学习札记(二)[数组]
    Ruby学习札记(一)常用数据
    [分布式]分布式锁
    移动docker数据文件到nas共享盘、释放C盘空间
    [分布式]分布式限流
    [分布式]分布式会话session、spring-session
    学习强国挑战答题学习资料
  • 原文地址:https://www.cnblogs.com/yunchao-520/p/13190611.html
Copyright © 2020-2023  润新知