一、库操作
1,创建库 : create database 库名;
2,删除库: drop database 库名;
3,查看当前有多少数据库:show databases;
4,查看当前使用的数据库: select datebase();
5,切换到这个数据下:use 库名;
二、表操作(增删改查)
增
创建表:create table 表名(字段名 数据类型(长度));
create table day (id int,name char(4)); mysql5.6版本默认是engine=innodb
create table day (id int,name char(4)) engine=myisam;
create table day (id int,name char(4)) engine=memory;
create table 表名(
id int auto_increment primary key,
name varchar(20) not null default ''
)engine=innodb charset=uft8;
删
删除表:drop table 表名;
drop table student;
改
修改:
添加字段:alter table 表名 add 字段名 数据类型(宽度) 约束;
删除字段:alter table 表名 drop 字段名;
修改字段:
alter table 表名 add|modify|drop|change
add 列名 类型
modify 列表 类型
drop 列名
change 旧列名 新列名 类型
修改已经存在的字段的类型,长度,约束:使用modify
alter table 表名 modify name varchar(12) not null;
修改已经存在的字段的类型,长度,约束和字段名字:使用change
alter table 表名 change name new_name varchar(12) not null;
特殊:有三个字段依次是:id name age
交换name和age的位置:alter table 表名 modify age int not null after id;
将age放在第一位:alter table 表名 modify age int not null first;
修改表名:
rename from 旧表名 to 新表名
查
查询:
查看当前有多少张表: show tables;
查看表结构:
查看表的创建过程: show create table 表名;
查看基础信息: desc 表名;
表与表之间的关系
1,两张表中的的数据之间的关系
多对一:
forerign key 永远是在多的那张表中设置外键
多个学生都是同一个班级的,学生是多,班级是一
两张表:学生表和班级表,学生表关联班级表
一对一:
foreign key + unique 后出现的后一张表中的数据作为外键,并且要约束这个外键是唯一的
一个学生是一个客户,两张表:学生表和客户表
客户表作为外表,在学生表中设置外键
多对多:
产生第三张表,把两个关联关系的字段作为第三张表的外键,并且要约束这两个外键是唯一约束
一本书有多个作者,一个作者有多本数,两张表:书名表和作者表
三,数据操作(增删改查)
增:insert
insert into 表名 values (值....);
所有的在这个表中的字段都需要按照顺序被填写在这里
insert into 表名(字段名,字段名。。。) values (值....);
所有在字段位置填写了名字的字段和后面的值必须是一一对应
insert into 表名(字段名,字段名。。。) values (值....),(值....),(值....);
所有在字段位置填写了名字的字段和后面的值必须是一一对应
value单数:一次性写入一行数据,values复数:一次性写入多行数据
写入角度:
第一个角度:写入一行内容还是写入多行
insert into 表名 values (值....);
insert into 表名 values (值....),(值....),(值....);
第二个角度:
是把这一行所有的内容都写入:insert into 表名 values (值....);
还是按指定字段写入:insert into 表名(字段1,字段2) values (值1,值2);
删:delete
delete from 表名 where 条件d;
删除id=1那行的数据:delete from student where id=1;
delete from 表名;
删除所有的数据:delete from student;
改:update
update 表名 set 字段名=新值;
修改所有的数据 : update student set name='nana';
updata 表名 set 字段名=新值
修改id=2的数据: update student set name='nana' where id =2;
查:select
单表查询
select 语句 :
select * from 表名;
select 列名,.. from 表名;
distinct 去重:
select distinct 列名,... from 表名
select distinct tname from teacher 表名;
对int类型四则运算:
select tid*5 from 表名;
重命名:
select 列名 as 新列名,.. from 表名;
select tname as '姓名' from teacher;
字符串拼接: concat()函数
select concat('姓名:',name,'年薪:',salary) as 表名;
select concat('编号:',tid,'姓名:',tname) from teacher;
where 语句:
比较运算:
大于:>,小于: <,等于: =,大于等于:>=,小于等于:<=,不等于:!= 或 <>
逻辑运算 :
与:and 或:or 非:not
身份运算:
is null : 查看为null 的信息
is not null: 查看不为null 的信息
select * from employee where salary not in (2000,1800)
范围筛选:
多选一: 列名 in (值1,值2...)
select * from score where number in (60,90);
在一个模糊的范围里:
在一个数值区间: between + and
select * from score where number between 60 and 100;
字符的模糊查询: like + 通配符
通配符 % : 匹配任意长度的任意内容
select * from student where sname like'a%';
通配符 _ : 匹配一个字符长度的任意内容
正则匹配: regexp , 更加细粒度的匹配的时候
select * from 表名 where 字段 regexp 正则表达式
select * from employee where emp_name regexp '^j[a-z]{5}';
查看岗位是teacher 且名字是jin开头的员工姓名,薪资
. select emp_name,salary from employee where post ='teaccher' and emp_name like'jin%';
. select emp_name,salary from employee where post = 'teacher' and emp_name regexp'^jin.*';
group by 分组:
分组:
会把在group by 后面的这个字段中的每一个不同的项都保留下来,并且把值是这一项的所有行归为一组
. select * from teacher group by sname;
.可以完成去重 : select 字段名 from 表名 group by 字段名;
.相当于 : select distinct 字段名 from 表名;
聚合:
把很多行的同一字段进行一些统计,最终的到一个结果
.count(字段):统计这个字段的数值的和
.avg(字段):统计这个字段对应的数值的平均值
.min(字段):统计这个字段对应的数值的最小值
.max(字段):统计这个字段对应的数值的最大值
分组聚合: 总是根据会根据重复的项来进行分组,分组总是和聚合函数一起用
.求部门的最高薪资或者求公司的最高薪资都可以通过聚合函数取到
.但是要得到对应的人,就应该通过多表查询
.求最晚入职的员工,实际上是最大的入职日期,即使用 max(), 反之亦然
实例:
求各个部们的人数:
select count(*) from student group by sname;
求公司里男生和女生的人数:
select gender,count(*) from student group by gender;
求各部门年龄最小的
select post,min(age) from employee group by post;
having 语句 : 过滤组
执行顺序:
.总是先执行where 在执行group by分组
.所以相关先分组,之后再根据分组做某些条件筛选的时候,where都用不上
.只能用having来完成
建议: 普通的条件判断用 where, 不要用having
示例: 部门人数大于3的部门
select post from employee group by post having count(*) > 3;
order by 排序:
默认是升序 asc 从小到大 : order by 某一个字段 asc;
指定降序排序 desc 从小到大: order by 某一个字段 desc;
指定先根据第一个字段升序排列,在第一个字段相同的情况下,在根据第二个字段排列:
order by 第一个字段 asc , order by 第二字段 desc;
limit 限制查询数量:
取前 n个 : limit == limit o,n
.考试成绩的前三名
.入职时间最晚的前三个
分页:
.limit m,n 从m+1开始去n个
.员工展示的网页
limit n offset m == limit m,n 从m+1开始取n个
分页核心SQL:
select * from t3 limit (page-1)*offset, offset;
单表查询顺序:
from 表
where 条件
group by 分组
having 过滤组
select 需要显示的列
order by 排序
limit 前n条
多表查询
两张表连在一起 : select * from emp,department;
连表查询: 把两张表连在一起查
内连接:
inner join
.两张表条件不匹配的项不会出现在结果中
.select * from course as c inner join teacher t on c.tearch_id=t.tid;
外连接:
左外连接: left join
显示全左表中的数据
.select * from teacher as t left join course as c on t.tid=c.tearch_id;
右外连接: right join
显示全右边的数据
.select * from teacher as t right join course as c on t.tid=c.tearch_id;
全外连接: mysql中没有全外连接
要实现全外连接,就使用左外连接 union 右外连接
.select * from teacher as t left join course as c on t.tid=c.tearch_id union
select * from course as c right join teacher as t on t.tid=c.tearch_id;
连接的语法:
.select 字段 from 表1 xxx join 表2 on 表1.字段 = 表2.字段;
.常用: 内连接和左连接
示例:
查询大于部门内平均年龄的员工名,年龄
select * from emp inner join (select dep_id,age(age)avg_age from emp group by dep_id)
as d on emp.dep_id=d.dep_id where emp.age > d.avg_age;
子查询 : 常用逻辑查询拼接
示例一: 找到技术部门所有人的姓名
先找到部门表技术部门的部门id
select id from department where name='技术';
在找到表中部门id=200
select name from emp where dep_id=查询结果;
子查询:
select name from emp where dep_id=(select id from department where name='技术');
示例二:查看不足1人的部门名 (子查询得到的是有人的部门id)
查emp表中有哪些部门id
select dep_id from emp group by dep_id;
在看department表中
select * from department where id not in(查询结果);
子查询:
select * from department where id not in (select dep_id from emp group by dep_id);
四、索引
索引的定义:
就是建立起的一个在存储表阶段就有的一个存储结构,能在查询的时候加速
索引的重要性:
读写比例 :10:1
读(查询)的速度就至关重要了
索引的原理:block 磁盘预读原理
读硬盘的io操作的时间非常的长,比CPU执行指令的时间长很多
尽量的减少IO次数才是读写数据的主要要解决的问题
数据库的存储方式 :
新的数据结构 —— 树
平衡树 balance tree - b树
在b树的基础上进行了改良 - b+树
分支节点和根节点都不再存储实际的数据了,让分支和根节点能存储更多的索引的信息,就降低了树的高度,所有的实际数据都存储在叶子节点中
在叶子节点之间加入了双向的链式结构,方便在查询中的范围条件
mysql当中所有的b+树索引的高度都基本控制在3层
io操作的次数非常稳定
有利于通过范围查询
什么会影响索引的效率 —— 树的高度
对哪一列创建索引,选择尽量短的列做索引
对区分度高的列建索引,重复率超过了10%那么不适合创建索引
聚集索引和辅助索引 :
在innodb中,聚集索引和辅助索引并存的,在myisam中,只有辅助索引,没有聚集索引
聚集索引 - 主键
查询速度更快
数据直接存储在树结构的叶子节点
辅助索引 - 除了主键之外所有的索引都是辅助索引
查询速度稍慢
数据不直接存储在树中
索引的种类 :
primary key 主键:聚集索引,约束的作用:非空 + 唯一,联合主键
unique 自带索引:辅助索引,约束的作用:唯一,联合唯一
index:辅助索引,没有约束作用,联合索引
创建索引:
create index 索引名字 on 表(字段)
删除索引:
drop index 索引名 on 表名字;
索引是如何发挥作用的?
select * from 表 where id = xxxxx
在id字段没有索引的时候,效率低
在id字段有索引的之后,效率高
查询的字段不是索引字段,效率也低
联合索引 :
创建联合索引:create index ind_mix on s1(id,name,email);
在联合索引中如果使用了or条件索引就不能生效
最左前缀原则 :在联合索引中,条件必须含有在创建索引的时候的第一个索引列
select * from s1 where id =1000000; 能命中索引
select * from s1 where email = 'eva1000000@oldboy'; 不能命中索引
在整个条件中,从开始出现模糊匹配的那一刻,索引就失效了
select * from s1 where id >1000000 and email = 'eva1000001@oldboy'; 能命中索引
select * from s1 where id =1000000 and email like 'eva%'; 不能命中索引
什么时候用联合索引?
只对a或与a有关的,如abc等条件进行索引,而不会对b或c进行单列的索引时,使用联合索引
单列索引 :
选择一个区分度高的列建立索引,条件中的列不要参与计算,条件的范围尽量小,使用and作为条件的连接符
使用or来连接多个条件时,在满足上述条件的基础上,对or相关的所有列分别创建索引
覆盖索引:
如果我们使用索引作为条件查询,查询完毕之后,不需要回表查,这就是覆盖索引
合并索引:
对两个字段分别创建索引,由于sql的条件让两个索引同时生效了,那么这两个索引就成为了合并索引
执行计划 explain :
如果你想在执行sql之前就知道sql语句的执行情况,那么可以使用执行计划
情况1:假设30000000条数据,sql:20s
使用explain + sql语句 --> 并不会真正的执行sql,而是会给你列出一个执行计划
情况2:数据不足时,使用explain + sql语句 --> 并不会真正的执行sql,而是会给你列出一个执行计划
建表、使用sql语句的时候注意:
char代替varchar
连表代替子查询
创建表的时候,固定长度的字段放在前面
索引不生效的原因
1, 要查询的数据的范围大,索引不生效
比较运算符:> < >= <= !=
between and
select * from 表 limit 1000000,5
select * from 表 where id between 1000000 and 1000005;
like,结果的范围大,索引不生效
如果 abc% 索引生效,%abc索引就不生效
2, 如果索引列内容的区分度不高,索引不生效
3, 索引列在条件中参与计算,索引不生效
select * from s1 where id*10 = 1000000;
4, 对两列内容进行条件查询
and
and条件两端的内容,优先选择一个有索引的,并且树形结构更好的,来进行查询
两个条件都成立才能完成where条件,先完成范围小的缩小后面条件的压力
select * from s1 where id =1000000 and email = 'eva1000000@oldboy';
or
or条件的,不会进行优化,只是根据条件从左到右依次筛选
条件中带有or的要想命中索引,这些条件中所有的列都是索引列
select * from s1 where id =1000000 or email = 'eva1000000@oldboy';
5, 不满足联合索引的最左前缀原则,索引不生效
最左前缀原则 :在联合索引中,条件必须含有在创建索引的时候的第一个索引列