mysql数据库多表查询及函数运算符（二）

mysql数据库多表查询及函数运算符（二）
一、单表查询的语法
```
SELECT 字段1,字段2... FROM 表名
                  WHERE 条件
                  GROUP BY field
                  HAVING 筛选
                  ORDER BY field
                  LIMIT 限制条数
```
二、关键字的执行优先级(重点)
```
重点中的重点：关键字的执行优先级
from
where
group by
having
select
distinct
order by
limit
```
1.找到表:from

2.拿着where指定的约束条件，去文件/表中取出一条条记录

3.将取出的一条条记录进行分组group by，如果没有group by，则整体作为一组

4.将分组的结果进行having过滤

5.执行select

6.去重

7.将结果按条件排序：order by

8.限制结果的显示条数

查询

给表起别名，用在SQL语句同时查询多张表，又不想写太多表名的情况下
```
select s.name, s.gender from students2 as s;
```
去重
```
select distinct gender from students2; # 只显示有多少种性别，而不是多少个性别
```
三、条件查询

比较运算> < = >= <= !=
```
 select * from students2 where age = 18; # 一个等号=就行
```
and
```
select name from students2 where age > 18 and gender="女";
```
条件：不在 18岁以上的女性这个范围内的信息
```
select * from students2 where not (age > 18 and gender="女");
```
易错
```
select * from students2 where not age > 18 and gender="女";
```
模糊查询like

　　% 替换一个或者多个

　　_ 替换一个

查询姓名中以“小”开始的名字
```
select name from students2 where name like "小%";
```
查询姓名中有“小”所有的名字
```
select name from students2 where name like "%小%";
```
查询有两个字的名字
```
select * from students2 where name like "__";
```
查询至少有两个字的名字
```
select * from students2 where name like "__%";
```
rlike 正则

查询以小开始的姓名
```
select name from students2 where name rlike "^小.*";
```
范围查询

in(1, 3, 8)表示在一个非连续的范围内

查询年龄为12， 18， 21的信息
```
select * from students2 where age in (12, 18, 21);
```
查询年龄不为12， 18， 21的信息
```
select * from students2 where age not in (12, 18, 21);
```
between ... and ... 表示在一个连续的范围内

查询年龄在12到18之间的信息
```
select * from students2 where age between 12 and 18;
```
查询年龄不在12到18之间的信息
```
select * from students2 where age not between 12 and 18;
```
不能加括号：
```
select * from students2 where age not (between 12 and 18);
```
空判断

判空 is null

判非空 is not null

排序

order by 字段

asc从小到大排列升序

desc从大到小排列降序

升序
```
select * from students2 where (age between 12 and 18) and gender=2 order by age;
```
省略asc，即原本是：
```
select * from students2 where (age between 12 and 18) and gender=2 order by age asc;
```
降序
```
select * from students2 where (age between 12 and 18) and gender=2 order by age desc;
```
order by 多个字段

按年龄降序排，然后再按id降序排
```
select * from students2 where age between 12 and 18 order by age desc, id desc;
```
四、聚合分组

聚合函数

count 总数
```
select count(*) from students2 where gender=2;
```
```
select count(*) as 女性人数 from students2 where gender=2;
```
max 最大值
```
select max(age) from students2;
```
min 最小值

sum 求和
```
select sum(age) from students2;
```
avg 平均值
```
select avg(age) from students2 where gender=2;
```
select 后面可以跟表达式
```
 select sum(age)/count(age) from students2 where gender=2;
```
round(123.23, 1) 四舍五入保留一位小数
```
select round(sum(age)/count(age), 1) from students2 where gender=2;
```
分组 group by和聚合函数一起使用

错误：
```
select * from students2  group by gender;
```
筛选的条件是每个分组唯一的标识
```
select gender from students2  group by gender;
```
计算每个分组里面的人数
```
select gender, count(*) from students2 group by gender;
```
count(*)是对分组结果的计算

显示每个分组里面人的名字
```
select gender, group_concat(name) from students2 group by gender;
```
计算女性的人数
```
select gender, count(gender) from students2 where gender=2 group by gender;
```
```
select gender, group_concat(name,"_",age," ",id) from students2 where gender=2 group by gender; # 用下划线和空格分开，否则会连在一起
```
强调
```
如果我们用unique的字段作为分组的依据，则每一条记录自成一组，这种分组没有意义
多条记录之间的某个字段值相同，该字段通常用来作为分组的依据
```
having 筛选分组

查询平均年龄超过18岁的性别，以及姓名
```
select gender, group_concat(name) from students2 group by gender having avg(age) > 18;
```
where 和 having的区别：1、where在group by前面，having在后面。2、where是对表进行条件判断，而having是对查询结果进行条件判断。

分页 limit

限制查询出来的个数
```
select * from students2 where gender=2 limit 2;
```
limit start, count
```
 select * from students2 limit 2, 5;
```
limit (第N页-1)+每页的个数, 每页的个数

错误：

不能填入表达式
```
select * from students2 limit (3-1)*2, 2;
```
limit要放在最后面

错误
```
select * from students limit 4, 2 order by age asc;
```
正确
```
select * from students2 order by age asc limit 4, 2;
```
连接查询

内连接，取交集

select .... from 表名 inner join 表名;
```
select * from students2 inner join classes;
```
但是上面那样只是把students2里每一条数据和classes里的全部数据做连接，没有加条件限制

用on进行条件限制
```
select * from students2 inner join classes on students2.cls_id = classes.id;
```
只显示某些字段
```
 select students2.*, classes.name from students2 inner join classes on students2.cls_id = classes.id;
```
给表起别名
```
select s.name, c.name from students2 as s inner join classes as c on s.cls_id = c.id;
```
五、多表连接

外连接并集

左连接，查询结果为两个表匹配到的数据，左表特有的数据，对于右表中不存在的数据用null填充
```
select * from students2 as s left join classes as c on s.cls_id = c.id;
```
right join一般用的少，只要把表互换，left join也可以达到同样效果

查询没有对应班级信息的学生
```
select * from students2 as s left join classes as c on s.cls_id = c.id having c.id is null;
```
自关联

例如把全国各省市县地区导入到同一张表中，查询山东省的所有市
```
select province.city from ares as province inner join ares as city on city.pid = province.aid having province.atitle = "山东省";
```
子查询

一个select里面嵌套另一个select

查询身高最高的女生的所有信息
```
 select * from students2 where high = (select max(high) from students2 where gender=2);
```
用这个办法解决刚刚查询省份的问题
```
select * from areas where pid = (select aid from areas where atitle = "河北省");
```
带EXISTS关键字的子查询

EXISTS关字键字表示存在。在使用EXISTS关键字时，内层查询语句不返回查询的记录。
而是返回一个真假值。True或False
当返回True时，外层查询语句将进行查询；当返回值为False时，外层查询语句不进行查询
```
#department表中存在dept_id=203，Ture
mysql> select * from employee
    ->     where exists
    ->         (select id from department where id=200);
+----+------------+--------+------+--------+
| id | name       | sex    | age  | dep_id |
+----+------------+--------+------+--------+
|  1 | egon       | male   |   18 |    200 |
|  2 | alex       | female |   48 |    201 |
|  3 | wupeiqi    | male   |   38 |    201 |
|  4 | yuanhao    | female |   28 |    202 |
|  5 | liwenzhou  | male   |   18 |    200 |
|  6 | jingliyang | female |   18 |    204 |
+----+------------+--------+------+--------+

#department表中存在dept_id=205，False
mysql> select * from employee
    ->     where exists
    ->         (select id from department where id=204);
Empty set (0.00 sec)
```
六、数据库设计

设计关系数据库时，遵从不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式，各种范式呈递次规范，越高的范式数据库冗余越小。

目前关系数据库有六种范式：第一范式（1NF）、第二范式（2NF）、第三范式（3NF）、巴斯-科德范式（BCNF）、第四范式(4NF）和第五范式（5NF，又称完美范式）。满足最低要求的范式是第一范式（1NF）。在第一范式的基础上进一步满足更多规范要求的称为第二范式（2NF），其余范式以次类推。一般说来，数据库只需满足第三范式(3NF）就行了。

范式的包含关系。一个数据库设计如果符合第二范式，一定也符合第一范式。如果符合第三范式，一定也符合第二范式…

第一范式（1NF）：属性不可分

（****1NF是对属性的原子性约束，要求属性具有原子性，不可再分解）

name tel age

手机座机

Josh 13612345678 021－9876543 22

Wang 13988776655 010－1234567 21

很明显，tel这个属性还可以进行分解，分解成手机和座机这两个属性，不满足第一范式的数据库，不是关系数据库！所以，我们在任何关系数据库管理系统中，做不出这样的“表”来。

第二范式（2NF）：符合1NF，并且非主属性完全依赖于码。

（2NF通俗说是要有主键（主键可以有多个字段），其他部分依赖完全于主键，不能是一部分）

如果这都不能理解，只能看看如下科学的解释了：

一个候选码中的主属性也可能是好几个。如果一个主属性，它不能单独做为一个候选码，那么它也不能确定任何一个非主属性。给一个反例：我们考虑一个小学的教务管理系统，学生上课指定一个老师，一本教材，一个教室，一个时间，大家都上课去吧，没有问题。那么数据库怎么设计？（学生上课表）

学生课程老师老师职称教材教室上课时间

小明一年级语文（上）大宝副教授《小学语文1》 101 14：30

一个学生上一门课，一定在特定某个教室。所以有（学生，课程）－>教室

一个学生上一门课，一定是特定某个老师教。所以有（学生，课程）－>老师

一个学生上一门课，他老师的职称可以确定。所以有（学生，课程）－>老师职称

一个学生上一门课，一定是特定某个教材。所以有（学生，课程）－>教材

一个学生上一门课，一定在特定时间。所以有（学生，课程）－>上课时间

因此（学生，课程）是一个码。

然而，一个课程，一定指定了某个教材，一年级语文肯定用的是《小学语文1》，那么就有课程－>教材。（学生，课程）是个码，课程却决定了教材，这就叫做不完全依赖，或者说部分依赖。出现这样的情况，就不满足第二范式！有什么不好吗？你可以想想：

1、校长要新增加一门课程叫“微积分”，教材是《大学数学》，怎么办？学生还没选课，而学生又是主属性，主属性不能空，课程怎么记录呢，教材记到哪呢? ……郁闷了吧?(插入异常)

2、下学期没学生学一年级语文（上）了，学一年级语文（下）去了，那么表中将不存在一年级语文（上），也就没了《小学语文1》。这时候，校长问：一年级语文（上）用的什么教材啊？……郁闷了吧?(删除异常)

3、校长说：一年级语文（上）换教材，换成《大学语文》。有10000个学生选了这么课，改动好大啊！改累死了……郁闷了吧？（修改异常）

那应该怎么解决呢？投影分解，将一个表分解成两个或若干个表

学生课程老师老师职称教室上课时间

小明一年级语文（上）大宝副教授 101 14：30

学生上课表

课程教材

一年级语文（上）《小学语文1》

第三范式（3NF）：符合2NF，****并且，消除传递依赖。

（3NF是对字段冗余性的约束，即任何字段不能由其他字段派生出来，它要求字段没有冗余）

正如前面所说：没有数据冗余的数据库并不一定是最好的数据库，所以有没有冗余的设计，要综合来考虑。

上面的“学生上课表”符合2NF，可以这样验证：两个主属性单独使用，不用确定其它四个非主属性的任何一个。但是它有传递依赖！在“老师”和“老师职称”这里，一个老师一定能确定一个老师职称。

如果不消除这种传递依赖，有可能会出现：

1、老师升级了，变教授了，要改数据库，表中有N条，改了N次……（修改异常）

2、没人选这个老师的课了，老师的职称也没了记录……（删除异常）

3、新来一个老师，还没分配教什么课，他的职称记到哪？……（插入异常）

那应该怎么解决呢？和上面一样，投影分解：

学生课程老师教室上课时间

小明一年级语文（上）大宝 101 14：30

老师老师职称

大宝副教授

BCNF：符合3NF，****并且，主属性不依赖于主属性。

若关系模式属于第二范式，且每个属性都不传递依赖于键码，则R属于BC范式。

通常

BC范式的条件有多种等价的表述：每个非平凡依赖的左边必须包含键码；每个决定因素必须包含键码。

BC范式既检查非主属性，又检查主属性。当只检查非主属性时，就成了第三范式。满足BC范式的关系都必然满足第三范式。

还可以这么说：若一个关系达到了第三范式，并且它只有一个候选码，或者它的每个候选码都是单属性，则该关系自然达到BC范式。

一般，一个数据库设计符合3NF或BCNF就可以了。

第四范式：****要求把同一表内的多对多关系删除。

第五范式：从最终结构重新建立原始结构。
相关阅读:
表单元素的required,autocomplete,list用法
 通用triggerEvent方法
 通用addEventListener方法
 关于动态加载js
Node路由简单的处理
 As3截图转换为ByteArray传送给后台node的一种方法
 JS中的“==”符号及布尔值转换规则
 解释JS变量作用域的范例
 .NET异步委托
 正则表达式入门
原文地址：https://www.cnblogs.com/yly123/p/11321307.html

mysql数据库多表查询及函数运算符（二）

一、单表查询的语法

二、关键字的执行优先级(重点)

查询

去重

三、条件查询

比较运算> < = >= <= !=

模糊查询like

rlike 正则

范围查询

空判断

排序

order by 多个字段

四、聚合分组

聚合函数

分组 group by和聚合函数一起使用

having 筛选分组

五、多表连接

外连接 并集

自关联

子查询

带EXISTS关键字的子查询

六、数据库设计

外连接并集