在关系数据库中,最常用的操作就是查询。
基本查询
要查询数据库表的数据,我们使用如下的SQL语句:
SELECT * FROM <表名>
SELECT查询的结果是一个二维表。
条件查询
使用SELECT * FROM <表名>
可以查询到一张表的所有记录。但是很多时候并不希望获得所有记录,而是根据条件选择性地获取指定条件的记录。
SELECT语句可以通过WHERE
条件来设定查询条件,查询结果是满足查询条件的记录。
例如查询学生表中成绩大于90的学生记录:
SELECT * FROM students WHERE score>=90;
使用AND
表示并列条件:
SELECT FROM * students WHERE score>=90 AND gender='F';
使用OR
表示逻辑或:
SELECT FROM * students WHERE score >=90 OR gender ='F';
组合条件使用小括号()
包裹:
SELECT FROM * students WHERE (score>=60 AND score<=90) OR gender='F';
使用LIKE
表示相似,其中%
符号表示任意字符:
SELECT FROM * WHERE name LIKE '小%';
条件运算优先级次序为:NOT
> AND > OR
。
投影查询
使用SELECT * FROM <表名> WHERE <条件>
可以选出表中的若干条记录。我们注意到返回的二维表结构和原表是相同的,即结果集的所有列与原表的所有列都一一对应。
如果我们只希望返回某些列的数据,而不是所有列的数据,我们可以用SELECT 列1, 列2, 列3 FROM ...
,让结果集仅包含指定列。这种操作称为投影查询。
使用SELECT 列1, 列2, 列3 FROM ...
时,还可以给每一列起个别名,这样,结果集的列名就可以与原表的列名不同。它的语法是SELECT 列1 别名1, 列2 别名2 FROM ...
。
SELECT id pk,name nickname FROM students WHERE score>90;
排序
我们使用SELECT
查询时,查询结果集通常是按照id
排序的,也就是根据主键排序。如果我们要根据其他条件排序怎么办?可以加上ORDER BY
子句。
SELECT id,name,gender score FROM studentd ORDER BY score;
如果要反过来,按照成绩从高到底排序,我们可以加上DESC
表示“倒序”:
SELECT id,name,gender score FROM studentd ORDER BY score DESC;
如果score
列有相同的数据,要进一步排序,可以继续添加列名。例如,使用ORDER BY score DESC, gender
表示先按score
列倒序,如果有相同分数的,再按gender
列排序:
SELECT id, name, gender, score FROM students ORDER BY score DESC, gender;
默认的排序规则是ASC
:“升序”,即从小到大。ASC
可以省略。
如果有WHERE
子句,那么ORDER BY
子句要放到WHERE
子句后面。
SELECT id, name, gender, score FROM students WHERE class_id=1 ORDER BY score DESC;
分页查询
使用SELECT
查询时,如果结果集数据量很大,放在一个页面显示的话数据量太大,不如分页显示。
这个查询可以通过LIMIT <M> OFFSET <N>
子句实现:
SELECT id, name, gender, score FROM students ORDER BY score DESC
LIMIT 3 OFFSET 0;
上述查询LIMIT 3 OFFSET 0
表示,对结果集从0号记录开始,最多取3条。
如果要查询第2页,那么我们只需要“跳过”头3条记录,也就是对结果集从3号记录开始查询,把OFFSET
设定为3:
SELECT id, name, gender, score FROM students ORDER BY score DESC
LIMIT 3 OFFSET 3;
在MySQL
中,LIMIT 15 OFFSET 30
还可以简写成LIMIT 30, 15
。
使用LIMIT <M> OFFSET <N>
分页时,随着N
越来越大,查询效率也会越来越低。
聚合查询
如果我们要统计一张表的数据量,例如,想查询students
表一共有多少条记录,难道必须用SELECT * FROM students
查出来然后再数一数有多少行吗?
这个方法当然可以,但是比较弱智。对于统计总数、平均数这类计算,SQL提供了专门的聚合函数,使用聚合函数进行查询,就是聚合查询,它可以快速获得结果。
仍然以查询students
表一共有多少条记录为例,我们可以使用SQL内置的COUNT()
函数查询:
SELECT COUNT(*) boys FROM students WHERE gender='M';
除了COUNT()
函数外,SQL还提供了如下聚合函数:
函数 | 说明 |
---|---|
SUM | 计算某一列的合计值,该列必须为数值类型 |
AVG | 计算某一列的平均值,该列必须为数值类型 |
MAX | 计算某一列的最大值 |
MIN | 计算某一列的最小值 |
要特别注意:如果聚合查询的WHERE
条件没有匹配到任何行,COUNT()
会返回0,而SUM()
、AVG()
、MAX()
和MIN()
会返回NULL
分组
SQL提供了“分组聚合”的功能来实现对多个组别的聚合:
SELECT class_id,COUNT(*) num FROM students GROUP BY class_id;
也可以使用多个列进行分组。例如,我们想统计各班的男生和女生人数:
SELECT class_id, gender, COUNT(*) num FROM students GROUP BY class_id, gender;
跨表查询
SELECT查询不但可以从一张表查询数据,还可以从多张表同时查询数据。查询多张表的语法是:SELECT * FROM <表1> <表2>
。
SELECT * FROM students, classes;
这种一次查询两个表的数据,查询的结果也是一个二维表,它是students
表和classes
表的“乘积”,即students
表的每一行与classes
表的每一行都两两拼在一起返回。结果集的列数是students
表和classes
表的列数之和,行数是students
表和classes
表的行数之积。
这种多表查询又称笛卡尔查询,使用笛卡尔查询时要非常小心,由于结果集是目标表的行数乘积,对两个各自有100行记录的表进行笛卡尔查询将返回1万条记录,对两个各自有1万行记录的表进行笛卡尔查询将返回1亿条记录。
上述查询的结果集有两列id
和两列name
,两列id
是因为其中一列是students
表的id
,而另一列是classes
表的id
,但是在结果集中,不好区分。要解决这个问题,我们仍然可以利用投影查询的“设置列的别名”来给两个表各自的id
和name
列起别名:
SELECT
students.id sid,
students.name,
students.gender,
students.score,
classes.id cid,
classes.name cname
FROM students, classes;
用表名.列名
这种方式列举两个表的所有列实在是很麻烦,所以SQL还允许给表设置一个别名,让我们在投影查询中引用起来稍微简洁一点:
SELECT
s.id sid,
s.name,
s.gender,
s.score,
c.id cid,
c.name cname
FROM students s, classes c;
连接查询
连接查询是另一种类型的多表查询。连接查询对多个表进行JOIN运算,简单地说,就是先确定一个主表作为结果集,然后,把其他表的行有选择性地“连接”在主表结果集上。
最常用的一种是内连接INNER JOIN,其原理示意图如下:
SELECT s.id, s.name, s.class_id, c.name class_name, s.gender, s.score
FROM students s
INNER JOIN classes c
ON s.class_id = c.id;
其次有外连接,包括:左连接、右连接和全连接
LEFT/RIGHT/FULL OUTER JOIN