Mysql学习笔记四：查询

在关系数据库中，最常用的操作就是查询。

基本查询

要查询数据库表的数据，我们使用如下的SQL语句：

SELECT * FROM <表名>

SELECT查询的结果是一个二维表。

条件查询

使用SELECT * FROM <表名>可以查询到一张表的所有记录。但是很多时候并不希望获得所有记录，而是根据条件选择性地获取指定条件的记录。

SELECT语句可以通过WHERE条件来设定查询条件，查询结果是满足查询条件的记录。

例如查询学生表中成绩大于90的学生记录：

SELECT * FROM students WHERE score>=90;

使用AND表示并列条件：

SELECT FROM * students WHERE score>=90 AND gender='F';

使用OR 表示逻辑或：

SELECT FROM * students WHERE score >=90 OR gender ='F';

组合条件使用小括号()包裹：

SELECT FROM * students WHERE (score>=60 AND score<=90) OR gender='F';

使用LIKE 表示相似，其中%符号表示任意字符：

SELECT FROM * WHERE name LIKE '小%';

条件运算优先级次序为：NOT > AND > OR。

投影查询

使用SELECT * FROM <表名> WHERE <条件>可以选出表中的若干条记录。我们注意到返回的二维表结构和原表是相同的，即结果集的所有列与原表的所有列都一一对应。

如果我们只希望返回某些列的数据，而不是所有列的数据，我们可以用SELECT 列1, 列2, 列3 FROM ...，让结果集仅包含指定列。这种操作称为投影查询。

使用SELECT 列1, 列2, 列3 FROM ...时，还可以给每一列起个别名，这样，结果集的列名就可以与原表的列名不同。它的语法是SELECT 列1 别名1, 列2 别名2 FROM ...。

SELECT id pk,name nickname FROM students WHERE score>90;

排序

我们使用SELECT查询时，查询结果集通常是按照id排序的，也就是根据主键排序。如果我们要根据其他条件排序怎么办？可以加上ORDER BY子句。

SELECT id,name,gender score FROM studentd ORDER BY score;

如果要反过来，按照成绩从高到底排序，我们可以加上DESC表示“倒序”：

SELECT id,name,gender score FROM studentd ORDER BY score DESC;

如果score列有相同的数据，要进一步排序，可以继续添加列名。例如，使用ORDER BY score DESC, gender表示先按score列倒序，如果有相同分数的，再按gender列排序：

SELECT id, name, gender, score FROM students ORDER BY score DESC, gender;

默认的排序规则是ASC：“升序”，即从小到大。ASC可以省略。

如果有WHERE子句，那么ORDER BY子句要放到WHERE子句后面。

SELECT id, name, gender, score FROM students WHERE class_id=1 ORDER BY score DESC;

分页查询

使用SELECT查询时，如果结果集数据量很大，放在一个页面显示的话数据量太大，不如分页显示。

这个查询可以通过LIMIT <M> OFFSET <N>子句实现:

SELECT id, name, gender, score FROM students ORDER BY score DESC
LIMIT 3 OFFSET 0;

上述查询LIMIT 3 OFFSET 0表示，对结果集从0号记录开始，最多取3条。

如果要查询第2页，那么我们只需要“跳过”头3条记录，也就是对结果集从3号记录开始查询，把OFFSET设定为3：

SELECT id, name, gender, score FROM students ORDER BY score DESC
LIMIT 3 OFFSET 3;

在MySQL中，LIMIT 15 OFFSET 30还可以简写成LIMIT 30, 15。

使用LIMIT <M> OFFSET <N>分页时，随着N越来越大，查询效率也会越来越低。

聚合查询

如果我们要统计一张表的数据量，例如，想查询students表一共有多少条记录，难道必须用SELECT * FROM students查出来然后再数一数有多少行吗？

这个方法当然可以，但是比较弱智。对于统计总数、平均数这类计算，SQL提供了专门的聚合函数，使用聚合函数进行查询，就是聚合查询，它可以快速获得结果。

仍然以查询students表一共有多少条记录为例，我们可以使用SQL内置的COUNT()函数查询：

SELECT COUNT(*) boys FROM students WHERE gender='M';

除了COUNT()函数外，SQL还提供了如下聚合函数：

函数	说明
SUM	计算某一列的合计值，该列必须为数值类型
AVG	计算某一列的平均值，该列必须为数值类型
MAX	计算某一列的最大值
MIN	计算某一列的最小值

要特别注意：如果聚合查询的WHERE条件没有匹配到任何行，COUNT()会返回0，而SUM()、AVG()、MAX()和MIN()会返回NULL

分组

SQL提供了“分组聚合”的功能来实现对多个组别的聚合：

SELECT class_id,COUNT(*) num FROM students GROUP BY class_id;

也可以使用多个列进行分组。例如，我们想统计各班的男生和女生人数：

SELECT class_id, gender, COUNT(*) num FROM students GROUP BY class_id, gender;

跨表查询

SELECT查询不但可以从一张表查询数据，还可以从多张表同时查询数据。查询多张表的语法是：SELECT * FROM <表1> <表2>。

SELECT * FROM students, classes;

这种一次查询两个表的数据，查询的结果也是一个二维表，它是students表和classes表的“乘积”，即students表的每一行与classes表的每一行都两两拼在一起返回。结果集的列数是students表和classes表的列数之和，行数是students表和classes表的行数之积。

这种多表查询又称笛卡尔查询，使用笛卡尔查询时要非常小心，由于结果集是目标表的行数乘积，对两个各自有100行记录的表进行笛卡尔查询将返回1万条记录，对两个各自有1万行记录的表进行笛卡尔查询将返回1亿条记录。

上述查询的结果集有两列id和两列name，两列id是因为其中一列是students表的id，而另一列是classes表的id，但是在结果集中，不好区分。要解决这个问题，我们仍然可以利用投影查询的“设置列的别名”来给两个表各自的id和name列起别名：

SELECT
    students.id sid,
    students.name,
    students.gender,
    students.score,
    classes.id cid,
    classes.name cname
FROM students, classes;

用表名.列名这种方式列举两个表的所有列实在是很麻烦，所以SQL还允许给表设置一个别名，让我们在投影查询中引用起来稍微简洁一点：

SELECT
    s.id sid,
    s.name,
    s.gender,
    s.score,
    c.id cid,
    c.name cname
FROM students s, classes c;

连接查询

连接查询是另一种类型的多表查询。连接查询对多个表进行JOIN运算，简单地说，就是先确定一个主表作为结果集，然后，把其他表的行有选择性地“连接”在主表结果集上。

最常用的一种是内连接INNER JOIN，其原理示意图如下：

SELECT s.id, s.name, s.class_id, c.name class_name, s.gender, s.score
FROM students s
INNER JOIN classes c
ON s.class_id = c.id;

其次有外连接，包括：左连接、右连接和全连接

LEFT/RIGHT/FULL OUTER JOIN

相关阅读:
Python 爬虫 —— BeautifulSoup
sklearn、theano、TensorFlow 以及 theras 的理解
 sklearn、theano、TensorFlow 以及 theras 的理解
 keras 的使用
 keras 的使用
 古人的字、号、别称
 古人的字、号、别称
 hdu1226 超级密码 (BFS,里面用了大数取余原理)
2013渣打科营编程马拉松赛样题
 对象序列化实现深度克隆
原文地址：https://www.cnblogs.com/yczha/p/13160179.html