• 转,异常好的sql 基础知识整理


    转载自:http://blog.csdn.net/u011001084/article/details/51318434

    最近从图书馆借了本介绍SQL的书,打算复习一下基本语法,记录一下笔记,整理一下思路,以备日后复习之用。

    PS:本文适用SQL Server2008语法。

    一、关系型数据库和SQL

    实际上准确的讲,SQL是一门语言,而不是一个数据库。

    什么是SQL呢?简而言之,SQL就是维护和使用关系型数据库中的的数据的一种标准的计算机语言。

    1.1 SQL语言主要有3个主要的组成部分。

    1. DML(Data Manipulation Language)数据操纵语言。这个模块可以让我们检索、修改、增加、删除数据库中的数据。
    2. DDL(Data Definition Language)数据定义语言。是的我们能够创建和修改数据库本身。如:DDL提供ALTER语句,他让我们可以修改数据库中表的设计。
    3. DCL(Data Control Language)数据控制语言,用于维护数据库的安全。

    在SQL术语中,记录(record)和字段(field)实际上就称为行(row)和列(column)。

    1.2 主键和外键

    主键之所以有必要:

    • 首先使你唯一标识表中单独的一行。主键确保了唯一性。
    • 可以很容易的将一个表和另一个表关联。
    • 主键一般就会自动默认创建索引,提高了查询速度。

    外键就是说A表中的某个字段,同时是B中的主键,那么这个字段就是A表中的外键。希望A表中的这个外键的值必须是B中已经存在的值。

    1.3 数据类型

    一般来讲,有3中重要的数据类型:

    1. 数字(Numeric)
    2. 字符(Character)
    3. 以及日期/时间(Date/Time)

    bit是数字型,它只允许两个值,0和1。

    字符类型区别^1

    类型长度说明
    char 固定长度
    nchar 固定长度 处理unicode数据类型(所有的字符使用两个字节表示)
    varchar 可变长度 效率没char高 灵活
    nvarchar 可变长度 处理unicode数据类型(所有的字符使用两个字节表示)
    • 1字节=8位
    • bit就是位,也叫比特位,是计算机表示数据最小的单位。
    • byte就是字节,1byte=8bit,1byte就是1B;
    • 一个字符=2字节;

    1.3 空值

    空值不等于空格或空白。使用NULL表示空值。

    二、简单增删改查

    2.1 查(列名有空格的情况)

    1
    2
    SELECT [ last name]
    FROM Customers

    用方括号将有空格的列名括起来。
    PS: MySQL中用重音符`(~)按键。Oracle用双引号。

    查询顺序,SQL执行顺序^2

    1
    2
    3
    4
    5
    6
    Select -1>选择列,-2>distinct,-3>top
    1>…From 表
    2>…Where 条件
    3>…Group by 列
    4>…Having 筛选条件
    6>…Order by 列

    2.2 增

    1
    2
    3
    4
    5
    6
    INSERT INTO tablename
    (columnlist)
    VALUES
    (RowValues1)
    (RowValues2)
    (repeat any number of times)

    2.3 改

    1
    2
    3
    UPDATE  table
    SET column1=expression1,column2=expression2(repeat any number of times)
    WHERE condition

    2.4 删

    1
    2
    3
    DELETE
    FROM table
    WHERE condition

    删除前可以验证一下:

    1
    2
    3
    4
    SELECT 
    COUNT(*)
    FROM table
    WHERE condition

     

    如果想要删除所有的行,可以:

    1
    DELETE FROM table

     

    或者

    1
    TRUNCATE TABLE table

     

    TRUNCATE TABLE优势在于速度更快,但是不提供记录事务的结果。
    另外一个不同点是,TRUNCATE TABLE重新设置了用于自增型的列的当前值,DELETE不会。

    三、别名

    关键字:AS

    3.1 计算字段

    使用计算字段可以做如下的事情:

    • 选择特定的单词或者数值
    • 对单个或者多个列进行计算
    • 把列和直接量组合在一起。

    3.2 直接量

    这个直接量和表中的数据没有任何关系,就是为了说明所用,下面这种类型的表达式就叫做直接量(literal value)。

    1
    2
    SELECT '直接量' AS `类型`,firstname,lastname 
    FROM `customers` ;


    如图,结果中直接量就在一列中了。

    3.3 算数运算

    例子1:

    1
    2
    SELECT  num*price AS total
    FROM orders

     

    例子2:

    1
    2
    SELECT  firstname+' '+lastname AS 'fullname'
    FROM users

     

    在MySql中连接要是用CONCAT函数:

    1
    2
    3
    SELECT OrderID,FirstName,LastName,
    CONCAT(FirstName,' ',LastName) AS 'fullname'
    FROM orders

     

    3.4 别名

    1)列的别名

    1
    2
    SELECT firstname AS fn
    FROM customers

     

    2) 表的别名

    1
    2
    SELECT firstname 
    FROM customers AS cu

     

    说明:

    1. 列的别名是为了显示用的,别名会作为查询结果的表头,不能在WHERE中使用列的别名,会出错!!!
    2. 表的别名确实是为了方便操作用的,可以在WHERE中使用列的别名进行!

    四、使用函数

    函数要有一组圆括号跟在关键字后边,圆括号告诉我们,这是一个函数!

    4.1 字符函数

    LEFT&RIGHT

    LEFT(CharacterValue,NumberOfCharacters)
    含义:选择CharacterValue字段的左边NumberOfCharacters几个字符。
    ps:RIGHT是右边几个字符。

    LTRIM&RTRIM

    LTRIM(CharacterValue)
    可以删除左边开始的空格。RTRIM作用类似。

    SUBSTRING

    SUBSTRING(CharacterValue,StartPositon,NumberOfCharacters)
    含义:选择从开始位置(包括),N个长度的字符。

    1
    2
    SELECT 
    SUBSTRING('thewhitegoat',4,5) AS 'The Answer'

     

    返回:white

    4.2 日期/时间函数

    GETDATE

    1
    SELECT GETDATE()

    返回当前日期和时间。
    PS:在MySql中,等价函数是NOW,在Oracle中是CURRENT_DATE

    DATEPART

    能够分析具体的日期,并且返回诸如该日期是该月中的第几天,或者该年份中的第几周等信息。

    1
    DATEPART(datepart,DateValue)

     

    datepart可以是许多不同的值,如下都是有效值:

    • year
    • quarter
    • month
    • dayofyear
    • day
    • week
    • weekday
    • hour
    • minute
    • second

    DATEDIFF

    可以让我们得到任意两个日期之间相差的天数(或周数、月数等)。

    1
    DATEDIFF(datepart1,startdate1,startdate2)

     

    DATEDIFF Function ExpressionResulting Value
    DATEDIFF(day,’7/8/2009’,’8/14/2009’) 37
    DATEDIFF(week,’7/8/2009’,’8/14/2009’) 5
    DATEDIFF(month,’7/8/2009’,’8/14/2009’) 1
    DATEDIFF(year,’7/8/2009’,’8/14/2009’) 0

    PS:MySql中,DATEDIFF函数只允许我们计算两个日期之间的天数,如果想要得到一个正数,结束的日期通常要作为第一个参数:

    1
    DATEDIFF(enddate,startdate)

     

    Oracle中没有等价函数

    4.3 数值函数

    ROUND

    允许我们四舍五入。

    1
    ROUND(numericvalue,decimalpalaces)

     

    RAND

    用来产生随机数

    1
    RAND([seed])

     

    没有参数时,它会返回0-1之间的一个随机数。

    1
    SELECT RAND() AS 'Random Value'

     

    可选参数seed有的情况下,每次将返回相同的值。这让我想起了Python中的Random包。看来很多时候,一些东西是共通的啊。

    PI

    PI()函数
    如果想要对它保留两位小数,可以通过复合函数进行:

    1
    SELECT ROUND(PI(),2)

     

    将会返回:3.14

    4.4 转换函数

    CAST函数

    允许我们把数据从一种类型转换成另一种类型。

    1
    CAST(expression AS DateType)

     

    例子:

    1
    2
    3
    SELECT 
    '2009-04-11' AS 'Original Date',
    CAST('2009--04-11' AS DATETIME) AS 'Converted Date'

     

    ISNULL函数,很有用

    可以把NULL值转换成一个有意义的值。

    1
    2
    3
    SELECT Description,
    ISNULL(Color,'Unknown') AS 'Color'
    FROM Products

     

    五、排序函数

    5.1 添加排序

    1
    2
    3
    SELECT columnlist
    FROM tablelist
    ORDER BY columnlist

    默认是升序,ASC,因此,上面等价于:

    1
    2
    3
    SELECT columnlist
    FROM tablelist
    ORDER BY columnlist ASC

     

    5.2 降序

    使用DESC关键字:

    1
    2
    3
    SELECT columnlist
    FROM tablelist
    ORDER BY columnlist DESC

     

    5.3 根据多列

    1
    2
    3
    4
    5
    SELECT 
    FirstName,
    LastName
    FROM Customers
    ORDER BY LastName, FirstName

    注意:列的顺序很重要,首先按照LastName排序,然后按照FirstName排序。

    5.4 根据计算字段

    1
    2
    3
    SELECT LastName+','+FirstName AS 'Name'
    FROM Customers
    ORDER BY Name

    因此,从这儿可以知道,列别名不可以用在WHERE中,但可以用在ORDER BY中。
    例子

    1
    2
    3
    SELECT FirstName,LastName
    FROM Customers
    ORDER BY LastName+FirstName AS 'Name'

     

    5.5 排序补充内容

    当数据升序时,出现顺序是如下:

    NULL->数字->字符
    注意:此时,该列中的数字其实是按照字符来算的,因此,升序时,23也是排在5之前的。

    六、基于列的逻辑-CASE

    6.1 IF-THEN-ELSE逻辑

    包含列和CASE表达式的SELECT语句,大概如下:

    1
    2
    3
    4
    5
    SELECT 
    column1,
    column2,
    CaseExpression
    FROM table

     

    6.2 CASE-简单格式

    1
    2
    3
    4
    5
    6
    7
    SELECT 
    CASE ColumnOrExpression
    WHEN value1 THEN result1
    WHEN value2 THEN result2
    (repeat WHEN-THEN any number of times)
    [ELSE  DefaultResult]
    END

    CASE表达式对于把不好理解的值转换成有意义的描述是很有用的。

    1
    2
    3
    4
    5
    6
    7
    8
    SELECT 
    CASE CategoryCode
    WHEN 'F' THEN 'Fruit'
    WHEN 'V' THEN 'Vegetable'
    ELSE 'other'
    END AS 'Category',
    ProductDescription As 'Description'
    FROM Products

     

    6.3 CASE-查询格式

    1
    2
    3
    4
    5
    6
    7
    SELECT 
    CASE 
    WHEN condition1 THEN result1
    WHEN condition2 THEN result2
    (repeat WHEN-THEN any number of times)
    [ELSE  DefaultResult]
    END

    这种格式允许在关键字WHEN后边放置较为复杂的条件表达式。

    相关问题:

    七、基于行的逻辑

    7.1 应用查询条件

    终于派到WHERE出场了,注意写法顺序,再写一遍:

    1
    2
    3
    4
    5
    6
    Select -1>选择列,-2>distinct,-3>top
    1>…From 表
    2>…Where 条件
    3>…Group by 列
    4>…Having 筛选条件
    6>…Order by 列

     

    7.2 限制行-TOP

    1
    2
    3
    4
    SELECT 
    TOP Number 
    Columnlist
    FROM table

    7.3 TOP和ORDER BY结合

    关键字TOP的另一个用途是,把它和ORDER BY子句结合起来,基于特定分类,得到带有最大值的一定数量的行。

    假设你想看到Shakespeare所著的销量最多的书。

    1
    2
    3
    4
    5
    6
    7
    SELECT 
    TOP1
    Title AS 'Book Title',
    CurrentMonthSales AS 'Quantuty Sold'
    FROM Books
    WHERE Author='Shakespeare'
    ORDER BY CurrentMonthSales DESC

     

    ps: 学会利用google搜索,例如,我想要知道oracle中类似top作用的关键字是什么,可以:

    八、布尔逻辑

    关键字:AND/OR/NOT/BETWEEN/IN/IS/NULL

    8.1 OR

    OR子句意味着,如果确定任意条件为真,那么就该选中该行。

    1
    2
    3
    4
    SELECT userid,name,phone
    FROM users
    WHERE age<18
    OR age>60

     

    8.2 使用圆括号

    1
    2
    3
    4
    5
    6
    7
    SELECT CustomerName,
    Sate,
    QuantityPurchased
    FROM Orders
    WHERE State ='IL'
    OR State='CA'
    AND QuantityPurchased>8

    本来想要的结果是对来自IL或者CA的客户,同时,只看数量大于8的订单。但是上面执行的结果不是这样的,因为,SQL总是会先处理AND操作符!!!然后才会处理OR操作符。所以,上述语句中,先看到AND并执行如下的条件

    1
    2
    State= 'CA'
    AND QuantityPurchased>8

     

    因此,要用括号来规定顺序:

    1
    2
    3
    4
    5
    6
    7
    SELECT CustomerName,
    Sate,
    QuantityPurchased
    FROM Orders
    WHERE (State ='IL'
    OR State='CA')
    AND QuantityPurchased>8

     

    8.3 NOT操作符

    NOT操作符表示对后边的内容否定或者取反。

    1
    2
    3
    SELECT CustomerName,State
    FROM Orders
    WHERE NOT (State='IL' OR Sate='NY')

     

    这个其实可以用AND改写的!!!
    NOT操作符在逻辑上不是必须的。

    8.4 BETWEEN操作符

    1
    2
    3
    4
    5
    SELECT CustomerName,
    Sate,
    QuantityPurchased
    FROM Orders
    WHERE QuantityPurchased BETWEEN 8 AND 10

    8.5 IN操作符

    假设你想看到IL或者NY的行:

    1
    2
    3
    4
    SELECT *
    FROM Orders
    WHERE State='IL'
    OR State='CA'

     

    可以改写成:

    1
    2
    3
    SELECT *
    FROM Orders
    WHERE State IN ('IL','CA')

     

    8.9 布尔逻辑-IS NULL

    为了将某字段NULL值的行或0的行包括进来:

    1
    2
    3
    4
    SELECT *
    FROM Products
    WHERE weight=0
    OR weight IS NULL

     

    或者

    1
    2
    3
    SELECT *
    FROM Products
    WHERE ISNULL(weight,0)=0

     

    九、模糊匹配

    9.1 LIKE和%搭配

    %通配符可以表示任意的字符,它可以表示0个,1个,任意多个字符。

    9.2 通配符

    除了%以外,还有下划线(_)、方括号起来的characterlist,以及用方括号括起来的脱字符号(^)加上characterlist。

    • 下划线表示一个字符
    • [characterlist]表示括号中字符的任意一个
    • [^characterlist]表示不能是括号中字符的任意一个
      例子:
      1
      2
      3
      4
      5
      SELECT 
      FirstName,
      LastName
      FROM Actors
      WHERE FirstName LIKE '[CM]ARY'

    检索以C或者M开头并以ARY结尾的所有行。

    9.3 按照读音匹配

    SOUNDEX和DIFFERENCE

    十、汇总数据

    10.1消除重复

    使用DISTINCT

    1
    2
    SELECT DISTINCE name,age
    FROM users

     

    如果age不同,即使name相同,那么这一行就不会被删除重复。

    10.2 聚合函数

    COUNTSUMAVGMINMAX,他们提供了对分组数据进行计数、求和、取平均值、取最小值和最大值等方法。

    1
    2
    3
    4
    5
    SELECT 
    AVG(Grade) AS 'Average Quiz Score'
    MIN(Grade) AS 'Minimum Quiz Score'
    FROM Grades
    WHERE GradeType='Quiz'

     

    COUNT函数可以有3中不同方式使用它。

    1.COUNT函数可以用来返回所有选中行的数目,而不管任何特定列的值。
    例如:下面语句返回GradeType为’HomeWork’的所有行的数目:

    1
    2
    3
    4
    SELECT 
    COUNT(*) AS 'Count of Homework Rows'
    FROM Grades
    WHERE GradeType='HomeWork'

     

    这种方式,会计数所有行的个数,即使其中有*NULL

    2.第二种方式指定具体的列

    1
    2
    3
    4
    SELECT 
    COUNT(Grades) AS 'Count of Homework Rows'
    FROM Grades
    WHERE GradeType='HomeWork'

     

    第一种方式返回3,这一种方式返回2,为什么???因为,这种方式要满足Grades这一列有值,NULL值的行不会计数。

    3.使用关键字DISTINCT。

    1
    2
    3
    SELECT 
    COUNT(DISTINCT FeeType) AS 'Number of Fee Types'
    FROM Fees

     

    这条语句计数了FeeType列唯一值的个数。

    10.3 分组数据-GROUP BY

    1
    2
    3
    4
    5
    6
    SELECT
    GradeType AS 'Grade Type',
    AVG(Grade)AS 'Average Grade'
    FROM Grades
    GROUP BY GradeType
    ORDER BY GradeType

    感觉像EXCEL中的分类汇总功能。
    如果想把Grade为NULL值的当做0,那么可以用:

    1
    2
    3
    4
    5
    6
    SELECT
    GradeType AS 'Grade Type',
    AVG(ISNULL(Grade,0))AS 'Average Grade'
    FROM Grades
    GROUP BY GradeType
    ORDER BY GradeType

     

    • GROUP BY子句中的列的顺序是没有意义的;
    • ORDER BY子句中的列的顺序是有意义的。

    10.4 基于聚合查询条件-HAVING

    当针对带GROUP BY的一条SELECT语句应用任何查询条件时,人们必须要问查询条件是应用于单独的行还是整个组。

    实际上,WHERE子句是单独的执行查询条件。SQL提供了一个名为HAVING的关键字,它允许对组级别使用查询条件。
    例子:
    查看选修了类型为选修“A”,平均成绩在70分以上的学生姓名,平均成绩。

    1
    2
    3
    4
    5
    6
    7
    8
    SELECT 
    Name,
    AVG(ISNULL(Grades,0)) AS 'Average Grades'
    FROM Grades
    WHERE GradeType='A'
    GROUP BY Name
    HAVING AVG(ISNULL(Grades,0))>70
    ORDER BY Name

     

    修要修类型为A,那么,这是这对行的查询,因此这里要用WHERE。
    但是,还要筛选平均成绩,那么,这是一个平均值,建立在聚合函数上的,并不是单独的行,这就需要用到关键字HAVING。需要先将Student分组,然后把查询结果应用到基于全组的一个聚合统计上。

    WHERE只保证我们选择了GradeType是A的行,HAVING保证平均成绩至少70分以上。

    注意:如果想要在结果中添加GradeType的值,如果直接在SELECT后边添加这个列,将会出错。这是因为,所有列都必须要么出现在GROUP BY中,要么包含在一个聚合函数中。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    SELECT 
    Name,
    GradeType,
    AVG(ISNULL(Grades,0)) AS 'Average Grades'
    FROM Grades
    WHERE GradeType='A'
    GROUP BY Name,GradeType
    HAVING AVG(ISNULL(Grades,0))>70
    ORDER BY Name

     

    十一、组合表

    11.1 内连接来组合表-Inner Join

    通过书中的描述,我感觉内连接更像是用来将主键表、外键表连接起来的工具。
    例如:
    A表:

    useridnameage
    1 michael 26
    2 hhh 25
    3 xiang 20

    B表:

    orderiduseridnumprice
    1 1 2 3
    2 2 6 6
    3 1 5 5

    如上表格,那么要连接这两个表格,查询订单1的客户姓名,年龄,订单号:
    方式一:

    1
    2
    3
    4
    SELECT name,age,orderid
    FROM A,B
    WHERE A.userid=B.userid
    AND orderid=1

     

    方式二,使用现在的内连接实现:

    1
    2
    3
    4
    5
    SELECT name,age,orderid
    FROM A
    INNER JOIN B
    ON A.userid=B.userid
    AND orderid=1

     

    ON关键字指定两个表如何准确的连接。

    内连接中表的顺序:FROM 子句指定了A表,INNER JOIN 子句指定B表,我们调换A,B顺序,所得到的结果相同的!只是显示列的顺序可能会不同而已。

    不建议使用方式一的格式。关键字INNER JOIN ON的优点在于显示地表示了连接的逻辑,那是它们唯一的用途。WEHERE的含义不够明显。因为它是条件的意思啊,不是连接的!

    11.2 外连接

    外连接分为左连接(LEFT OUTER JOIN)、右连接(RIGHT OUTER JOIN)、全连接(FULL OUTER JOIN)。

    OUTER是可以省略的。

    左连接(LEFT JOIN)

    1
    2
    3
    4
    5
    SELECT name,age,orderid
    FROM A
    LEFT JOIN B
    ON A.userid=B.userid
    AND orderid=1

    外连接的强大之处在于,主表中的数据必然都会保留,从表中列没有值的情况,用NULL补充。

    LEFT JOIN 左边的表为主表,右边的表为从表。

    11.3 自连接

    自连接必然用到表的别名。

    1
    2
    3
    4
    SELECT A.name,B.name as ManagerName
    FROM worker as A
    LEFT JOIN worker as B
    ON A.managerid=B.id

     

    11.4 创建视图

    1
    2
    3
    CREATE VIEW ViewName AS
    SelectStatement
    [WITH CHECK OPTION]

    视图中不能包含ORDER BY子句。

    [WITH CHECK OPTION]表示对视图进行UPDATE,INSERT,DELETE操作时任然保证了视图定义时的条件表达式。

    删除视图:

    1
    DROP VIEW ViewName

     

    修改视图:

    1
    2
    ALTER VIEW ViewName AS
    SelectStatement

     

    视图的优点

    1. 简化用户的操作
    2. 使用户以多角度看待同一数据
    3. 对重构数据库提供了一定程度的逻辑独立性
    4. 对机密数据提供安全保护

    十二、补充

    12.1 子查询

    可以用3种主要的方式来指定子查询,总结如下:

    • 当子查询是tablelist的一部分时,它指定了一个数据源。
    • 当子查询是condition的一部分时,它成为查询条件的一部分。
    • 当子查询是columnlist的一部分时,它创建了一个单个的计算的列。

    12.2 索引

    索引是一种物理结构,可以为数据库表中任意的列添加索引。

    索引的目的是,当SQL语句中包含该列的是偶,可以加速数据的检索。

    索引的缺点是,在数据库中,索引需要更多的存储硬盘。另一个负面因素是,索引通常会降低相关的列数据更新速度。这是因为,任何时候插入或者修改一行记录时,索引都必须重新计算该列中的值的正确的排列顺序。

    可以对任意的列进行索引,但是只能指定一个列作为主键。指定一个列作为主键意味着两件事情:首先这个列成为了索引,其次保证这列包含唯一的值。

    1
    2
    CREATE INDEX Index2
    ON MyTable (ColumnFour)

     

    删除一个索引:

    1
    2
    DROP INDX Index2
    ON MyTable

     

    参考:

  • 相关阅读:
    HDU 3547 DIY Cube
    POJ 2975 Nim
    POJ 1678 I Love this Game!
    POJ 2234 Matches Game
    POJ 3537 Crosses and Crosses
    POJ 3710 Christmas Game
    POJ 1704 Georgia and Bob
    HDU 3923 Invoker
    POJ 2154 Color
    PLM更新自定义CLASS
  • 原文地址:https://www.cnblogs.com/baili-luoyun/p/11132420.html
Copyright © 2020-2023  润新知