SELECT
是用来做什么的呢?一个最经常使用的方式是将资料从数据库中的表格内选出。从这一句回答中。我们立即能够看到两个keyword:从 (FROM)数据库中的表格内选出 (SELECT)。(表格是一个数据库内的结构,它的目的是储存资料。
在表格处理这一部分中,我们会提到怎样使用 SQL 来设定表格。
) 我们由这里能够看到最主要的 SQL 架构:
SELECT "栏位名"FROM "表格名"
我们用下面的样例来看看实际上是怎么用的。
如果我们有下面这个表格:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
若要选出全部的店名(store_Name)。我们就打入:
SELECT store_name FROM Store_Information
结果:
store_name |
Los Angeles |
San Diego |
Los Angeles |
Boston |
我们一次能够读取好几个栏位,也能够同一时候由好几个表格中选资料。
简单的SQL查询仅仅包含选择列表、FROM子句和WHERE子句。
它们分别说明所查询列、查询的表或视图、以及搜索条件等。
1、选择全部列
比如。以下语句显示testtable表中全部列的数据:
代码:SELECT * FROMtesttable
2、选择部分列并指定它们的显示次序查询结果集合中数据的排列顺序与选择列表中所指定的列名排列顺序同样。比如:
代码:SELECT nickname,email
FROMtesttable
3、更改列标题
在选择列表中,可又一次指定列标题。定义格式为:列标题=列名
假设指定的列标题不是标准的标识符格式时。应使用引號定界符,比如,下列语句使用汉字显示列标题:
代码:SELECT 昵称=nickname,电子邮件=email FROM testtable
4、删除反复行
SELECT语句中使用ALL或DISTINCT选项来显示表中符合条件的全部行或删除当中反复的数据行。默觉得ALL。
使用DISTINCT选项时。对于全部反复的数据行在SELECT返回的结果集合中仅仅保留一行。
5、限制返回的行数
使用TOP n [PERCENT]选项限制返回的数据行数,TOP n说明返回n行,而TOP n
PERCENT时。说明n是表示一百分数,指定返回的行数等于总行数的百分之几。比如:
代码:SELECT TOP 2 *
FROM `testtable`
代码:SELECT TOP 20 PERCENT*
FROM `testtable`
DISTINCT
SELECT 指令让我们可以读取表格中一个或数个栏位的全部资料。
这将把全部的资料都抓出,不管资料值有无反复。在资料处理中。我们会常常碰到须要找出表格内的不同资料值的情况。换句话说,我们须要知道这个表格/栏位内有哪些不同的值,而每一个值出现的次数并不重要。这要怎样达成呢?在 SQL 中,这是非常easy做到的。我们仅仅要在 SELECT 后加上一个 DISTINCT 就能够了。DISTINCT 的语法例如以下:
SELECT DISTINCT"栏位名"
FROM "表格名"
举例来说。若要在下面的表格。Store_Information。找出全部不同的店名时,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT DISTINCT store_name FROM Store_Information
结果:
store_name
Los Angeles
San Diego
Boston
WHERE
我们并不一定每一次都要将表格内的资料都全然抓出。在很多时候,我们会须要选择性地抓资料。就我们的样例来说。我们可能仅仅要抓出营业额超过 $1,000 的资料。要做到这一点。我们就须要用到 WHERE 这个指令。这个指令的语法例如以下:
SELECT "栏位名"
FROM "表格名"
WHERE "条件"
比較运算符(大小比較):>、>=、=、<、<=、!<、!>、!=
例:返回96年1月的定单
SELECT orderID, CustomerID, orderDate
FROM orders
WHERE orderDate〉#1/1/96#AND orderDate〈#1/30/96#
注意:
Mcirosoft JET SQL 中,日期用‘#’定界。日期也能够用Datevalue()函数来取代。在比較字符型的数据时。要加上单引號’’,尾空格在比較中被忽略。
例:
WHERE orderDate〉#96-1-1#
也能够表示为:
WHERE orderDate〉Datevalue(‘1/1/96’)
若我们要由下面的表格抓出营业额超过 $1,000 的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入。
SELECT store_name
FROM Store_Information
WHERE Sales > 1000
结果:
store_name
Los Angeles
ANDOR
在上一页中,我们看到 WHERE 指令能够被用来由表格中有条件地选取资料。
这个条件可能是简单的 (像上一页的样例),也可能是复杂的。复杂条件是由二或多个简单条件透过 AND 或是 OR的连接而成。一个 SQL 语句中能够有无限多个简单条件的存在。
复杂条件的语法例如以下:
SELECT "栏位名"
FROM "表格名"
WHERE "简单条件"
{[AND|OR] "简单条件"}+
{}+ 代表{}之内的情况会发生一或多次。在这里的意思就是 AND 加简单条件及 OR 加简单条件的情况能够发生一或多次。
另外。我们能够用 () 来代表条件的先后次序。
举例来说。我们若要在 Store_Information 表格中选出全部 Sales 高于 $1,000或是 Sales 在 $500 及 $275 之间的资料的话,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入。
SELECT store_name
FROM Store_Information
WHERE Sales > 1000
OR (Sales < 500 ANDSales > 275)
结果:
store_name
Los Angeles
San Francisco
IN
在 SQL 中,在两个情况下会用到IN 这个指令。这一页将介绍当中之中的一个:与 WHERE 有关的那一个情况。
在这个使用方法下。我们事先已知道至少一个我们须要的值,而我们将这些知道的值都放入 IN 这个子句。
IN 指令的语法为下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"IN ('值一', '值二', ...)
在括号内能够有一或多个值,而不同值之间由逗点分开。值能够是数目或是文字。若在括号内仅仅有一个值。那这个子句就等于
WHERE "栏位名"= '值一'
举例来说,若我们要在 Store_Information 表格中找出全部含盖 Los Angeles 或 SanDiego 的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE store_name IN ('Los Angeles', 'San Diego')
结果:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
BETWEEN
IN 这个指令能够让我们按照一或数个不连续 (discrete) 的值的限制之内抓出资料库中的值。而 BETWEEN 则是让我们能够运用一个范围 (range) 内抓出资料库中的值。
BETWEEN这个子句的语法例如以下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"BETWEEN '值一' AND '值二'
这将选出栏位值包括在值一及值二之间的每一笔资料。
举例来说。若我们要由 Store_Information 表格中找出全部介于 January 6, 1999 及 January10, 1999 中的资料。
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE Date BETWEEN 'Jan-06-1999' AND'Jan-10-1999'
请读者注意:在不同的数据库中。日期的储存法可能会有所不同。
在这里我们选择了当中一种储存法。
结果:
store_name |
Sales |
Date |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
LIKE
LIKE 是还有一个在 WHERE 子句中会用到的指令。基本上, LIKE 能让我们根据一个模式 (pattern) 来找出我们要的资料。相对来说,在运用 IN 的时候,我们全然地知道我们须要的条件。在运用 BETWEEN 的时候,我们则是列出一个范围。 LIKE 的语法例如以下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"LIKE {模式}
LIKE运算符里使用的通配符
通配符含义
?不论什么一个单一的字符
* 随意长度的字符
# 0~9之间的单一数字
[字符列表]在字符列表里的任一值
[。字符列表] 不在字符列表里的任一值
- 指定字符范围,两边的值分别为其上下限
{模式} 常常包含野卡 (wildcard). 下面是几个样例:
'A_Z': 全部以 'A' 起头,还有一个不论什么值的字原,且以 'Z' 为结尾的字符串。
'ABZ' 和 'A2Z' 都符合这一个模式。而'AKKZ' 并不符合 (由于在 A 和 Z 之间有两个字原,而不是一个字原)。
'ABC%': 全部以 'ABC' 起头的字符串。
举例来说,'ABCD' 和'ABCABC' 都符合这个模式。
'%XYZ': 全部以 'XYZ' 结尾的字符串。举例来说。'WXYZ' 和 'ZZXYZ'都符合这个模式。
'%AN%': 全部含有 'AN'这个模式的字符串。
举例来说。 'LOS ANGELES' 和 'SANFRANCISCO' 都符合这个模式。
我们将以上最后一个样例用在我们的 Store_Information 表格上:
Store_Information 表格
store_name |
Sales |
Date |
LOS ANGELES |
$1500 |
Jan-05-1999 |
SAN DIEGO |
$250 |
Jan-07-1999 |
SAN FRANCISCO |
$300 |
Jan-08-1999 |
BOSTON |
$700 |
Jan-08-1999 |
我们就键入。
SELECT *
FROM Store_Information
WHERE store_name LIKE '%AN%'
结果:
store_name |
Sales |
Date |
LOS ANGELES |
$1500 |
Jan-05-1999 |
SAN FRANCISCO |
$300 |
Jan-08-1999 |
SAN DIEGO |
$250 |
Jan-07-1999 |
ODERBY
到眼下为止,我们已学到怎样藉由 SELECT 及 WHERE 这两个指令将资料由表格中抓出。只是我们尚未提到这些资料要怎样排列。这其实是一个非常重要的问题。其实,我们常常须要可以将抓出的资料做一个有系统的显示。这可能是由小往大 (ASCENDing) 或是由大往小(DESCENDing)。在这样的情况下,我们就行运用 ODER BY 这个指令来达到我们的目的。
ODER BY 的语法例如以下:
SELECT "栏位名"
FROM "表格名"
[WHERE "条件"]
ODER BY "栏位名"[ASC, DESC]
[] 代表 WHERE 子句不是一定须要的。只是,假设 WHERE 子句存在的话,它是在ODER BY 子句之前。 ASC 代表结果会以由小往大的顺序列出,而 DESC 代表结果会以由大往小的顺序列出。假设两者皆没有被写出的话。那我们就会用 ASC。
我们能够照好几个不同的栏位来排顺序。在这个情况下, ODER BY 子句的语法例如以下(如果有两个栏位):
ODER BY "栏位一"[ASC, DESC],"栏位二" [ASC, DESC]
若我们对这两个栏位都选择由小往大的话,那这个子句就会造成结果是根据 "栏位一"由小往大排。若有好几笔资料 "栏位一"的值相等,那这几笔资料就根据 "栏位二"由小往大排。
举例来说。若我们要按照 Sales 栏位的由大往小列出Store_Information 表格中的资料。
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
an-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name, Sales, Date
FROM Store_Information
ODER BY Sales DESC
结果:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
Boston |
$700 |
Jan-08-1999 |
San Francisco |
$300 |
Jan-08-1999 |
San Diego |
$250 |
Jan-07-1999 |
在以上的样例中,我们用栏位名来指定排列顺序的根据。除了栏位名外。我们也能够用栏位的顺序 (根据 SQL 句中的顺序)。在 SELECT 后的第一个栏位为 1,第二个栏位为 2,以此类推。在上面这个样例中,我们用下面这句 SQL 能够达到全然一样的效果:
SELECT store_name, Sales, Date
FROM Store_Information
ODER BY 2 DESC
函数
既然数据库中有很多资料都是已数字的型态存在,一个非常重要的用途就是要可以对这些数字做一些运算,比如将它们总合起来,或是找出它们的平均值。
SQL 有提供一些这一类的函数。
它们是:
AVG (平均)
COUNT (计数)
MAX (最大值)
MIN (最小值)
SUM (总合)
VAR (方差)
STDEV (标准误差)
FIRST (第一个值)
LAST (最后一个值)
运用函数的语法是:
SELECT "函数名"("栏位名")
FROM "表格名"
举例来说,若我们要由我们的范例表格中求出 Sales 栏位的总合。
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT SUM(Sales) FROM Store_Information
结果:
SUM(Sales)
$2750
$2750 代表全部 Sales 栏位的总合: $1500 + $250 + $300 + $700.
除了函数的运用外,SQL 也能够做简单的数学运算,比如加(+)和减(-)。
对于文字类的资料,SQL也有好几个文字处理方面的函数。比如文字相连 (concatenation),文字修整(trim),以及子字符串 (substring)。
不同的数据库对这些函数有不同的语法,所以最好是參考您所用数据库的信息。来确定在那个数据库中,这些函数是怎样被运用的。
COUNT
在上一页有提到, COUNT 是函数之中的一个。
因为它的使用广泛。我们在这里特别提出来讨论。基本上, COUNT 让我们可以数出在表格中有多少笔资料被选出来。
它的语法是:
SELECT COUNT("栏位名")
FROM "表格名"
举例来说。若我们要找出我们的范例表格中有几笔 store_name 栏不是空白的资料时,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT COUNT(store_name)
FROM Store_Information
WHERE store_name is not NULL
结果:
Count(store_name)
4
"is not NULL" 是 "这个栏位不是空白"的意思。
COUNT 和 DISTINCT 常常被合起来使用,目的是找出表格中有多少笔不同的资料 (至于这些资料实际上是什么并不重要)。举例来说。假设我们要找出我们的表格中有多少个不同的 store_name,我们就键入,
SELECT COUNT(DISTINCT store_name)
FROM Store_Information
结果:
Count(DISTINCTstore_name)
3
GROUP BY
我们如今回到函数上。记得我们用 SUM 这个指令来算出全部的 Sales (营业额)吧!
假设我们的需求变成是要算出每一间店 (store_name) 的营业额 (sales)。那怎么办呢?在这个情况下,我们要做到两件事:第一。我们对于 store_name 及 Sales 这两个栏位都要选出。第二。我们须要确认全部的 sales 都要按照各个store_name 来分开算。这个语法为:
SELECT "栏位1",SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
在我们的范例上,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name, SUM(Sales)
FROM Store_Information
GROUP BY store_name
结果:
store_name SUM(Sales)
Los Angeles $1800
San Diego $250
Boston $700
当我们选不仅仅一个栏位。且当中至少一个栏位有包括函数的运用时,我们就须要用到 GROUP BY 这个指令。在这个情况下,我们须要确定我们有 GROUP BY 全部其它的栏位。换句话说。除了有包含函数的栏位外,我们都须要将其放在 GROUP BY 的子句中。
HAVING
那我们怎样对函数产生的值来设定条件呢?举例来说,我们可能仅仅须要知道哪些店的营业额有超过 $1,500。在这个情况下,我们不能使用 WHERE 的指令。那要怎么办呢?非常幸运地,SQL 有提供一个 HAVING 的指令,而我们就能够用这个指令来达到这个目标。 HAVING 子句一般是在一个 SQL 句子的最后。一个含有HAVING 子句的 SQL 并不一定要包括 GROUP BY 子句。HAVING 的语法例如以下:
SELECT "栏位1",SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING (函数条件)
请读者注意: 假设被 SELECT 的仅仅有函数栏, 那就不须要 GROUP BY 子句。
在我们 Store_Information 表格这个样例中,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
若我们要找出 Sales 大于 $1,500的 store_name,我们就键入,
SELECT store_name, SUM(sales)
FROM Store_Information
GROUP BY store_name
HAVING SUM(sales) > 1500
结果:
store_name SUM(Sales)
Los Angeles $1800
ALIAS
接下来,我们讨论 alias (别名) 在 SQL 上的用处。最经常使用到的别名有两种:栏位别名及表格别名。
简单地来说。栏位别名的目的是为了让 SQL 产生的结果易读。
在之前的样例中,每当我们有营业额总合时,栏位名都是 SUM(sales)。
尽管在这个情况下没有什么问题。但是假设这个栏位不是一个简单的总合,而是一个复杂的计算,那栏位名就没有这么易懂了。若我们用栏位别名的话,就能够确认结果中的栏位名是简单易懂的。
另外一种别名是表格别名。
要给一个表格取一个别名。仅仅要在 FROM 子句中的表格名后空一格,然后再列出要用的表格别名就能够了。这在我们要用 SQL 由数个不同的表格中获取资料时是非常方便的。这一点我们在之后谈到连接 (join) 时会看到。
我们先来看一下栏位别名和表格别名的语法:
SELECT "表格别名"."栏位1" "栏位别名"
FROM "表格名""表格别名"
或者:
SELECT "表格名"AS "表格别名"
基本上,这两种别名都是放在它们要替代的物件后面,而它们中间由一个空白分开。
我们继续使用 Store_Information 这个表格来做样例:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们用跟 SQL GROUP BY 那一页一样的样例。这里的不同处是我们加上了栏位别名以及表格别名:
SELECT A1.store_name Store, SUM(A1.Sales) "Total Sales"
FROM Store_Information A1
GROUP BY A1.store_name
结果:
Store Total Sales
Los Angeles $1800
San Diego $250
Boston $700
在结果中,资料本身没有不同。不同的是栏位的标题。这是运用栏位别名的结果。在第二个栏位上。原本我们的标题是 "Sum(Sales)",而如今我们有一个非常清楚的 "Total Sales"。非常明显地, "Total Sales" 可以比 "Sum(Sales)" 更精确地阐述这个栏位的含意。
用表格别名的优点在这里并没有显现出来,只是这在 下一页就会非常清楚了。
表格链接
如今我们介绍连接(join)的概念。要了解连接,我们须要用到很多我们之前已介绍过的指令。
我们先如果我们有下面的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
而我们要知道每一区 (region_name) 的营业额(sales)。
Geography 这个表格告诉我们每一区有哪些店。而 Store_Information 告诉我们每个店的营业额。
若我们要知道每一区的营业额,我们须要将这两个不同表格中的资料串联起来。当我们细致了解这两个表格后,我们会发现它们可经由一个同样的栏位。store_name。连接起来。我们先将SQL 句列出,之后再讨论每个子句的意义:
SELECT A1.region_name REGION, SUM(A2.Sales) SALES
FROM Geography A1, Store_Information A2
WHERE A1.store_name = A2.store_name
GROUP BY A1.region_name
结果:
REGION SALES
East $700
West $2050
在第一行中。我们告诉 SQL 去选出两个栏位:第一个栏位是Geography 表格中的 region_name 栏位 (我们取了一个别名叫做 REGION);第二个栏位是 Store_Information 表格中的 sales 栏位 (别名为 SALES)。请注意在这里我们实用到表格别名:Geography 表格的别名是 A1,Store_Information 表格的别名是 A2。若我们没实用表格别名的话。第一行就会变成
SELECT Geography.region_name REGION, SUM(Store_Information.Sales) SALES
非常明显地,这就复杂多了。在这里我们能够看到表格别名的功用:它能让 SQL 句easy被了解,尤其是这个 SQL 句含盖好几个不同的表格时。
接下来我们看第三行,就是 WHERE 子句。这是我们阐述连接条件的地方。在这里。我们要确认 Geography 表格中store_name 栏位的值与 Store_Information 表格中 store_name 栏位的值是相等的。
这个 WHERE 子句是一个连接的灵魂人物,由于它的角色是确定两个表格之间的连接是正确的。
假设 WHERE 子句是错误的,我们就极可能得到一个笛卡儿连接 (Cartesian join)。笛卡儿连接会造成我们得到全部两个表格每两行之间全部可能的组合。在这个样例中。笛卡儿连接会让我们得到 4 x 4 = 16 行的结果。
外部链接
之前我们看到的左连接 (left join)。又称内部连接(inner join)。在这个情况下,要两个表格内都有相同的值,那一笔资料才会被选出。
那假设我们想要列出一个表格中每一笔的资料,不管它的值在还有一个表格中有没有出现,那该怎么办呢?在这个时候,我们就须要用到 SQL OUTER JOIN (外部连接) 的指令。
外部连接的语法是依数据库的不同而有所不同的。举例来说,在 Oracle 上。我们会在 WHERE 子句中要选出全部资料的那个表格之后加上一个"(+)" 来代表说这个表格中的全部资料我们都要。
如果我们有下面的两个表格:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
我们须要知道每一间店的营业额。假设我们用一个普通的连接。我们将会漏失掉 'New York'这个店,由于它并不存在于 Store_Information 这个表格。
所以,在这个情况下,我们须要用外部连接来串联这两个表格:
SELECT A1.store_name, SUM(A2.Sales) SALES
FROM Georgraphy A1, Store_Information A2
WHERE A1.store_name = A2.store_name (+)
GROUP BY A1.store_name
我们在这里是使用了 Oracle 的外部连接语法。
结果:
store_name SALES
Boston $700
New York
Los Angeles $1800
San Diego $250
请注意: 当第二个表格没有相对的资料时, SQL 会传回 NULL 值。在这一个样例中, 'New York' 并不存在于Store_Information 表格,所以它的 "SALES" 栏位是 NULL.
CONCATENATE
有的时候,我们有须要将由不同栏位获得的资料串连在一起。
每一种数据库都有提供方法来达到这个目的:
MySQL: CONCAT()
Oracle: CONCAT(), ||
SQL Server: +
CONCAT() 的语法例如以下:
CONCAT(字符串1, 字符串2, 字符串3, ...): 将字符串1、字符串2、字符串3,等字符串连在一起。请注意,Oracle的CONCAT()仅仅同意两个參数;换言之,一次仅仅能将两个字符串串连起来。只是,在Oracle中,我们能够用'||'来一次串连多个字符串。
来看一个样例。如果我们有下面的表格:
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
样例1:
MySQL/Oracle:
SELECT CONCAT(region_name,store_name) FROMGeography
WHERE store_name = 'Boston';
结果:
'EastBoston'
样例2:
Oracle:
SELECT region_name || ' ' || store_name FROMGeography
WHERE store_name = 'Boston';
结果:
'East Boston'
样例3:
SQL Server:
SELECT region_name + ' ' + store_name FROMGeography
WHERE store_name = 'Boston';
结果:
'East Boston'
SUBSTRING
SQL 中的 substring 函数是用来抓出一个栏位资料中的当中一部分。这个函数的名称在不同的数据库中不全然一样:
MySQL: SUBSTR(), SUBSTRING()
Oracle: SUBSTR()
SQL Server: SUBSTRING()
最经常使用到的方式例如以下 (在这里我们用SUBSTR()为例):
SUBSTR(str,pos): 由<str>中,选出全部从第<pos>位置開始的字符。请注意。这个语法不适用于SQL Server上。
SUBSTR(str,pos,len): 由<str>中的第<pos>位置開始,选出接下去的<len>个字符。
如果我们有下面的表格:
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
例1:
SELECT SUBSTR(store_name, 3)
FROM Geography
WHERE store_name = 'Los Angeles';
结果:
's Angeles'
例2:
SELECT SUBSTR(store_name,2,4)
FROM Geography
WHERE store_name = 'San Diego';
结果:
'an D'
进阶SQL
在这一部分,我们将介绍下面的 SQL 概念及keyword:
我们并介绍怎样用 SQL 来做出下面的运算:
累积总合百分比 (Cumulative Percent to Total)
UNION
UNION 指令的目的是将两个 SQL 语句的结果合并起来。从这个角度来看。 UNION 跟 JOIN 有些许类似,由于这两个指令都能够由多个表格中撷取资料。 UNION 的一个限制是两个 SQL 语句所产生的栏位须要是相同的资料种类。
另外,当我们用 UNION 这个指令时,我们仅仅会看到不同的资料值 (类似 SELECT DISTINCT)。
UNION 的语法例如以下:
[SQL 语句 1]
UNION
[SQL 语句 2]
如果我们有下面的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出来全部有营业额 (sales) 的日子。要达到这个目的,我们用下面的 SQL 语句:
SELECT Date FROM Store_Information
UNION
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-07-1999
Jan-08-1999
Jan-10-1999
Jan-11-1999
Jan-12-1999
有一点值得注意的是。假设我们在不论什么一个 SQL 语句 (或是两句都一起) 用 "SELECT DISTINCTDate" 的话,那我们会得到全然一样的结果。
UNION ALL
UNION ALL 这个指令的目的也是要将两个 SQL 语句的结果合并在一起。UNION ALL 和 UNION 不同之处在于 UNION ALL 会将每一笔符合条件的资料都列出来,不管资料值有无反复。
UNION ALL 的语法例如以下:
[SQL 语句 1]
UNION ALL
[SQL 语句 2]
我们用和上一页相同的样例来显示出UNION ALL 和 UNION 的不同。相同如果我们有下面两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出有店面营业额以及网络营业额的日子。
要达到这个目的,我们用下面的 SQL 语句:
SELECT Date FROM Store_Information
UNION ALL
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-07-1999
Jan-08-1999
Jan-08-1999
Jan-07-1999
Jan-10-1999
Jan-11-1999
Jan-12-1999
INTERSECT
和 UNION 指令类似,INTERSECT 也是对两个 SQL 语句所产生的结果做处理的。不同的地方是, UNION 基本上是一个 OR (假设这个值存在于第一句或是第二句,它就会被选出)。而 INTERSECT则比較像 AND (这个值要存在于第一句和第二句才会被选出)。 UNION是联集,而 INTERSECT 是交集。
INTERSECT 的语法例如以下:
[SQL 语句 1]
INTERSECT
[SQL 语句 2]
如果我们有下面的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出哪几天有店面交易和网络交易。
要达到这个目的。我们用下面的 SQL 语句:
SELECT Date FROM Store_Information
INTERSECT
SELECT Date FROM Internet_Sales
结果:
Date
Jan-07-1999
请注意,在 INTERSECT 指令下。不同的值仅仅会被列出一次。
MINUS
MINUS 指令是运用在两个 SQL 语句上。它先找出第一个SQL 语句所产生的结果,然后看这些结果有没有在第二个 SQL 语句的结果中。假设有的话,那这一笔资料就被去除。而不会在最后的结果中出现。
假设第二个 SQL 语句所产生的结果并没有存在于第一个 SQL 语句所产生的结果内。那这笔资料就被抛弃。
MINUS 的语法例如以下:
[SQL 语句 1]
MINUS
[SQL 语句 2]
我们继续使用一样的样例:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要知道有哪几天是有店面营业额而没有网络营业额的。
要达到这个目的,我们用下面的 SQL 语句:
SELECT Date FROM Store_Information
MINUS
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-08-1999
"Jan-05-1999","Jan-07-1999", AND"Jan-08-1999" 是 "SELECTDate FROM Store_Information" 所产生的结果。
在这里面, "Jan-07-1999" 是存在于 "SELECT Date FROMInternet_Sales" 所产生的结果中。因此"Jan-07-1999" 并不在最后的结果中。
请注意,在 MINUS 指令下,不同的值仅仅会被列出一次。
子查询
我们能够在一个 SQL 语句中放入还有一个SQL 语句。
当我们在 WHERE 子句或 HAVING 子句中插入还有一个SQL 语句时,我们就有一个子查询 (subquery) 的架构。 子查询的作用是什么呢?第一,它可以被用来连接表格。另外,有的时候子查询是唯一可以连接两个表格的方式。
子查询的语法例如以下:
SELECT "栏位1"
FROM "表格"
WHERE "栏位2"[比較运算素]
(SELECT "栏位1"
FROM "表格"
WHERE [条件])
[比較运算素] 能够是相等的运算素,比如 =, >, <, >=, <=. 这也能够是一个对文字的运算素,比如 "LIKE"。绿色的部分代表外查询。红色的部分代表内查询。
我们就用刚刚在阐述 SQL 连接时用过的样例:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
我们要运用 subquery 来找出全部在西部的店的营业额。
我们能够用以下的 SQL 来达到我们的目的:
SELECT SUM(Sales) FROM Store_Information
WHERE Store_name IN
(SELECTstore_name FROM Geography
WHERE region_name = 'West')
结果:
SUM(Sales)
2050
在这个样例中。我们并没有直接将两个表格连接起来。然后由此直接算出每一间西区店面的营业额。
我们做的是先找出哪些店是在西区的。然后再算出这些店的营业额总共是多少。
在以上的样例,内部查询本身与外部查询没有关系。
这一类的子查询称为『简单子查询』 (Simple Subquery)。假设内部查询是要利用到外部查询提到的表格中的栏位,那这个字查询就被称为『相关子查询』 (Correlated Subquery)。下面是一个相关子查询的样例:
SELECT SUM(a1.Sales) FROMStore_Information a1
WHERE a1.Store_name IN
(SELECTstore_name FROM Geography a2
WHERE a2.store_name = a1.store_name)
红色部分即是外部查询提到的表格中的栏位。
EXISTS
在上一页中,我们用 IN 来连接内查询和外查询。另外有数个方式,比如 >, <, 及 =。都能够用来连接内查询和外查询。
EXISTS 也是当中一种方式。这一页我们将讨论 EXISTS 的使用方法。
基本上。 EXISTS 是用来測试内查询有没有产生不论什么结果。
假设有的话,系统就会运行外查询中的 SQL。若是没有的话,那整个SQL 语句就不会产生不论什么结果。
EXISTS 的语法是:
SELECT "栏位1"
FROM "表格1"
WHERE EXISTS
(SELECT *
FROM "表格2"
WHERE [条件])
在内查询中,我们并不一定要用 * 来选出全部的栏位。我们也能够选择表格2中的不论什么栏位。这两种做法最后的结果是一样的。
来看一个样例。如果我们有下面的两个表格:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
而我们打入的 SQL 是:
SELECT SUM(Sales) FROM Store_Information
WHERE EXISTS
(SELECT * FROM Geography
WHERE region_name = 'West')
我们会得到下面的答案:
SUM(Sales)
2750
乍看之下,这个答案似乎不太正确,由于内查询有包括一个 [region_name = 'West'] 的条件,但是最后的答案并没有包括这个条件。
实际上,这并没有问题。在这个样例中,内查询产生了超过一笔的资料,所以 EXISTS 的条件成立,所以外查询被运行。而外查询本身并没有包括 [region_name = 'West'] 这个条件。
CASE
CASE 是 SQL 用来做为 IF-THEN-ELSE 之类逻辑的keyword。 CASE 的语法例如以下:
SELECT CASE ("栏位名")
WHEN "条件1" THEN "结果1"
WHEN "条件2" THEN "结果2"
...
[ELSE "结果N"]
END
FROM "表格名"
"条件" 能够是一个数值或是公式。
ELSE 子句则并非必须的。
在我们的 Store_Information 中
Store_Information 表格
store_name Sales Date
Los Angeles $1500 Jan-05-1999
San Diego $250 Jan-07-1999
San Francisco $300 Jan-08-1999
Boston $700 Jan-08-1999
若我们要将 'Los Angeles' 的 Sales 数值乘以2,以及将 'San Diego' 的 Sales 数值乘以1.5。我们就键入下面的 SQL:
SELECT store_name, CASE store_name
WHEN 'Los Angeles' THENSales * 2
WHEN 'San Diego' THENSales * 1.5
ELSE Sales
END
"New Sales",
Date
FROM Store_Information
"New Sales" 是用到 CASE 那个栏位的栏位名。
结果:
store_name |
New Sales |
Date |
Los Angeles |
$3000 |
Jan-05-1999 |
San Diego |
$375 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
算排名
列出每一行的排名是一个常见的需求,可惜 SQL 并没有一个非常直接的方式达到这个需求。要以 SQL 列出排名,主要的概念是要做一个表格自我连结 (self join),将结果依序列出。然后算出每一行之前 (包括那一行本身) 有多少行数。
这样讲读者听得可能有点困惑。所以最好的方式是用一个实例来介绍。如果我们有下面的表格:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要找出每一行的排名。我们就打入下面的 SQL 语句:
SELECT a1.Name, a1.Sales, COUNT(a2.sales) Sales_Rank
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales <= a2.Sales OR(a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC, a1.Name DESC;
结果:
Name Sales Sales_Rank
Greg 50 1
Sophia 40 2
Stella 20 3
Jeff 20 3
Jennifer 15 5
John 10 6
我们先来看 WHERE 子句。在字句的第一部分(a1.Sales <= a2.Sales),我们算出有多少笔资料Sales 栏位的值是比自己本身的值小或是相等。
假设在 Sales 栏位中没有相同大小的资料。那这部分的 WHERE 子句本身就能够产生出正确的排名。
子句的第二部分,(a1.Sales=a2.Sales ANDa1.Name = a2.Name),则是让我们在 Sales 栏位中有相同大小的资料时 (像 Stella 及 Jeff 这两笔资料),仍然可以产生正确的排名。
算中位数
要算出中位数,我们必需要可以达成下面几个目标:
将资料依序排出,并找出每一行资料的排名。
找出『中间』的排名为何。举例来说。假设总共同拥有 9 笔资料。那中间排名就是5 (有 4 笔资料比第 5 笔资料大,有 4 笔资料比第 5 笔资料小)。
找出中间排名资料的值。
来看看下面的样例。如果我们有下面的表格:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要找出中位数。我们就键入:
SELECT Sales Median FROM
(SELECTa1.Name, a1.Sales, COUNT(a1.Sales) Rank
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales < a2.Sales OR(a1.Sales=a2.Sales AND a1.Name <=a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC) a3
WHERE Rank = (SELECT (COUNT(*)+1) DIV 2 FROM Total_Sales);
结果:
Median
20
读者将会发现。第 2 行到第 6 行是跟产生 排名 的语句全然一样。第 7 行则是算出中间的排名。DIV 是在 MySQL 中算出商的方式。
在不同的数据库中会有不同的方式求商。第 1 行则是列出排名中间的资料值。
算累积总计
算出累积总计是一个常见的需求,可惜以 SQL 并没有一个非常直接的方式达到这个需求。要以 SQL 算出累积总计,基本上的概念与列出排名类似:第一是先做个表格自我连结 (self join),然后将结果依序列出。在做列出排名时,我们算出每一行之前 (包括那一行本身) 有多少行数;而在做累积总计时,我们则是算出每一行之前 (包括那一行本身) 的总合。
来看看下面的样例。如果我们有下面的表格:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要算出累积总计。我们就键入:
SELECT a1.Name, a1.Sales, SUM(a2.Sales) Running_Total
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales <= a2.sales OR(a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC, a1.Name DESC;
结果:
Name Sales Running_Total
Greg 50 50
Sophia 40 90
Stella 20 110
Jeff 20 130
Jennifer 15 145
John 10 155
在以上的 SQL 语句中, WHERE 子句和 ODER BY 子句让我们可以在有反复值时可以算出正确的累积总计。
算总合百分比
要用 SQL 算出总合百分比,我们须要用到算排名和累积总计的概念。以及运用子查询的做法。
在这里,我们把子查询放在外部查询的 SELECT 子句中。
让我们来看下面的样例:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要算出总合百分比,我们键入:
SELECT a1.Name, a1.Sales, a1.Sales/(SELECTSUM(Sales) FROM Total_Sales) Pct_To_Total
FROM Total_Sales a1, Total_Sales a2
WHERE a1.Sales <= a2.sales OR(a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name, a1.Sales
ODER BY a1.Sales DESC, a1.Name DESC;
结果:
Name Sales Pct_To_Total
Greg 50 0.3226
Sophia 40 0.2581
Stella 20 0.1290
Jeff 20 0.1290
Jennifer 15 0.0968
John 10 0.0645
"SELECTSUM(Sales) FROM Total_Sales" 这一段子查询是用来算出总合。
总合算出后,我们就行将每一行一一除以总合来求出每一行的总合百分比。
算累积总合百分比
要用 SQL 累积总合百分比算出,我们运用类似总合百分比的概念。两者的不同处在于在这个情况下,我们要算出到眼下为止的累积总合是全部总合的百分之几,而不是光看每一笔资料是全部总合的百分之几。让我们来看看下面的样例:
Total_Sales 表格
Name |
Sales |
John |
10 |
Jennifer |
15 |
Stella |
20 |
Sophia |
40 |
Greg |
50 |
Jeff |
20 |
要算出累积总合百分比,我们键入:
SELECT a1.Name, a1.Sales,SUM(a2.Sales)/(SELECT SUM(Sales) FROM Total_Sales) Pct_To_Total
FROM Total_Sales a1,Total_Sales a2
WHERE a1.Sales <=a2.sales OR (a1.Sales=a2.Sales AND a1.Name = a2.Name)
GROUP BY a1.Name,a1.Sales
ODER BY a1.Sales DESC, a1.Name DESC;
结果:
Name Sales Pct_To_Total
Greg 50 0.3226
Sophia 40 0.5806
Stella 20 0.7097
Jeff 20 0.8387
Jennifer 15 0.9355
John 10 1.0000
"SELECTSUM(Sales) FROM Total_Sales" 这一段子查询是用来算出总合。我们接下来用累积总计 "SUM(a2.Sales)" 除以总合来求出每一行的累积总合百分比。
数据类型
1. SQL SERVER的数据类型
SQLServer 提供了 25 种数据类型:
·Binary [(n)]
·Varbinary [(n)]
·Char [(n)]
·Varchar[(n)]
·Nchar[(n)]
·Nvarchar[(n)]
·Datetime
·Smalldatetime
·Decimal[(p[,s])]
·Numeric[(p[,s])]
·Float[(n)]
·Real
·Int
·Smallint
·Tinyint
·Money
·Smallmoney
·Bit
·Cursor
·Sysname
·Timestamp
·Uniqueidentifier
·Text
·Image
·Ntext
(1)二进制数据类型
二进制数据包含 Binary、Varbinary和 Image
Binary 数据类型既能够是固定长度的(Binary),也能够是变长度的。
Binary[(n)] 是 n 位固定的二进制数据。当中。n 的取值范围是从 1到 8000。其存储窨的大小是n + 4 个字节。
Varbinary[(n)] 是 n 位变长度的二进制数据。当中,n 的取值范围是从 1到 8000。其存储窨的大小是n + 4个字节,不是n 个字节。
在 Image 数据类型中存储的数据是以位字符串存储的。不是由 SQL Server 解释的,必须由应用程序来解释。比如,应用程序能够使用BMP、TIEF、GIF 和 JPEG 格式把数据存储在Image 数据类型中。
(2)字符数据类型
字符数据的类型包含 Char。Varchar 和 Text
字符数据是由不论什么字母、符号和数字随意组合而成的数据。
Varchar 是变长字符数据。其长度不超过 8KB。Char 是定长字符数据,其长度最多为 8KB。超过 8KB 的ASCII 数据能够使用Text数据类型存储。比如。由于 Html 文档所有都是 ASCII 字符。而且在普通情况下长度超过 8KB,所以这些文档能够 Text 数据类型存储在SQLServer 中。
(3)Unicode 数据类型
Unicode 数据类型包含Nchar,Nvarchar 和Ntext
在 Microsoft SQL Server 中,传统的非 Unicode 数据类型同意使用由特定字符集定义的字符。
在 SQL Server安装过程中,同意选择一种字符集。使用 Unicode 数据类型,列中能够存储不论什么由Unicode 标准定义的字符。在Unicode 标准中。包含了以各种字符集定义的所有字符。
使用Unicode数据类型,所战胜的窨是使用非 Unicode 数据类型所占用的窨大小的两倍。
在 SQLServer 中。Unicode 数据以 Nchar、Nvarchar 和 Ntext 数据类型存储。使用这样的字符类型存储的列能够存储多个字符集中的字符。当列的长度变化时,应该使用Nvarchar 字符类型,这时最多能够存储 4000 个字符。当列的长度固定不变时,应该使用 Nchar 字符类型。相同,这时最多能够存储4000 个字符。当使用 Ntext 数据类型时,该列能够存储多于 4000 个字符。
(4)日期和时间数据类型
日期和时间数据类型包含 Datetime 和Smalldatetime两种类型
日期和时间数据类型由有效的日期和时间组成。比如。有效的日期和时间数据包含“4/01/98 12:15:00:00:00 PM”和“1:28:29:15:01AM 8/17/98”。前一个数据类型是日期在前,时间在后一个数据类型是霎时间在前,日期在后。
在 Microsoft SQL Server中,日期和时间数据类型包含Datetime 和 Smalldatetime 两种类型时,所存储的日期范围是从 1753 年 1 月 1 日開始,到9999年12 月 31 日结束(每个值要求 8 个存储字节)。使用 Smalldatetime 数据类型时,所存储的日期范围是 1900年 1 月 1日 開始。到 2079 年 12 月 31 日结束(每个值要求 4 个存储字节)。
日期的格式能够设定。设置日期格式的命令例如以下:
Set DateFormat {format | @format _var|
当中,format | @format_var 是日期的顺序。有效的參数包含 MDY、DMY、YMD、YDM、MYD 和 DYM。
在默认情况下。日期格式为MDY。
比如,当运行Set DateFormat YMD 之后,日期的格式为年 月 日 形式;当运行 Set DateFormat DMY 之后,日期的格式为日 月有年 形式
(5)数字数据类型
数字数据仅仅包括数字。
数字数据类型包括正数和负数、小数(浮点数)和整数
整数由正整数和负整数组成,比如 39、25、0-2 和 33967。
在Micrsoft SQL Server 中。整数存储的数据类型是 Int,Smallint和 Tinyint。
Int 数据类型存储数据的范围大于 Smallint 数据类型存储数据的范围,而 Smallint 据类型存储数据的范围大于Tinyint 数据类型存储数据的范围。使用 Int 数据狗昔存储数据的范围是从 -2 147 483 648 到 2 147483 647(每个值要求4个字节存储空间)。使用 Smallint 数据类型时,存储数据的范围从 -32 768 到 32 767(每个值要求2个字节存储空间)。
使用Tinyint 数据类型时。存储数据的范围是从0 到255(每个值要求1个字节存储空间)。
精确小娄数据在 SQL Server 中的数据类型是Decimal 和 Numeric。
这样的数据所占的存储空间依据该数据的位数后的位数来确定。
在SQLServer 中,近似小数数据的数据类型是 Float 和 Real。比如,三分之中的一个这个分数记作。3333333。当使用近似数据类型时能准确表示。
因此。从系统中检索到的数据可能与存储在该列中数据不全然一样。
(6)货币数据表示正的或者负的货币数量。
在 Microsoft SQL Server 中,货币数据的数据类型是Money 和Smallmoney
Money数据类型要求 8 个存储字节。Smallmoney 数据类型要求 4 个存储字节。
(7)特殊数据类型
特殊数据类型包含前面没有提过的数据类型。
特殊的数据类型有3种,即 Timestamp、Bit 和Uniqueidentifier。
Timestamp 用于表示SQLServer 活动的先后顺序,以二进投影的格式表示。
Timestamp 数据与插入数据或者日期和时间没有关系。
Bit 由 1 或者 0 组成。当表示真或者假、ON 或者 OFF 时,使用 Bit 数据类型。比如。询问是否是每一次訪问的客户机请求能够存储在这样的数据类型的列中。
Uniqueidentifier 由 16 字节的十六进制数字组成,表示一个全局唯一的。
当表的记录行要求唯一时,GUID是很实用。
比如。在客户标识号列使用这样的数据类型能够差别不同的客户。
2.用户定义的数据类型
用户定义的数据类型基于在 Microsoft SQL Server 中提供的数据类型。当几个表中必须存储同一种数据类型时。而且为保证这些列有同样的数据类型、长度和可空性时,能够使用用户定义的数据类型。
比如,可定义一种称为 postal_code 的数据类型。它基于 Char 数据类型。
当创建用户定义的数据类型时。必须提供三个数:数据类型的名称、所基于的系统数据类型和数据类型的可空性。
(1)创建用户定义的数据类型
创建用户定义的数据类型能够使用 Transact-SQL 语句。系统存储过程sp_addtype 能够来创建用户定义的数据类型。
其语法形式例如以下:
sp_addtype{type},[,system_data_bype][,'null_type']
当中。type 是用户定义的数据类型的名称。system_data_type 是系统提供的数据类型,比如 Decimal、Int、Char等等。null_type 表示该数据类型是怎样处理空值的,必须使用单引號引起来,比如'NULL'、'NOTNULL'或者'NONULL'。
样例:
Use cust
Exec sp_addtype ssn,'Varchar(11)',"Not Null'
创建一个用户定义的数据类型 ssn。其基于的系统数据类型是变长为11 的字符,不同意空。
样例:
Use cust
Exec sp_addtype birthday,datetime,'Null'
创建一个用户定义的数据类型 birthday,其基于的系统数据类型是 DateTime。同意空。
样例:
Use master
Exec sp_addtype telephone,'varchar(24),'Not Null'
Eexc sp_addtype fax,'varchar(24)','Null'
创建两个数据类型。即telephone 和 fax
(2)删除用户定义的数据类型
当用户定义的数据类型不须要时,可删除。删除用户定义的数据类型的命令是 sp_droptype {'type'}。
样例:
Use master
Exec sp_droptype 'ssn'
注意:当表中的列还正在使用用户定义的数据类型时,或者在其上面还绑定有默认或者规则时。这样的用户定义的数据类型不能删除。
SQL SERVER的字段类型说明
下面为SQL SERVER7.0以上版本号的字段类型说明。SQL SERVER6.5的字段类型说明请參考SQL SERVER提供的说明。
字段类型 描写叙述
bit 0或1的整型数字
int 从-2^31(-2,147,483,648)到2^31(2,147,483,647)的整型数字
smallint 从-2^15(-32,768)到2^15(32,767)的整型数字
tinyint 从0到255的整型数字
decimal 从-10^38到10^38-1的定精度与有效位数的数字
numeric decimal的同义词
money 从-2^63(-922,337,203,685,477.5808)到2^63-1(922,337,203,685,477.5807)的货币数据,最小货币单位千分之十
smallmoney 从-214,748.3648到214,748.3647的货币数据。最小货币单位千分之十
float 从-1.79E+308到1.79E+308可变精度的数字
real 从-3.04E+38到3.04E+38可变精度的数字
datetime 从1753年1月1日到9999年12日31的日期和时间数据。最小时间单位为百分之三秒或3.33毫秒
smalldatetime 从1900年1月1日到2079年6月6日的日期和时间数据。最小时间单位为分钟
timestamp 时间戳,一个数据库宽度的唯一数字
uniqueidentifier 全球唯一标识符GUID
char 定长非Unicode的字符型数据,最大长度为8000
varchar 变长非Unicode的字符型数据,最大长度为8000
text 变长非Unicode的字符型数据,最大长度为2^31-1(2G)
nchar 定长Unicode的字符型数据,最大长度为8000
nvarchar 变长Unicode的字符型数据。最大长度为8000
ntext 变长Unicode的字符型数据,最大长度为2^31-1(2G)
binary 定长二进制数据,最大长度为8000
varbinary 变长二进制数据,最大长度为8000
image 变长二进制数据,最大长度为2^31-1(2G)
SQL语法
SELECT
SELECT "栏位" FROM "表格名"
DISTINCT
SELECT DISTINCT"栏位"
FROM "表格名"
WHERE
SELECT "栏位"
FROM "表格名"
WHERE "condition"
AND /OR
SELECT "栏位"
FROM "表格名"
WHERE "简单条件"
{[AND|OR] "简单条件"}+
In
SELECT "栏位"
FROM "表格名"
WHERE "栏位" IN ('值1', '值2', ...)
Between
SELECT "栏位"
FROM "表格名"
WHERE "栏位" BETWEEN '值1' AND'值2'
Like
SELECT "栏位"
FROM "表格名"
WHERE "栏位" LIKE {模式}
ODER BY
SELECT "栏位"
FROM "表格名"
[WHERE"条件"]
ODER BY "栏位" [ASC, DESC]
Count
SELECT COUNT("栏位")
FROM "表格名"
GROUP BY
SELECT "栏位1", SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING
SELECT "栏位1", SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING (函数条件)