《SQL Server 2012 T-SQL基础》读书笔记

《SQL Server 2012 T-SQL基础》读书笔记
Chapter 10 Programmable Objects

声明和赋值一个变量：
```
DECLARE @i AS INT;
SET @i = 10;
```
变量可以让你暂时存一个值进去，然后之后再用，作用域是同一个Batch（批处理）。
也可以这么用：
```
DECLARE @firstname AS NVARCHAR(10), @lastname AS NVARCHAR(20);
SELECT
  @firstname = firstname,
  @lastname = lastname
FROM HR.Employees
```
一个batch是从客户端发送到SQL Server的一条或多条T-SQL语句，作为一个单独的单元（我的理解就是作为一个整体）来解析并执行。batch经历的阶段有：语法分析，解析（检查引用的对象和列是否存在），检查是否有访问权限，优化。
batch和transaction（事务）是完全不同的概念。一个Batch里可以有很多个事务；也可以把一个事务分散到很多个batch里去。上面的加粗部分是我自己感觉的batch和事务的区别。
像SSMS这种客户端工具有GO这个命令，这个命令signals the end of a batch（是一个batch结束的信号）。注意：GO命令是一个客户端命令而不是一个T-SQL Server命令。GO可以加参数，比如GO 100就是执行一百次这个batch。像ADO.NET这些框架也会提供方法for submitting a batch of code to SQL Server for execution（用于提交一个batch的代码到SQL Server执行）。
举个例子：
```
-- Valid batch
PRINT 'First batch';
USE TSQL2012;
GO
-- Invalid batch
PRINT 'Second batch';
SELECT custid FROM Sales.Customers;
SELECT orderid FOM Sales.Orders;
GO
-- Valid batch
PRINT 'Third batch';
SELECT empid FROM HR.Employees;
```
注意第二个batch里面有个语法错误（FROM拼成了FOM），所以这整一个batch都没有被提交到 SQL Server执行（the whole batch is not submitted to SQL Server for execution），也就是说它的两个SELECT都没有被执行，而它前后两个Batch都被执行了。
规定有一些语句（大多是CREATE）不能和其他语句一起处于同一个批处理。
由于批处理中的语句作为一个整体进行解析，所以比如以下SQL语句：
```
ALTER TABLE dbo.T1 ADD col2 INT;
SELECT col1, col2 FROM dbo.T1;
```
如果以上两条语句作为一个batch的话，会解析失败。因为解析的时候还没有真正执行，所以解析到SELECT那句的时候，col2并不存在。所以应该在SELECT前面加个GO。

控制流：
IF...ELSE...。如果IF里面的东西算出来是FALSE或者UNKNOWN，那么就会运行ELSE块。所以注意NULL的情况。如果你要写多个语句，那么要用BEGIN，END，其实就相当于编程语言里面的大括号，比如：
```
IF DAY(SYSDATETIME()) = 1
BEGIN
  PRINT '....';
  PRINT '....';
END
ELSE
BEGIN
  PRINT '....';
  PRINT '....';
END
```
可以ELSE IF，也可以嵌套IF ELSE。

WHILE里面可以BREAK和CONTINUE，语法如下：
```
DECLARE @i AS INT = 1;
WHILE @i <= 10
BEGIN
  IF @i = 6 BREAK;
  PRINT @i;
  SET @i = @i + 1;
END;
```
输出1 2 3 4 5。

游标（Cursor）：一个没有ORDER BY的query返回一个set（或multiset），而一个带ORDER BY的query返回一个游标。T-SQL提供一个游标对象，可以让你从一个query的结果集中一行一行地处理，并根据指定顺序。作者不建议使用游标，原因如下：1.违背了集合论 2.造成性能损失 3.可读性不好。所以能不用尽量不用。用游标好比钓鱼，而用集合就像用网捕鱼。一般是当需要对每一行都做点工作的时候，才使用游标。例子不写了，需要的时候参考吧。

SQL Server提供了三种临时表：local temporary tables, global temporary tables, and table variables。他们都是被创建在tempdb数据库中。当你需要存储某些中间结果，或者说某个查询很昂贵，而且你要多次查询的话，可以考虑临时表。

一个local temporary table的scope有点类似于编程语言中的local variable，比如四个存储过程：Proc1调用Proc2，Proc2调用Proc3，Proc3调用Proc4，如果在Proc2中创建了一个local temporary table（并且在调用Proc3之前），那么这个临时表对Proc2,3,4都是可见的，但对Proc1不可见，Proc2完成时会被自动销毁。范围最大大到当前session。创建临时表只要把它命名为#tablename：
```
IF OBJECT_ID('tempdb.dbo.#MyOrderTotalsByYear') IS NOT NULL
  DROP TABLE dbo.#MyOrderTotalsByYear;
GO

CREATE TABLE #MyOrderTotalsByYear
(
  orderyear INT NOT NULL PRIMARY KEY,
  qty INT NOT NULL
);
```
然后就可以像普通表一样用了：
```
INSERT INTO #MyOrderTotalsByYear(orderyear, qty)
  SELECT
    YEAR(O.orderdate) AS orderyear,
    SUM(OD.qty) AS qty
  FROM Sales.Orders AS O
  JOIN Sales.OrderDetails AS OD
    ON OD.orderid = O.orderid
  GROUP BY YEAR(orderdate);
```
如果你从另一个session想访问这个临时表的话，你做不到。

Global Temporary Tables对所有session可见，当创建这个table的session断开连接，并且there are no active references to the table（没有对这个table有效的引用）时，被自动销毁。创建的时候只要##tablename就行了：
```
CREATE TABLE dbo.##Globals
(
  id sysname NOT NULL PRIMARY KEY,
  val SQL_VARIANT NOT NULL
);
```
一般是当你想跟别人共享的时候用。

Table variables有点类似于local temporary tables，它会被存到tempdb中，而不是只存在于内存中。但是它的scope更有限：只对当前Batch可见，对之后调用的，比如别的存储过程都不可见。如果回滚事务，对temporary tables的修改会被roll back，但对table variables的已经完成的修改不会被roll back。创建语法如下：
```
DECLARE @MyOrderTotalsByYear TABLE
(
  orderyear INT NOT NULL PRIMARY KEY,
  qty INT NOT NULL
);
```
由于性能的原因，数据量小的话就用table variable，否则用local temporary tables。

SQL Server 2008及以上支持Table Types，比如：
```
CREATE TYPE dbo.OrderTotalsByYear AS TABLE
(
  orderyear INT NOT NULL PRIMARY KEY,
  qty INT NOT NULL
);
```
然后你就可以：DECLARE @MyOrderTotalsByYear AS dbo.OrderTotalsByYear;
Table Types不仅可以用来定义Table，也可以作为存储过程和用户自定义函数的输入参数的类型。

SQL Server允许你创建一个字符串，这个字符串里面是a batch of T-SQL语句，然后可以执行它，这个叫dynamic SQL。可以用EXEC这个命令，它接受一个字符串：
```
DECLARE @sql AS VARCHAR(100);
SET @sql = 'PRINT ''This message was printed by a dynamic SQL batch.'';';
EXEC(@sql);
```
也可以用sp_executesql这个存储过程，首先看一下用法：
```
DECLARE @sql AS NVARCHAR(100);

SET @sql = N'SELECT orderid, custid, empid, orderdate
FROM Sales.Orders
WHERE orderid = @orderid;';

EXEC sp_executesql
  @stmt = @sql,
  @params = N'@orderid AS INT',
  @orderid = 10248;
```
结果：

orderid custid empid orderdate

10248 85 5 2006-07-04 00:00:00.000

@stmt就是你要执行的字符串，@params是输入和输出参数的声明，然后给这些声明的参数赋值（逗号隔开）。那么用这个sp_executesql有什么好处？一是可以防止SQL注入，因为用户输入只能作为操作数（通过 @params）。二是可以复用cached execution plans。cached execution plans就是一个physical processing plan，SQL Server为了某个query产生的，它包括一些列指令：用什么索引、什么算法、目标是哪个表什么的。如果一个query跟以前执行过的某个query一模一样，那么这个cached execution plan就可以得到复用，所以说最好的可以复用cached execution plan的方法就是一个接受输入参数的存储过程，因为即使参数变了，query string不变。类似地，用sp_executesql也会增加复用cached execution plans的机会。

Using PIVOT with Dynamic SQL这部分跳过

Routines（例程）是为了计算结果或者执行任务而对代码封装的可编程对象，SQL Server支持三种Routine：user-defined functions, stored procedures, and triggers。
SQL Server提供给你两种选择来develop一个routine：T-SQL或者.NET code。如果有很多data manipulation，T-SQL更好；如果有很多iterative logic（估计就是foreach这种）, 字符串操作或者很密集的计算的时候，.NET code更好。

User-Defined Functions用作封装一些计算某些结果的逻辑，我们简称UDF。UDF不允许有side effects，比如修改数据库里的数据，以及一些会导致副作用的函数：比如RANK和NEWID。用法：
```
CREATE FUNCTION dbo.GetAge
(
  @birthdate AS DATE,
  @eventdate AS DATE
)
RETURNS INT
AS
BEGIN
  RETURN 基于输入参数做一些计算得到一个值
END;
END;
```
然后就可以用了：
```
SELECT empid, dbo.GetAge(birthdate, SYSDATETIME()) AS age
FROM HR.Employees;
```
除了返回一个scalar，也可以返回一个table value，这样的话就可以被用在FROM子句。

Stored Procedures比UDF更爽，因为可以包含副作用，也就是可以修改数据，对数据库构架进行修改什么的。相比普通的代码，存储过程的好处在于：封装了逻辑、可以对某个用户赋予可以调用某个存储过程的权限、可以提高性能（由于cached execution plan的复用）并减少网络间传输的数据量（因为你只要告诉数据库你想调用的存储过程名就行了）。用法举例：
```
CREATE PROC Sales.GetCustomerOrders
  @custid AS INT,
  @fromdate AS DATETIME = '19000101',   --设置默认值
  @todate AS DATETIME = '99991231',   --设置默认值
  @numrows AS INT OUTPUT  --这里的OUTPUT表示这个是输出参数
AS
SET NOCOUNT ON;   --意思是不要显示“多少行affected”的消息

SELECT orderid, custid, empid, orderdate
FROM Sales.Orders
WHERE custid = @custid
    AND orderdate >= @fromdate
    AND orderdate < @todate;
SET @numrows = @@rowcount;
```
使用：
```
DECLARE @rc AS INT;
EXEC Sales.GetCustomerOrders
  @custid = 1,
  @fromdate = '20070101',
  @todate = '20080101',
  @numrows = @rc OUTPUT;

SELECT @rc AS numrows;
```
结果：

Triggers（触发器）封装的代码是只有当某些个事件发生，才会被执行。SQL Server支持两种可以给触发器的事件：data manipulation events（DML，比如INSERT什么的）、data definition events（DDL，比如CREATE TABLE什么的）。在一个事务中，如果发生了某个会trigger某个触发器的事件，然后又roll back了，那么触发器造成的改变也会被roll back。在SQL Server中，一个语句触发一个触发器。举例：
```
CREATE TRIGGER trg_T1_insert_audit ON dbo.T1 AFTER INSERT
AS
SET NOCOUNT ON;

INSERT INTO dbo.T1_Audit(keycol, datacol)
  SELECT keycol, datacol FROM inserted;
GO
```
解释一下：trg_T1_insert_audit是触发器的名字。ON就是你要监听哪个表的事件。AFTER INSERT意思就是在INSERT之后触发（当然MERGE也有可能）。这里的AFTER也可以换成INSTEAD，可以用来代替相关的事件操作（但是书上没给例子），AFTER只能定义在持久化的表上，而INSTEAD可以定义在持久化的表和视图上。后面的FROM inserted的inserted是指有新值的表，也可以换成deleted，表示有老值的表。

再举一个基于DDL的例子（复习的时候可以直接跳过，自认为不太重要）：
```
CREATE TRIGGER trg_audit_ddl_events
  ON DATABASE FOR DDL_DATABASE_LEVEL_EVENTS
AS
SET NOCOUNT ON;

DECLARE @eventdata AS XML = eventdata();

INSERT INTO dbo.AuditDDLEvents(
  posttime, eventtype, loginname, schemaname,
  objectname, targetobjectname, eventdata)
  VALUES(
    @eventdata.value('(/EVENT_INSTANCE/PostTime)[1]', 'VARCHAR(23)'),
    @eventdata.value('(/EVENT_INSTANCE/EventType)[1]', 'sysname'),
    @eventdata.value('(/EVENT_INSTANCE/LoginName)[1]', 'sysname'),
    @eventdata.value('(/EVENT_INSTANCE/SchemaName)[1]', 'sysname'),
    @eventdata.value('(/EVENT_INSTANCE/ObjectName)[1]', 'sysname'),
    @eventdata.value('(/EVENT_INSTANCE/TargetObjectName)[1]', 'sysname'),
    @eventdata);
GO
```
ON DATABASE是指在数据库scope（还有个server scope，当你CREATE DATABASE的时候就是server scope），DDL_DATABASE_LEVEL_EVENTS是指所有的DDL事件。EVENTDATA()这个函数可以给你所有关于事件的信息（XML类型）。然后用XQuery表达式来提取其中的某些属性。然后你执行几个CREATE TABLE和ALTER TABLE的语句，然后再查一下：SELECT * FROM dbo.AuditDDLEvents;，得到结果：

（部分结果）

错误处理。语法如下：
```
BEGIN TRY
  PRINT 10/2;
  PRINT 'No error';
END TRY
BEGIN CATCH
  PRINT 'Error';
END CATCH;
```
执行的流程和编程语言中一模一样，所以不再赘述。错误处理中最常用的估计就是ERROR_NUMBER()函数，它会返回一个数字，代表某种错误，比如2627是主键冲突，具体查文档吧。还有其他很多函数，比如ERROR_MESSAGE()代表错误信息，ERROR_SEVERITY()代表严重程度，等等。SQL Server 2012开始也可以用THROW;来在CATCH块里面把异常re-throw出来。
相关阅读:
HDU 3746 Cyclic Nacklace 环形项链（KMP，循环节）
13 python 常用的内置方法介绍
 12、反射方法
 11 绑定方法与非绑定方法
 10 python 封装----@property的用法
 9 python 多态与多态类
 8 python 抽象类
 7 python 类的组合
 4.1、内建函数
 6 python 继承与派生
原文地址：https://www.cnblogs.com/raytheweak/p/7173102.html

《SQL Server 2012 T-SQL基础》读书笔记

Chapter 10 Programmable Objects