• 利用 UDF 轻松迁移


    位运算、布尔运算和逐位运算的乐趣

    如果您正从支持位运算、布尔运算以及一些函数的数据库迁移到 IBM® DB2® Universal Database™(UDB),那么您也许会对如何在 DB2 中处理这些类型和函数感到困惑。本文作者提出了一种方法,这个方法中包括使用约束条件或触发器创建的表,表中包含类似于位(bit-like)的数据类型的列或布尔数据类型的列;该方法还包含一组用户定义函数(UDF),用于支持模仿位数据或布尔数据类型的行为的逐位运算和布尔运算。

    简介

    许多关系数据库(包括 Sybase、Oracle、Microsoft® SQL Server 和 Informix®)都支持位数据类型或布尔(Boolean)数据类型的列,并为这些数据类型提供了逐位(bitwise)函数或布尔(Boolean)函数。T-SQL 也提供了逐位(bitwise)运算 —— integer、smallint 和 tinyint 数据类型之间进行的 AND、OR、NOT、EXCLUSIVE OR 运算;而 PL/SQL 支持 BITAND —— 或用于 integer 数据类型的逻辑 AND。DB2 UDB 没有为位数据类型或布尔数据类型提供本机支持,它既不支持逐位操作,也不支持布尔代数操作。

    本文将提供一种方法,该方法包括使用约束条件或触发器创建了一个表,表中包含类似于位(bit-like)或布尔数据类型的列;该方法还包括一组用户定义函数(UDF),用于支持模仿位数据或布尔数据类型的行为的逐位运算和布尔运算。本文还提供了一组在整型变量之间执行逐位运算的 UDF。

    模仿 T-SQL 位数据类型

    以下是 T-SQL 参考中对位数据类型的定义:“使用位列(bit column)来获得真(true)和假(false)数据类型,或是(yes)和否(no)的数据类型。位列保存 0 或 1。位列接受 0 或 1 之外的整数值,但总是将它解释为 1。位(bit)数据类型的列不能为 NULL,且不能对其进行索引。”

    例如,我们有一个表,它在 Sybase 或 SQL Server 数据库中的声明如下:

    create table mytab 
               (custname varchar(30) not null,
                age  integer not null,
                flag1 bit not null,
                flag2 bit not null)

    可以使用 DB2 SMALLINT 数据类型和 NOT NULL 约束条件,将该表转换成 DB2:

          CREATE TABLE mytab
           (name varchar(30) not null,
            age  int not null,
            flag1 smallint NOT NULL,      
            flag2 smallint NOT NULL);

    同时,我们还需要强制实施特殊规则,以复制 T-SQL 处理位数据类型列的方式。在位数据类型的定义中:“位列保存 0 或 1,它也接受 0 或 1 之外的整数值,但总是将该值解释为 1。”例如,在 Sybase 和 Microsoft SQL Server 中,如果向位列插入值 10,那么它将被解释为 1,而该列将保存值 1。为了确保列 flag1 和 flag2 只保存 1 或 0(无论 INSERT 语句中提供的是何值),需要创建下列 INSERT 触发器:

    CREATE TRIGGER DB2ADMIN.INSFORBIT
         NO CASCADE BEFORE INSERT ON DB2ADMIN.MAR1
         REFERENCING  NEW AS new 
         FOR EACH ROW  MODE DB2SQL 
         BEGIN ATOMIC
               if new.c2 <>0 then set new.c2 = 1;
               end if;
         END

    该触发器将确保 0 之外的任何值都被解释为 1。您还需要为 UPDATE 操作创建一个类似的触发器,以确保位列上的值是正确的。

    现在,我们需要提供逐位运算函数:& (and)、| (or)、^ (exclusive or)、or ~ (not)。实质上,我们需要编写一组 UDF,实现下列位操作真值表。

    & (and) 1 0
    1 1 0
    0 0 0
    | (or) 1 0
    1 1 1
    0 1 0
    ^ (exclusive or) 1 0
    1 0 1
    0 1 0
    ~ (not)  
    1 FALSE
    0 0

    以下就是这组 UDF:

    CREATE FUNCTION DB2ADMIN.BIT_AND(X smallint, Y smallint)
        RETURNS INTEGER
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    F1: BEGIN ATOMIC
        IF x =1 and y = 1 THEN
          RETURN 1 ;
        ELSEIF (x < 0 or x > 1) or (y < 0 or y > 1) THEN
    SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENTS VALUE ACCEPTED';
        ELSE RETURN 0;
        END IF;
    END

    请注意,我们通过在变量不为 1 或 0 时发出应用程序错误来限制变量值。

    CREATE FUNCTION DB2ADMIN.BIT_OR(X smallint, Y smallint)
        RETURNS INTEGER
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    BEGIN ATOMIC
        IF x =0  AND y = 0 THEN
          RETURN 0;
        ELSEIF (x < 0 or x > 1) or (y < 0 or y > 1) THEN
          SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENTS VALUE ACCEPTED';
        ELSE RETURN 1;
        END IF;
    END                
    CREATE FUNCTION DB2ADMIN.EXCLUSIVE_OR(X smallint, Y smallint)
        RETURNS INTEGER
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    F1: BEGIN ATOMIC
        IF (x < 0 or x > 1) or (y < 0 or y > 1) THEN
          SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENTS VALUE ACCEPTED';
        ELSEIF (x = y) THEN
           RETURN 0;
        ELSE RETURN 1;
        END IF;
    END                 
    CREATE FUNCTION DB2ADMIN.bit_not(x smallint  )
        RETURNS INTEGER
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    F1: BEGIN ATOMIC
        IF x = 1 THEN
          RETURN 0;
         ELSEIF  (x < 0 or x > 1)  THEN
            SIGNAL SQLSTATE '77701' SET MESSAGE_TEXT ='ONLY 1 OR 0 ARGUMENT VALUE ACCEPTED';
        ELSE
          RETURN 1;
        END IF;
    END

    现在,通过 mytab 表定义,我们可以使用以上 UDF 将 T-SQL 语句转换成 DB2 。

    T-SQL SQL 语句:

    select flag1&flag2 from mytab where custname = 'JOHN SMITH'

    将被转换成 DB2 为:

    SELECT  bit_and(flag1,flag2) FROM  mytab where custname = 'JOHN SMITH';

    T-SQL SQL 语句:

    select flag1 | flag2 from mytab where custname = 'SAM BROWN'

    将被转换成 DB2 为:

    SELECT  bit_or(flag1,flag2) where mytab where custname = 'SAM BROWN';

    模仿 Oracle 的布尔数据类型

    让我们考虑下列需要转换成 DB2 UDB 的 PL/SQL 代码。

    我们有一个 Oracle 表,如下所示:

            create table myOracle_tab 
              (custname varchar(30) not null,
                age  integer not null,
                flag1  BOOLEAN,
                flag2  BOOLEAN);

    并且具有下列 PL/SQL SQL 语句,可以使用它们在列 flag1 和 flag2(均为 BOOLEAN 数据类型)上进行运算:

         select flag1 AND flag2 from mytab where custname = 'JOHN SMITH';
         select flag1 OR  flag2  from mytab where custname = 'SAM BROWN';

    DB2 smallint 数据类型可用于转换 Oracle Boolean 数据类型。PL/SQL 支持下列用于布尔(Boolean)列的值 —— TRUE、FALSE 和 NULL。我们可以用 1 表示 TRUE,0 表示 FALSE,并允许该列为空。以下展示了可以如何转换 CREATE TABLE myOracle_tab 语句:

       create table myOracle_tab
       (name    char(20),
        boolcol smallint constraint  bool_cnst check (c2 in(0,1)));

    bool_cnst 将确保所插入的值只能是 0 或 1。如果没有提供任何值,则该列将为 NULL。

    PL/SQL 支持三种操作符 —— AND、OR 和 NOT,对布尔变量进行运算并返回布尔值。为了将该行为转换到 DB2 中,我们需要创建 UDF 来支持布尔逻辑运算。

    x y x AND y x OR y NOT x
    TRUE TRUE TRUE TRUE FALSE
    TRUE FALSE FALSE TRUE FALSE
    TRUE NULL NULL TRUE FALSE
    FALSE TRUE FALSE TRUE TRUE
    FALSE FALSE FALSE FALSE TRUE
    FALSE NULL FALSE NULL TRUE
    NULL TRUE NULL TRUE NULL
    NULL FALSE FALSE NULL NULL
    NULL NULL NULL NULL NULL

    下列 UDF 将实现以上运算:

      CREATE FUNCTION DB2ADMIN.bool_and(x smallint, y smallint)
        RETURNS SMALLINT
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    F1: BEGIN ATOMIC
        IF x IS NULL OR  y IS NULL THEN
        ELSEIF  x =1 AND  y = 1 THEN
          RETURN 1 ;
        ELSE RETURN 0;
        END IF;
    END           
     CREATE FUNCTION DB2ADMIN.bool_NOT(x smallint)
        RETURNS SMALLINT
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    BEGIN ATOMIC
        IF x IS NULL THEN
            RETURN  NULL;
        ELSEIF  x=1 THEN RETURN 0;
        ELSE RETURN 1;
       END IF;  
    END  
    CREATE FUNCTION DB2ADMIN.bool_or(x smallint, y smallint)
        RETURNS SMALLINT
    ------------------------------------------------------------------------
    -- SQL UDF (Scalar)
    ------------------------------------------------------------------------
    BEGIN ATOMIC
        IF x = 1  THEN  RETURN 1;
        ELSEIF x = 0 THEN
             RETURN  y;
        ELSEIF  y = 1  THEN RETURN 1;
        ELSE RETURN  NULL;
       END IF;
    END

    Oracle SQL 语句:

    select flag1 AND flag2 from mytab where custname = 'JOHN SMITH'

    将被转换成 DB2 为:

    SELECT  bool_and(flag1,flag2) FROM mytab where custname = 'JOHN SMITH';

    Oracle SQL 语句:

    select flag1  OR  flag2 from mytab where custname = 'SAM BROWN'

    将被转换成 DB2 为:

    SELECT bool_or(flag1,flag2) FROM  mytab where custname = 'SAM BROWN';

    用于整型变量的逐位操作

    正如简介中提到的,PL/SQL 和 T-SQL 支持声明为 integer 的变量之间的逐位运算。逐位运算在其二进制形式的整型变量上执行逻辑 AND、OR、EXLUSIVE OR 和 NOT 运算。

    让我们看一个它是如何工作的特定例子。假设我们需要在 110 和 85 这两个整数之间执行逻辑 AND 和逻辑 OR 运算。

    首先,要将这两个数字转换成二进制数字,然后通过真值表对每一个位进行 AND 和 OR 运算,最后将二进制结果还原成整型数字。

    整数                     二进制形式
          
       110                    1101110
        85                    1010101
        ----           逻辑 AND
        64                    1000100
     
    整数                      二进制形式
          
       110                     1101110
        85                     1010101
        -----          逻辑 OR
       127                     1111111

    对于无法在头脑中轻易将整型数字转换成二进制数字的人们来说,下列将整型转换成二进制的 UDF 也许对他们很有帮助。

    CREATE FUNCTION int_to_binary (N1 Integer)
     RETURNS varchar(32)
     LANGUAGE SQL
     SPECIFIC int2bin
    BEGIN ATOMIC
    DECLARE M1, i, len  Integer default 0;
    DECLARE  temp_str varchar(32) default ' ';
    DECLARE  result_str varchar(32) default ' ';
      SET M1 = N1;
      WHILE  M1 > 0  DO
       SET temp_str = temp_str || cast(mod(m1,2) as char(1));
       set m1 = m1/2;
      END WHILE;
        set len = length (temp_str);
        while i < len do
           set result_str = result_str || substr(temp_str,len-i,1);
           set i = i+1;
        end while;
    RETURN result_str;
    END

    既然已经了解了逐位运算和变量转换的定义,那么我们现在就可以提供 DB2 UDF 来支持这些操作了。

    为了将应用程序从 Oracle 转换成 DB2,Takashi Tokunaga 编写了一个函数来支持 BITAND,而且还提供了其他一些有用的迁移 UDF:http://www.ibm.com/developerworks/db2/library/samples/db2/0205udfs/index.html

    为了完整起见,下面还提供了该函数的代码:

    CREATE FUNCTION BITAND (N1 Integer, N2 Integer)
     RETURNS Integer
     LANGUAGE SQL
     SPECIFIC BITANDOracle
     CONTAINS SQL
     NO EXTERNAL ACTION
     DETERMINISTIC
    BEGIN ATOMIC
    DECLARE M1, M2, S Integer;
    DECLARE RetVal Integer DEFAULT 0;
    SET (M1, M2, S) = (N1, N2, 0);
    WHILE M1 > 0 AND M2 > 0 AND S < 32 DO
       SET RetVal = RetVal + MOD(M1,2)*MOD(M2,2)*power(2,S);
       SET (M1, M2, S) = (M1/2, M2/2, S+1);
    END WHILE;
    RETURN RetVal;
    END

    现在,让我们从 CLP 提示符调用该函数:

    C:Program FilesIBMSQLLIBBIN>db2 values bitand(110,85)
    1
    -----------
             68
    1 record(s) selected.

    为了支持从 Sybase 和 Microsoft SQL Server 进行迁移,需要具有那些用于 BITOR、EXLUSIVE OR 和 NOT 的 UDF。以下是 BITOR UDF:

    CREATE FUNCTION BITOR (N1 Integer, N2 Integer)
     RETURNS Integer
     LANGUAGE SQL
     SPECIFIC BITORCONV  
    BEGIN ATOMIC
    DECLARE M1, M2, S , temp1 Integer;
    DECLARE RetVal Integer DEFAULT 0; 
    SET (M1, M2, S) = (N1, N2, 0);   
    WHILE ( M1 > 0 OR M2 >  0) AND S < 32 DO  
      SET temp1 = bit_or(mod(m1,2),mod(m2,2));
      SET RetVal = RetVal + temp1*power(2,S);
      SET (M1, M2, S) = (M1/2, M2/2, S+1);
    END WHILE;   
    RETURN RetVal;
    END

    注意,该函数使用了我们编写的 BIT_OR UDF 对类似于位数据类型的参数进行运算。

    现在,让我们从 CLP 调用这个函数:

    C:Program FilesIBMSQLLIBBIN>db2 values bitor(110,85)
    1
    -----------
            127
    1 record(s) selected.

    下一个 UDF 在给定的两个整数值之间执行 EXLUSIVE OR 运算,这两个值已经被转换成二进制形式:

    CREATE FUNCTION BIT_EXLOR (N1 Integer, N2 Integer)
     RETURNS Integer
     LANGUAGE SQL
     SPECIFIC BITOREXL
    BEGIN ATOMIC
    DECLARE M1, M2, S, temp1 Integer;
    DECLARE RetVal Integer DEFAULT 0;
    SET (M1, M2, S) = (N1, N2, 0);
    WHILE ( M1 > 0 OR M2 > 0 ) AND S < 32 DO
       SET temp1 = EXCLUSIVE_OR(smallint(mod(m1,2)),smallint(mod(m2,2)));
       SET RetVal = RetVal + temp1*power(2,S);
       SET (M1, M2, S) = (M1/2, M2/2, S+1);
    END WHILE;
    RETURN RetVal;
    END

    同样,该函数使用前面提供的函数 EXLUSIVE_OR,并且可以按如下方式执行:

    C:Program FilesIBMSQLLIBBIN>db2 values bit_exlor (110,85)
    1
    -----------
             59
    1 record(s) selected.

    为了验证该函数确实按照所设计的方式工作,我们需要再次将每个整型数字转换成二进制数字,对每一个位执行 EXLUSIVE OR 运算,然后将结果还原成 INTEGER:

    整型                二进制形式
    
    110                   1101110
    85                    1010101
    ----   Exclusive OR
    59	                 0111011

    下一个也是最后一个涉及逐位运算的 UDF 是逐位 NOT 运算,在转换成二进制表达式时,该 UDF 对给定的整数值执行逐位逻辑 NOT 运算。

    CREATE FUNCTION BITWISE_not (N1 Integer)
     RETURNS Integer
     LANGUAGE SQL
     SPECIFIC BITWNOT
    BEGIN ATOMIC
    DECLARE M1, S , temp1 Integer;
    DECLARE RetVal Integer DEFAULT 0;
    SET (M1, S) = (N1,  0);
    WHILE  M1 > 0 AND S < 32 DO
      SET temp1 = bit_not(mod(m1,2));
      SET RetVal = RetVal + temp1*power(2,S);
       SET (M1,   S) = (M1/2,   S+1);
    END WHILE;  
    RETURN RetVal;
    END

    下面展示了它是如何工作的:

    C:Program FilesIBMSQLLIBBIN>db2 values bitwise_NOT(110)
    1
    -----------
             17
    1 record(s) selected.
        整型    二进制形式
      
          110     1101110
      ---          逻辑 NOT
           17	 0010001

    结束语

    模仿位和布尔数据类型以及函数并非一定是一个挑战性的过程。使用本文中所谈论的 UDF 和触发器,您可以很轻松地将数据和应用程序迁移到 DB2 Universal Database 中。

    原文链接:http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0504greenstein/

  • 相关阅读:
    学习hadoop
    贵在坚持
    保护好自己的毕业论文
    博客园与CSDN的选择
    Matlab中的“prod”函数
    js实现HashMap()
    js常用正则表达式
    苹果手机使用替代onkeyup的方法
    keydown
    ArrayAndString(数组和字符串)
  • 原文地址:https://www.cnblogs.com/aikongmeng/p/3697302.html
Copyright © 2020-2023  润新知