• 用perl做数据库迁移,从MSSQL到MYSQL(三)自动导数据,基本思想,拼SQL语句


    哎!这周末过得比上班还累,代码周五基本写完,一直没时间整理,今天晚上整理了发上来。

    哦,再次提醒一下哈,本代码是本人第一次写perl很多它的优良特性没用到,因此没能写出perl本应该有的优秀的,可爱的,外行看不大懂的代码。如有真心喜欢Perl的人,请不要见骂,请多多指教。

    #!/usr/bin/perl
    use DBI;
    use Switch;
    
    $dbh=DBI->connect('dbi:ODBC:##隐去的MSSQL访问ODBC连接##','##隐去的MSSQL访问用户名##','##隐去的MSSQL访问密码##');
    #获取所有的用户表,当然不想导的表,表名放到not in里边
    my $sth=$dbh->prepare("select name,object_id from sys.all_objects where type='U' and is_ms_shipped=0 and name not in
    ('sysdiagrams')");
    $sth->execute();
    my $false_Table;
    
    #遍历所有表,呵呵,这里啊,其实用另外一个方法更快。详细请参考:http://www.easysoft.com/developer/languages/perl/dbd_odbc_tutorial_part_2.html
    while (@data=$sth->fetchrow_array())
    {
        ##测试时用
    #    @data=$sth->fetchrow_array();
        ##这个是perl的异常处理,也是后边再加的,因为此次移植的时候,发现很多问题,开始在调试的时候,也没想过加异常处理,但后来发现这个调试的过程,
        ##实在太痛苦了,才查了资料加的,当然对异常处理,perl好像也有try catch~~但,粗粗翻了下资料,好像是python里边的(当然,这个好像是十分好像,)
        ##因为我觉得所有的计算机语言都是为了解决某一类问题的,先解决问题了,再去想解决~~因此没有深究。(哎!又啰嗦了)
        ##哦,资料地址如下:http://perldoc.perl.org/functions/eval.html  ,有志深入学习Perl的同学,可以把这个网站收藏了,基本(基本)相当于了MSDN。
        eval
        {
            #获取某个表的列,并构建 查询,插入,列总数,列类型
            ##输入参数如下:
            ###data[0]:表名,data[1]:对像ID
            ##返回参数描述如下:
            ###$select_columns:构建SELECT的时候,列字符串
            ###$insert_columns:构建insert的时候,列字符串。之所以要把这两分开,因为有些类型在select的时候,会用到列属性方法,例如geometry.STAsText()
            ###$column_count:列数,其实可以从@$column_types得到,但@$columns_types是后边加的,此参数也就没有去掉
            ###$sort_column:用来排序的字段,因为总结了一下,一般第一个字段都是标识字段,主键,因此,这里只取的第一个字段
            ###$columns_types:列的类型列表,一个数组。因为sql server里边的某些类型的值,在进mysql的时候,需要做处理,例如geometry
            #######另外再啰嗦一句,很少见有能同时返回多个值的东东(当然,可能是我把C#忘得差不多了)
            ($select_columns,$insert_columns,$column_count,$sort_column,$column_types)=get_columns($data[0],$data[1]);
            #查询结果。如果是导入失败,会返回False,否则为空
            ##传入参数?说明请参照上边的输出参数
            my $relt = export_data_in ($select_columns,$insert_columns,$column_count,$sort_column,$data[0],$column_types);
            if( $relt eq "False")
            {
                #记录所有未导入成功的表
                $false_Table = "$false_Table,$relt";
            }
        };
        ##如果捕获异常,记录下表名与错误。在本次数据迁移的过程中,有一种错误类型是捕获不到的“out of memory”,而这个异常又是本次数据库迁移中,遇到过最多的
        ##异常。因为表的列,很多都是nvarchar(max),其中有一张表最夸张有32列都是nvarchar(max)。最初遇到这个异常的时候,小弟历经磨难,找了很多方法,最后都不太
        ##凑效,于是,于是,我就有个邪恶的想法:找到现在内容最长的(max_length),然后把nvarchar(max)类型改为nvarchar(max_length+300),反正我们数据库用了差不多3年,
        ##我相信再过30年,这类型长度也就最多不过这样,永远不可能4096KB~~~(说这到里,想起DBA总在对字段长度锱铢必较,是很有道理的)
        if($@)
        {
             $false_Table = "\n$false_Table,$relt       ERROR:".$@;
        }
    }
    if($false_Table)
    {
        print "有下列表,数据未导入:$false_Table";
    }
    
    #插入数据的实体
    sub export_data_in
    {
        #构建SQL
        ($select_columns,$insert_columns,$columns_count,$sort_column,$table_name,$column_types) = @_;
        $rows_count=0;
        $dbh2=DBI->connect('dbi:ODBC:##隐去的MSSQL访问ODBC连接##','##隐去的MSSQL访问用户名##','##隐去的MSSQL访问密码##');
        my $sth_sc=$dbh2->prepare("select count(1) from $table_name");
        $sth_sc->execute();
        @data_count=$sth_sc->fetchrow_array();
        #测试语句,先不让其大于2000
        if(@data_count[0]>0)
        {
            @data_count[0]=20;
        }
        
        my $relt;
        if(@data_count[0]>2000)
        {
            $begin_cnt = 0;
            $end_cnt = 2000;
            while($begin_cnt <= @data_count[0])
            {
                ##先测试所有的表,加的测试SQL
                $sql_select="select top 10 $insert_columns  from $table_name";
                
                ##正式运行时SQL
    #            $sql_select="select $insert_columns 
    #            FROM 
    #            (
    #                SELECT $select_columns,ROW_NUMBER() OVER (ORDER BY $sort_column) AS RowNum
    #                FROM $table_name
    #            ) as t
    #            where t.RowNum  BETWEEN $begin_cnt and $end_cnt";
                
                ##提示信息
                print "exporting data $table_name;total:@data_count[0];now:$begin_cnt \n";
                ##导数据,输入参数?请按上边的
                $relt = export_data($table_name,$sql_select,$insert_columns,$columns_count,$column_types);
                
                $begin_cnt = $begin_cnt + 2001;
                $end_cnt = $end_cnt + 2001;
                if($relt eq "False")
                {
                    return $relt;
                }
            }
        }
        elsif(@data_count[0]>0)
        {
            ##测试SQL
            $sql_select = "select top 10 $select_columns from $table_name";
            ##正式SQL
    #        $sql_select = "select $select_columns from $table_name";
            print "exporting data $table_name;total:@data_count[0];now:$begin_cnt \n";
            ##导数据,输入参数?同上
            $relt = export_data($table_name,$sql_select,$insert_columns,$columns_count,$column_types);
        }
        $relt;
    }
    #其实,这个才是真正导数据的方法
    sub export_data
    {
    #    ($table_name,$sql_select,$insert_columns,$columns_count,@column_types)=($_[0],$_[1],$_[2],$_[3]);
        ($table_name,$sql_select,$insert_columns,$columns_count,$column_types)=@_;
        $dbh_mssql=DBI->connect('dbi:ODBC:##隐去的MSSQL访问ODBC连接##','##隐去的MSSQL访问用户名##','##隐去的MSSQL访问密码##');
        
        ##mysql连接信息
        ##mysql数据库
        my $db_name="##隐去的mysql导入数据库##";
        ##mysql数据库地址
        my $location="##隐去的mysql地址##";
        ##mysql数据库端口
        my $port="##隐去的MySQL数据库端口##";
        my $data_base = "DBI:mysql:$db_name:$location:$port";
        my $sth_select=$dbh_mssql->prepare($sql_select);
        $sth_select->execute();
        my $data_string = "";
        ##再次提示,fetchrow_arrayref()要快点~~~而且,不只快一点~~
        while(@select_data=$sth_select->fetchrow_array())
        {
            if($data_string ne '')
            {
                $data_string="$data_string ,";
            }
            my $data_col="";
            my $i=0;
            while($i<$columns_count)
            {
                if ($data_col ne "")
                {
                    $data_col="$data_col ,";
                }
                #对geometry值的特殊处理,如果有其它类型需要特殊处理,请在else后加eleif....
                if(@$column_types[$i] eq "geometry")
                {
                    $data_col="$data_col GeomFromText('@select_data[$i]',4326)"
                }
                else 
                {
                    $data_col="$data_col '@select_data[$i]'";
                }
                $i=$i+1;
                
            }
            #构建插入的时候的值字符串
            $data_string="$data_string($data_col)\n";
        }
        
        if($data_string ne "")
        {
            #mySQL用户名
            my $db_user="##隐去的MYSQL用户名##";
            #mysql密码
            my $db_pass="##隐去的MYSQL密码##";
            my $dbh_mysql=DBI -> connect($data_base,$db_user,$db_pass);
            #插入的SQL语句
            my $insert_sql = "INSERT INTO $table_name($insert_columns)values $data_string ;";
            my $sth_mysql=$dbh_mysql->prepare($insert_sql);
            
            $sth_mysql->execute() or die "插入到MYSQL报错:$dbh_mysql->errstr; SQL语句如下:\n $insert_sql \n";
            $dbh_mysql->disconnect;
        }
        else
        {
            return "False";
        }
        
        #底下的东西,全是释放变量
        undef $sth_select;
        undef $data_base ;
        undef $dbh_mssql;
        undef $sth_mysql;
        undef $dbh_mysql;
        undef $data_string;
        undef @select_data;
    }
    
    #获得表的列
    sub get_columns
    {
        print "loading columns of $_[0] \n";
        $dbh2=DBI->connect('dbi:ODBC:##隐去的MSSQL访问ODBC连接##','##隐去的MSSQL访问用户名##','##隐去的MSSQL访问密码##');
        my $sql="select col.name,tp.name from sys.all_columns col
                        inner join sys.types tp on col.system_type_id=tp.system_type_id  and col.user_type_id=tp.user_type_id
                        where object_id=$_[1]";
        my $cols=$dbh2 -> prepare($sql);
        $cols->execute();
        my $cols_insert = "";
        my $cols_select = "";
        my $cols_count = 0;
        my $sort_column="";
        my @cols_types;
        while(@col= $cols->fetchrow_array())
        {
            ($col_name,$type_name)=@col;
            @cols_types[$cols_count]=$type_name;
            if($cols_count>0)
            {
                $cols_insert="$cols_insert ,";
                $cols_select="$cols_select ,";
            }
            else
            {
                $sort_column="[$col_name]";
            }
            #对某些类型的特殊处理:hierarchyid
            if($type_name eq "hierarchyid")
            {
                $cols_select = "$cols_select [$col_name].ToString() as $col_name";
                $cols_insert = "$cols_insert `$col_name`";
            }
            elsif($type_name eq "geometry")
            {
                $cols_select = "$cols_select [$col_name].STAsText() as $col_name";
                $cols_insert = "$cols_insert `$col_name`";
            }
            else
            {
                $cols_select="$cols_select [$col_name]";
                $cols_insert = "$cols_insert `$col_name`";
            }
            $cols_count++;
        }
        #perl函数的返回很有意思。。。
        ($cols_select,$cols_insert,$cols_count,$sort_column,\@cols_types)
    }

    代码上完,稍后有一个总结,谢谢大家听小弟啰嗦。。。。

  • 相关阅读:
    在非MFC的win 32程序里面能够使用CString类
    一 VC2008环境中ICE的配置
    二 示例程序一
    三 ICE开发初级研究
    VC断点不可用的问题
    Ice笔记-利用Ice::Application类简化Ice应用
    GetCurrentDirectory、SetCurrentDirectory和GetModuleFileName
    Xcopy参数介绍
    COM组件开发实践(八)---多线程ActiveX控件和自动调整ActiveX控件大小(下)
    JackSon fasterxml学习
  • 原文地址:https://www.cnblogs.com/davyfamer/p/2535326.html
Copyright © 2020-2023  润新知