• 为SSIS编写自定义数据流组件(DataFlow Component)之进阶篇:数据源组件


    上一篇,我们讲到了一个简单的步骤,包括创建项目,部署和测试。这一节,首先来探讨一下数据源组件的设计

    1. 添加几个引用。请确保添加了下图所示的四个引用,以及添加了相应的using语句

    image

    【注意】为了更好地表达我的目的,我已经修改了该组件的名字。它现在是一个“文件夹数据源”,目的是用来读取一个文件夹的文件信息。想想看,你是不是正好有这样的需求呢

    2. 添加输出列的定义

    作为一个数据源,很显然,它需要定义到底输出哪些列。那么这个是在哪里定义的呢? 我们需要做的是重写ProvideComponentProperties方法

            public override void ProvideComponentProperties()
            {
                ComponentMetaData.RuntimeConnectionCollection.RemoveAll();
                RemoveAllInputsOutputsAndCustomProperties();
    
                IDTSCustomProperty90 folder = ComponentMetaData.CustomPropertyCollection.New();
                folder.Name = "Folder";//怎么样设置该属性让他可以绑定表达式?
                
    
                IDTSOutput90 output = ComponentMetaData.OutputCollection.New();
                output.Name = "MyOutput";
                
    
                //初始化的时候,准备几个输出列
                IDTSOutputColumn90 fileNameColumn = output.OutputColumnCollection.New();
                fileNameColumn.Name = "FileName";
                fileNameColumn.SetDataTypeProperties(DataType.DT_WSTR, 256, 0, 0, 0);
                //如果是非Unicode则要提供CodePage,其他的类型可以设置为0
    
    
                IDTSOutputColumn90 fileSizeColumn = output.OutputColumnCollection.New();
                fileSizeColumn.Name = "FileSize";
                fileSizeColumn.SetDataTypeProperties(DataType.DT_I8, 0, 0, 0, 0);
    
    
                IDTSOutputColumn90 fileExtensionColumn = output.OutputColumnCollection.New();
                fileExtensionColumn.Name = "FileExtension";
                fileExtensionColumn.SetDataTypeProperties(DataType.DT_WSTR, 50, 0, 0, 0);
    
                //怎么让用户无法编辑这个输出和列的信息呢?
            }

    在这个方法里面,我们添加了一个自定义属性,这是为了增加该组件的灵活性。同时,我们添加了一个特定的输出,该输出有三个列

    3. 为组件添加验证规则

    因为有自定义属性,所以我们在执行之前应该对其进行验证,以确保它被正确进行了设置

            public override DTSValidationStatus Validate()
            {
                IDTSCustomProperty90 folder = ComponentMetaData.CustomPropertyCollection["Folder"];
                if (folder.Value != null && Directory.Exists(folder.Value.ToString()))
                {
                    return DTSValidationStatus.VS_ISVALID;
                }
                else
                {
                    ComponentMetaData.FireWarning(0, "文件夹数据源", "目标路径不能为空,而且必须存在", string.Empty, 0);
                    return DTSValidationStatus.VS_ISBROKEN;
                }
            }
    

    在这个方法中,我们确保Folder属性有被设置,而且必须是一个合法的路径

    4. 有如上的准备后,我们就可以进入实质问题了,那就是:我们如何根据这个Folder的设置,读取所有文件信息并且输出到后续的管道组件呢

            public override void PrimeOutput(int outputs, int[] outputIDs, PipelineBuffer[] buffers)
            {
                IDTSCustomProperty90 folder = ComponentMetaData.CustomPropertyCollection["Folder"];
                string path = folder.Value.ToString();
    
                IDTSOutput90 output = ComponentMetaData.OutputCollection["MyOutput"];
                PipelineBuffer buffer = buffers[0];
    
                try
                {
                    foreach (var item in Directory.GetFiles(path))
                    {
                        buffer.AddRow();
    
                        FileInfo info = new FileInfo(item);
                        buffer[0] = info.Name;
                        buffer[1] = info.Length;
                        buffer[2] = info.Extension;
                    }
                }
                finally
                {
                    buffer.SetEndOfRowset();
                }
    
                
            }

    太棒了,我们完成了数据源的设计。当然,到目前为止它的功能非常简单。

    5. 生成项目,部署。

    6. 在BI Studio中进行测试

    image

    我们从工具箱中将其拖放在数据源设计视图的时候,它上面有一个警告图标,这是因为它还没有进行配置

    image

    点击该组件,右键,编辑

    image

    我们的Folder属性自动显示在“自定义属性”中

    我们在“输入属性和输出属性”页面中还可以看到我们定义的列

    image

    好了,我们该看的都看完了,现在在Folder属性中输入一个路径,例如c:\windows

    image

    点击“确定”即可完成配置。我们的数据源可以提供数据了。

    image

    【注意】如果此处输入的路径不存在,则无法通过验证

    image

    为了让这个例子更有趣味性,我们添加一个“排序”转换(按照文件大小降序排列),同时添加一个Excel数据目标作为接收。这两个组件是标准的,我这里就不赘述了

    image

    image

    接下来,我们就可以执行任务了

    image

    太棒了,我们成功地执行了任务。现在我们来看一下输出来的那个Excel文件

    image

    小结:这一篇我们讲解了如何设计一个最简单的数据源组件。它可以读取某个文件夹的文件信息。设计一个数据源的步骤大致如下

    • 准备组件的属性(一般是定义自定义属性,自定义输出和列)
    • 编写验证规则
    • 重写输出方法
    本文由作者:陈希章 于 2009/6/21 9:50:10 发布在:http://www.cnblogs.com/chenxizhang/
    本文版权归作者所有,可以转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
    更多博客文章,以及作者对于博客引用方面的完整声明以及合作方面的政策,请参考以下站点:陈希章的博客中心
  • 相关阅读:
    工作问题随笔记录追加Filter过滤器踩坑记录
    vant使用dialog弹框遇到的小问题记录
    文件转换对应文件格式参数值
    总结pycharm运行代码只显示Process finished with exit code 0的解决办法
    DBA技术分享(二)MYSQL常用查询Columns和Views
    【学习总结】Git小结 (Mac版)
    【问题解决方案】MAC HBuilder X内置浏览器插件安装失败
    记一次 int 值溢出,引发的逻辑性错误
    Access 字段类型:【备注】 使用 getString() 读取字段内容是错误的!!!
    压缩算法原理
  • 原文地址:https://www.cnblogs.com/chenxizhang/p/1507631.html
Copyright © 2020-2023  润新知