• kettle——入门操作(行扁平化)


    行扁平化,多行记录只有一个字段不同时,将不同字段转变为列。如下,最后解释一下原理及设计不足之处。

    第一种情况,数据特点,flag为a的有两行,flag为b的有三行

          

        行扁平化设置,扁平化后的目标字段,输入流中Grid Data 中flag为b的有三个:1,2,3,所以我们在这里也需要设计三列

          

        看最后excel结果,what,怎么只有b了?

          

            What?和预想的不一样啊!!!!!

    第二种情况,这次数据比较规范,a,b都只有两行。

          

        看行扁平化控件设置如下,我们设置的扁平化的目标字段也有两个,type1和type2

          

         看最后Excel输出结果,

          

        这次结果对了,看下面的。

    第三种情况,数据和第二种情况一样,

          

        行扁平化控件设置,如下,此处和第一种情况一样。

          

        看Excel输出结果,

          

        这什么情况?a呢?

     总结:此控件只能满足相同数据行(一列不同)数据一样的情况,一旦出现不一样的情况将不再适用。

          控件在输入流统计数量的时候,以控件增加的列为统计重复次数。且把统计的最后一行作为重复记录输出,这就是为什么1,3出现b而缺少a的原因。

  • 相关阅读:
    vim编辑器
    linux常用的命令解释
    克隆虚拟机及本地仓库的搭建
    创建windows系统下的虚拟机
    创建linux系统下的虚拟机
    drf频率组件
    django中过滤 搜索 排序
    drf分页
    js回顾
    数据类型
  • 原文地址:https://www.cnblogs.com/wind-man/p/7931969.html
Copyright © 2020-2023  润新知