聚合转换允许您为聚合定义组,而不是在所有的输入数据间执行聚合。例如,您可以查找按地区分组的总销量,而不是查找总的公司销量。
要为聚合表达式定义组,请选择聚合转换中的相应输入、输入/输出、输出和变量端口。您可以选择多个分组依据端口,为每个组的唯一组合创建新组。PowerCenter 随后将为每个组执行已定义的聚合。
对值分组后,PowerCenter 会为每个组生成一行。如果不对值分组,PowerCenter 则会为所有输入行返回一行。PowerCenter 通常将每个组的最后一行(或接收的最后行)以及聚合结果一起返回。但是,如果您指定要返回特定行(例如,通过使用 FIRST 函数指定),PowerCenter 则会返回特定行。
在聚合转换中选择多个分组依据端口时,PowerCenter 会使用端口顺序确定其分组的顺序。由于分组顺序会影响您的结果,排列分组依据端口将确保适当的分组。例如,根据先 ITEM_ID 后 QUANTITY 的分组方式所得出的结果与根据先 QUANTITY 后 ITEM_ID 的分组方式得出的结果可能不同,因为数量的数值不必唯一。
以下聚合转换按先 STORE_ID 后 ITEM 方式分组:
非聚合表达式
可以使用分组依据端口中的非聚合表达式修改或替换组。例如,如果要在分组前替换 'AAA battery',您可以使用以下表达式创建新的名为 CORRECTED_ITEM 的分组依据输出端口:
IIF( ITEM = 'AAA battery', battery, ITEM )
默认值
可以在分组依据端口中使用默认值来替换空输入值。例如,如果您在下面的 ITEM 列中定义默认值为 'Misc',则 PowerCenter Server 会用 'Misc' 替换空组。这样能让 PowerCenter Server 在聚合中包括空项目组。