BI流程: 需求分析->维度设计->查询service->ETL倒数据->CDC监听数据库
需求分析:首先确定好的数据来源(多个数据库+excel文件+日志+...),需要的数据查询项(measure值)
维度设计:
分析维度出发点,几个w:who ,where,when,what,how,why
建维度表
通过画总线矩阵来减少事实表个数
查询service:最后确定了前端使用开源框架saiku(使用了pentaho的mondrian来提供MDX到result的处理)
ETL工具:kettle(图形化界面,数据处理思想类似于awk工具)
CDC监听:使用tungsten(实现了mysql的log监听,但对oracle的redolog的监听实现并不完美)。