• 数仓 分层架构


    ods层:
    数据来源及建模方式:各业务系统的源数据,物理模型与业务模型一致;
    服务领域: 为其它逻辑层提供数据;
    数据ETL过程描述:把业务数据抽取落地成文本文件,再装载到数据仓库ods层,不做清洗转化。
    功能:
    1)ods是数仓准备区
    2)为dwd提供原始数据
    3)减少对业务系统影响
    建模方式及原则:
    数据保留时间根据实现业务需求而定;
    可以分表进行周期性存储,存储周期不长;
    从业务系统以增量方式抽取加载到ods;
    数据模型与粒度与业务系统一致(3NF)。

    dwd层:
    数据来源及建模方式:数据来自于ods层,是DW明细事实层,数据模型与ods层一致;
    服务领域:为edw提供各主题业务明细数据;
    数据ETL过程描述:根据ods增量数据和前一天DWD相关表进行merge生成全量数据,不做清洗转化,保留原始全量数据。
    功能:
    1)为DW层提供来源明细数据
    2)为未来分析类需求的扩展提供历史数据支持。
    建模方式及原则:
    为支持数据重跑可额外增加数据业务日期字段;
    可按天月年进行分表;


    dw层:
    数据来源及建模方式:数据来自dwd层,是DW事实层,采用维度建模,星型架构,这一层可细分为dwb与dws;
    服务领域:为EDS提供各主题业务明细;
    数据ETL过程描述:从dwd层进行轻度清洗,转化,汇总生成dw层数据,如字符合并,email,证件号,日期,手机号转换合并;按各个维度进行聚合汇总。


    dm层:
    数据来源及建模方式:数据来自dw层,采用维度建模,星型架构;
    服务领域:数据挖掘,自定义查询,应用集市;
    数据ETL过程描述:从dw层进行粗粒度聚合汇总,按业务需求对事实进行拉宽形成宽表。

    st层:
    数据来源及建模方式:数据来自dw层,采用维度建模,星型架构;
    服务领域:前端报表展示,主题分析,kpi报表;
    数据ETL过程描述:从dw层进行粗粒度聚合汇总,如按年、月、季、天对一些维度进行聚合生成业务需求的事实数据。

  • 相关阅读:
    ActiveMQ的spring配置文件
    ActiveMQ consumer按顺序处理消息
    ActiveMQ异步分发消息
    2个线程顺序工作
    hadoop更换硬盘
    linux内存条排查
    gitlab迁移升级
    linux 监控网卡实时流量iftop
    gitlab7.2安装
    为首次部署MongoDB做好准备:容量计划和监控
  • 原文地址:https://www.cnblogs.com/linkmust/p/11654488.html
Copyright © 2020-2023  润新知