• 搭建数据仓库第04篇:逻辑建模–1–概要


    目录

    • 前言
    • 原则
    • 内容
    • 小结

    前言

    上一篇讲述了数据仓库模型设计中的业务建模和领域概念建模,接下来就自然而然的来到了逻辑数据建模LDM(Logical Data Model)的阶段,这个阶段可以说是建模最重要的一环(也就是维度建模)。逻辑建模涉及到了整个数据仓库所有层次的模型设计,从DW到DM甚至到了OLAP。当然重点的设计还是在DW和DM层当中。

    有些地方逻辑建模的范畴更加宽泛,包含了前面的业务主题和领域概念模型的设计(看下图)。 本篇只是涉及了狭隘的部分(红色框住的部分)。

    内容

    了解了逻辑模型设计的范畴以及重要地位,那么具体需要做些什么呢?

    • 分析主题域

    确定要装载到铸具仓库的主题名称,以及各自主题的码键和属性组;主题内的实体,及其容量和更新频率;实体的列的属性等

    • 粒度模型的设计

    通过粗略估算数据量来确定粒度层次的划分,是单一粒度还是多重粒度(比如1年内的数据是天粒度的,历史记录是月粒度的)

    • 数据分割设计

    针对某一实体的数据应该是按怎样的方式来分割,一般是按照时间来分割,比如每天的数据放在一个分区里面。

    • 元数据模型的建立

    在各种转换和汇总的过程中建立好元数据模型能更好的维护和理解数据。

     

    原则

    逻辑数据模型设计是数据仓库项目的核心基础。为什么这样讲呢,因为逻辑数据模型设计是有原则的,通过满足了这些原则,能够保证整个数据仓库的稳定性,同时让数据需求方使用起来很容易理解数据,处理数据的效率也很高。

    • 粒度性

    数据仓库不同的层次具有的粒度是不同的,DW层是数据是原子粒度的数据,比如交易数据原子粒度是订单,记录也包括购买的用户以及商家,DM层的数据是面向主题按一定的维度进行汇总的数据,比如商户集市计算当天出售的订单量。

    • 共享性

    在数据仓库中,通过抽象和集成,把一些(维度)信息汇总起来,并做全局的一致化,使其在整个数据仓库中处于共享状态,任何用户都可以来使用。比如一致性维度。

    • 历史性

    针对业务分析的需求,需要从历史信息中获取有用的信息,比如评估客户生命周期价值。

    • 一致性

    逻辑数据模型必须在设计过程中保持一个统一的业务定义。比如,渠道的定义、团体的分类等,应该在整个企业内部保持一致。将来各种分析应用都使用同样的数据,这些数据应按照预先约定的规则进行刷新,保证同步和一致。

    • 扩展性

    当有新的需要和改变的时候,逻辑数据模型结构要能够做到可扩展,并能使得对用户透明。

    当然还有一些其他的原则,这些原则的最终目标是更好的满足用户的使用。

     

    小结

    逻辑模型设计是实践维度建模的重要组成部分,后续会从维度建模的三个核心来深入探讨和总结。

    维度建模的三个核心: 总线架构,一致性维度,一致性事实。

  • 相关阅读:
    numpy操作
    python将整数均分成N等分
    Windows7下安装pyspark
    python的append insert extend pop del remove使用
    马尔科夫链
    dataframe行变换为列
    scala获取某个时间间隔的时间
    Python3+Flask+uwsgi部署
    A*寻路算法
    C++易混淆知识点整理
  • 原文地址:https://www.cnblogs.com/benchen/p/6052960.html
Copyright © 2020-2023  润新知