• 学习数据仓库之概念基础


    数据仓库与数据库的差别是什么呢?各自的应用场景在哪里呢?

    在业务系统中使用的数据库,其中一般存储的是在线交易数据,是以业务单位组织数据并进行存储的。由于数据库是面向具体的应用,现在一般采用关系模型的设计方法。通过关系模型以保证数据的原子性、一致性和完整性,消除数据冗余,一般采用符合范式的规则来约束设计。

    数据仓库从设计之初就是为了数据分析服务的,因此在数据组织上是以面向主题进行组织和存储的。是通过在多个维度上对历史数据进行观察和分析,为决策人员提供在该关注点(主题)上的辅助决策信息。因此在设计上也不同于数据库的关系模型,而是采用多维分析数据模型。

    数据仓库是分析系统的数据平台,它利用从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。

    分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

     数据仓库有事实表和维度表。

    事实表中一般存放的是和主题相关的度量(数值)数据以及为了和维表连接而建立的键字段,在维度表中存放的多是维度描述信息和键字段。

    为了更好地理解,我们可以看看这个例子:

    对于有个商品的营销业务进行分析,下面列出了我们的分析的需求目标、分析的维度指标、维度的层次结构等,可以更好的理解什么是事实表,什么是维度表。

     我们的事实表存放的是商品的销售记录。维度表存放的是客户的信息、商品的信息等。

  • 相关阅读:
    7. JavaScript学习笔记——DOM
    6. Javscript学习笔记——BOM
    3. Javascript学习笔记——变量、内存、作用域
    2. Javscript学习笔记——引用类型
    1. JavaScript学习笔记——JS基础
    计算机网络学习笔记——网络层
    python小数据池,代码块知识
    pycharm快捷键
    字典
    04
  • 原文地址:https://www.cnblogs.com/EVA-YANG/p/11850404.html
Copyright © 2020-2023  润新知