• 数据仓库-特征


    一句话描述

    面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。

    特性

    1.面向主题

    传统的操作性系统是围绕组织的功能性应用进行组织的,而数据仓库是面向主题的。主题是一个抽象概念,简单地说就是与业务相关的数据的类别,每一个主题基本对应一个宏观的分析领域。

    主题域是对某个主题进行分析后确定的主题的边界,如客户、销售、产品等都是主题一个主题域由多个相互关联的物理表构成。

    针对性分析

    2.集成

    多个异构数据源的集合

    • 结构化数据
    • 半结构化数据
    • 数据文件(比如日志文件)

    将多个异构数据源统一成一致的、无歧义的数据格式后,再放入数据仓库中。数据仓库必须能解决诸如产品命名冲突、计量单位不一致等问题

    3.随时间变化

    为了发现业务变化的趋势、存在的问题,或者新的机会,需要分析大量的历史数据。

    与联机事务处理(OLTP)系统形成鲜明对比。联机事务处理反映的是当前时间点的数据情况,要求高性能、高并发和极短的响应时间,出于这样的需求考虑,联机事务处理系统中一般都将数据依照活跃程度分级,把历史数据迁移到归档数据库中。

    而数据仓库关注的是数据随时间变化的情况,并且能反映在过去某个时间点的数据是怎样的。数据仓库中的数据是反映了某一历史时间点的数据快照

    数据不可能永远驻留在数据仓库中,它在数据仓库中也有自己的声明周期。到了一定周期,数据会从数据仓库中移除。

    4.非易失

    数据一旦进入到数据仓库中,数据就不应该再有改变。

    操作性环境中的数据一般都会频繁更新,但是数据仓库环境中一般不进行数据更新。

    当改变的操作性数据进入数据仓库时会产生新的记录,这样就保留了数据变化的历史轨迹。数据仓库中的数据基本是静态的。

  • 相关阅读:
    强化训练1
    强化训练2
    变量的本质
    抽象层
    安装vs2015
    解决思路
    分析栈的缺点
    (转)使用yuicompressor-maven-plugin压缩js及css文件(二)
    (转)yuicompressor 与 maven结合,打包,压缩js,css (一)
    (转)Properties Editor为你解除通过native2ascii进行Unicode转码的烦恼
  • 原文地址:https://www.cnblogs.com/EnzoDin/p/14027283.html
Copyright © 2020-2023  润新知