• 《数据仓库工具箱》——如何做好数据仓库


    最近打算阅读一下数据仓库相关的书籍,百度了一下,有两本必读书《数据仓库工具箱》和《数据仓库》。简单介绍一下,《数据仓库》这本书更像是一本教材,里面的内容很经典;《数据仓库工具箱》看书名是一本单纯的工具书,其实里面都是实战。两本书各有千秋,我决定主要阅读《数据仓库工具箱》,今天分享第一章的内容,以后会做系列分享。

    第一章主要介绍了维度建模的好处,Kimball的历史和技术架构,以及与其他类似架构的优劣,但其核心议题是:“如何做好数据仓库?”

    说实话这个议题很没意思,有些枯燥,可是如果你遇到:“如何才能做好数据?为什么需求一直做不完?数据的价值到底有多大?”那么这下面全是干货。

    1.1 数据仓库与商业智能的目标

    1. DW/BI系统要能方便地存取信息。
    2. DW/BI系统必须以一致的形式展现信息。
    3. DW/BI系统必须能够适应变化。
    4. DW/BI系统必须能够及时展现信息。
    5. DW/BI系统必须成为保护信息财富的安全堡垒。
    6. DW/BI系统必须成为提高决策制定能力的权威和可信的基础。
    7. DW/BI系统成功的标志是业务群体接受DW/BI系统。

    上面7点是数据仓库设计的目标,不过重点是最后两点

    1.1.1 DW/BI系统必须成为提高决策制定能力的权威和可信的基础。

    这个是核心,我刚开始做数据仓库的时候,设定的目标是:满足业务查询数据的需求。结果我在这个目标上不断的奔跑,差点累死。暂且不提几十个维度做笛卡尔积的查询能否实现,就算做出来了,价值是什么哪?为公司带来了多少收益?如果自己的价值不能量化,那么结果是可以想象的。所以一定要数据仓库一定要支持决策,并且知道自己支持了哪些决策。下面是书中原文:

    数据仓库需要正确的信息以支持决策制定。DW/BI系统最重要的输出是基于分析证据所产生的决策。这些决策体现了数据仓库的影响和价值。早期用于表示DW/BI系统的称谓--决策支持系统,仍可作为开展系统设计的最好描述。

    1.1.2 DW/BI系统成功的标志是业务群体接受DW/BI系统。

    技术方案不重要,落地才重要,这里我想说的是:可以不用那些高大上的技术方案,但是不能不知道它的原理。要即知道它的优点,也知道它的不适用。

    是否使用最佳组合产品或平台来构建您的体面的解决方案其实并不重要。如果业务群体不能接受DW/BI环境并积极使用它,就难言成功。对操作型系统来说,用户无法对其加以选择,只能使用新系统,而对DW/BI系统来说,与操作型系统不同的是,它是可选的。
    只有当DW/BI系统真正成为用于构建可付诸实现的信息的"简单快捷"的资源时,用户才会接受它。

    1.1.3 数据仓库管理者的责任

    这里的责任大都是如何满足用户的需求,满足用户的需求不等于他提的需求都能满足,而是充分理解他的kpi,理解他的目标,从这个方面入手满足他的需求,下面是原文:

    一、理解业务用户
    1.1 理解他们的工作责任、目标和任务。
    1.2 确定商业用户在制定哪些决策时需要DW/BI系统的帮助。
    1.3 识别出那些制定出高效率、高影响的决策的"最佳"用户。
    1.4 发现潜在的新用户,并让他们意识到DW/BI系统能够给他们带来什么能力。
    二、对业务用户发布高质量、相关的、可访问的信息和分析
    2.1 选择最健壮的、可操作的数据放入DW/BI系统中,从组织机构的各种数据源中仔细选择
    2.2 简化用户接口和应用,采用模板驱动方式,与用户的认知过程轮廓匹配
    2.3 确保数据精确、可信,使其标识在整个企业具有一致性。
    2.4 不间断地监控数据和分析的准确性。
    2.5 适应用户不断变化的思维方式、需求和业务优先级,及新数据源的可用性。
    三、维护DW/BI环境
    3.1 采用DW/BI系统制定的成功的业务决策,验证人员配置及要投入的开支。
    3.2 定期对DW/BI系统进行更新。
    3.3 保持业务用户的信任。
    3.4 保持业务用户、执行赞助商和IT管理层满意度。

    1.2、总结

    上面都是一些概念,下面说一下自己理解的如何做好数据仓库?

    首先要充分理解业务过程,举例一家旅游网站,那么用户行为的简化过程就是:

    用户访问首页 -> 用户搜索 -> 用户到list页面 -> 用户到detail页面 -> 下单 -> 成单 -> 利润

    如果是管理层看用户行为数据,那么一定是看关键路径的指标,比如:u2b、u2o,一般不会看每个路径的转化,因为他的kpi是提升整体的收入或者整体的新用户数,没必要看这么仔细,发现问题找下面的人处理就好了,所以满足他的需求就是快速的给它这些指标即可

    如果是负责用户行为的产品看数据,那么一定是看每个路径的转化指标,因为他的kpi就是提升整体的转化,细化之后就是每个关键节点的转化率

    如果是某个大区的如责任看数据,那么一定看这个大区的u2b、u2o、利润等等,因为他的kpi就是这个大区

    业务过程有很多,关键指标更多,如何做好数据仓库?就是如何指导业务,就是理解他们的工作责任、任务和目标,帮助他们找到关键指标,指导决策

  • 相关阅读:
    一步一步学Silverlight 2系列(2):基本控件
    一步一步学Silverlight 2系列(12):数据与通信之WebClient
    一步一步学Silverlight 2系列(10):使用用户控件
    非常精彩的Silverlight 2控件样式
    给GridView添加显示服务端图片的列
    C# 实体类生成工具
    多线程(三) 生产者和消费者
    C# 实现多线程的同步方法
    多线程(五) 多线程的自动管理(定时器)
    ThreadPool 线程池
  • 原文地址:https://www.cnblogs.com/liqiu/p/7113452.html
Copyright © 2020-2023  润新知