• 2017.06.29数据挖掘基础概念第四章


    第四章
    39、为什么在进行联机分析处理(OLAP)时,我们需要一个独立的数据仓库,而不是直接在日常操作的数据库上进行
    1、提高两个系统的性能 2、操作数据库支持多事务的并发处理,需要并发控制和恢复机制,确保一致性和事务的鲁棒性
    3、两者有着不同的数据的结构、内容和用法
    40、什么是数据仓库
    数据仓库是一种数据库,它与单位的操作数据库分别维护,数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持,是一个面向主题的、集成的、时变得、非易失的数据集合,支持管理者的决策过程。
    41、数据仓库的构建需要
    1、数据集成 2、数据清理 3、数据统一
    42、单位如何使用数据仓库的信息
    1、提高顾客关注度,这包括顾客购买模式
    2、根据按季度、按年、按地区的营销情况比较,重新配置产品和管理产品的投资,调整生产策略。
    3、分析运作情况并找出利润源
    4、管理客户联系,进行环境调整,管理公司的资产开销
    43、OLTP(联机事务处理)和OLAP(联机分析处理)的主要区别
    1、用户和系统的面向性:OLTP是面向顾客的 OLAP面向市场的
    2、数据内容:OLTP系统管理当前数据 OLAP系统管理大量的历史数据
    3、数据库设计:OLTP采用实体-联系数据模型和面向应用的数据库设计 OLAP通常采
    用星形或雪花模型和面向主题的数据库设计
    4、视图:OLTP系统主要关注一个企业或部门内部的当前数据,而不涉及历史数据或不
    同单位的数据 OLAP系统处理来自不同单位的信息,以及多个数据库集成的信息。
    5、 访问模式:OLTP系统的访问主要由短的原子事务组成,OLAP系统的访问大部分是只读操作
    44、数据仓库的三层体系结构
    1、底层是仓库数据库服务器 2、中间层是OLAP服务器 3、顶层是前端客户层
    45、数据仓库模型
    1、企业仓库:企业仓库搜集了关于主题的所有信息,跨越整个企业
    2、数据集市:数据集市包含企业范围数据的子集,对特定的用户群是有用的
    3、虚拟仓库:操作数据库上视图的集合
    46、数据仓库开发的自顶向下和自底向上的优缺点是什么?
    自顶向下开发企业仓库是一种系统的解决方案,并能最大限度地减少集成问题。然而,它费用高,开发周期长,并且缺乏灵活性,因为整个组织就共同数据模型达成一致时比较困难的。设计、开发、配置独立的数据集市的自底向上的方法提供了灵活性、低花费,并能快速回报投资。然而,将分散的数据集市集成,形成一个一致的企业数据仓库时,可能导致问题。
    47、数据仓库系统使用工具和程序的功能
    1、数据提取 2、数据清理 3、数据变换 4、装入 5、刷新
    48、元数据库包括的内容:
    1、数据仓库结构描述 2、操作元数据 3、用于汇总的算法
    4、由操作环境到数据仓库的映射 5、关于系统性能的数据 6、商务元数据
    49、在OLAP中,如何使用概念分层
    在多维数据模型中,数据组织在多维空间,每维包含由概念分层定义的多个抽象层。这种组织为用户从不同角度观察数据提供了灵活性
    50、典型的OLAP操作方法
    1、上卷 2、下钻 3、切片和切块
    4、转轴 5、其他OLAP操作 6、OLAP系统与统计数据库

  • 相关阅读:
    [经验] 如何在虚拟机上安装 CentOS
    [经验] Java 使用 netty 框架, 向 Unity 客户端的 C# 实现通信[2]
    [经验] Java 使用 netty 框架, 向 Unity 客户端的 C# 实现通信 [1]
    [经验] 关于 Java 中的非空判断
    [经验] Java Web 项目怎么部署到 Linux 系统上
    求和
    引用与指针
    C++学习前言
    大O
    ubuntu连接不上mysql问题
  • 原文地址:https://www.cnblogs.com/hqutcy/p/7096620.html
Copyright © 2020-2023  润新知