操作型处理、分析型处理 的概念
操作型数据处理就是对数据的收集,主要进行增删改查等操作;
分析型数据处理:就是对数据的再加工,通过访问大量的历史数据,对其进行统计分析,也叫信息型处理
还有两个例子
操作型数据和分析型数据的区别(四五条)
操作型数据 | 分析型数据 |
当前数据 | 历史数据 |
需求实现知道 | 需求实现不知道 |
生命周期符合SDLC | 完全不同的生命周期 |
可更新 | 不可更新 |
对性能要求高 | 对性能要求宽松 |
一个时刻操作一个单元 | 一个时刻操作一个集合 |
事务驱动 | 分析驱动 |
面向事务处理 | 面向分析挖掘 |
一次性操作数据量小,计算简单 | 一次性操作数据量大,计算复杂 |
支持日常操作 | 支持管理需求 |
1)请简要说明事物处理环境不适宜dss应用的原因?
2)不适合分析型数据的原因?
3)传统型数据库数据的应用于分析型数据处理的时候有哪些局限性?
4)传统数据库系统不适合分析型数据处理的原因有哪些?
数据的分散、“蜘蛛网”问题、数据不一致问题、数据动态集成问题、历史数据问题、数据的综合问题
数据仓库的定义?
什么是数据仓库?
数据仓库的数据的基本特征?
数据仓库是一个四个特征的数据集合,四个特征:面向主题的、集成的、不可更新的、随时间变化的数据集合。
什么是主题?
主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。
什么是面向主题?
一个是数据,一个是数据之间的联系。
主题之间的重叠?
逻辑上的重叠;细节上的重叠;不一定是两两重叠
什么是主题域?
根据分析要求,将数据组织成一个完备的分析领域,即主题域。
主题域特点:独立性、完备性
为什么说数据仓库的数据是集成的、不可更新的,随时间不断变化的?
说它是集成的是因为它的数据是从其他数据源中抽取得到的,说不可更新是因为数据仓库的数据是不可更改的,说它随时间变化是因为他是删除旧内容插入新内容。
请简述数据仓库的体系结构(ppt)
两个工具:
两个服务器:
数据抽取、数据清洗、数据转换、数据加载分别指什么?
ETL:集成工具 ,指数据抽取、清洗、转换、加载工具。
四个服务器:ROLAP、MOLAP、HOLAP
数据集市:是一种小型的数据仓库或者是一种部门级的数据仓库
数据集市有什么用?
它是面向部门级的,为某个部门集的管理所应用。
什么是元数据?数据仓库中的元数据?
数据仓库中的元数据是数据仓库中的描述性信息。
请简要说明数据仓库环境中元数据的内容?(自己发挥)
先回答什么是元数据,后面自由发挥
数据集市和数据仓库的区别?
数据集市是部门集的数据仓库,数据仓库是全局的,不光有部门级还有个人级和全局级。
什么是ODS?
支持企业日常的全局应用的数据集合。