什么是数据仓库?带着这个问题进入今天的博客。
数据仓库就是一个数据库,但是有别于我们通常所说的数据库。
数据仓库是一个面向主题的、集成的、不可更新的、随时间变化的数据集合,它用于支持企业或租住的决策分析处理。
数据仓库的结构和创建过程。
数据源:业务数据系统(mysql或Oracle等),文档资料,其他数据。
数据存储及管理:(将数据源ETL的过程):抽取Extract、转换Transform、装载Load
数据仓库引擎:对外提供服务。使用数据仓库的数据,向前端展示提供服务。
前端展示:根据数据仓库引擎调用服务。数据查询、数据报表、数据分析、各类应用等。
OLTP应用:连接事务处理。典型OLTP业务:银行转账业务。
OLAP应用:连接非事务处理。典型OLAP业务:商品推荐系统。主要用于查询的历史数据处理。
数据模型:星型模型和雪花模型。
星型模型举例:商品信息可以和客户信息关联、订单信息关联、物流信息关联、厂家信息关联等。
雪花模型举例:它是建立的星型模型之上的。它继续由客户信息关联客户家庭信息、客户地址信息;它继续和厂家信息关联厂家地址信息、厂家员工信息等。