本文记录木东居士bilibili-数仓主题分享内容
P5.数据模型对比
1.范式建模
优点:节约存储、结构清晰、易于理解、适合关系型数据库
缺点:构建比较繁琐、查询复杂、不适合构建在大数据分布式环境下
业务数据往往是根据主键更新,范式建模更新比维度建模更新更简单
2.维度建模
优点:方便使用、适合大数据下的数据处理、适合进行OLAP操作。
缺点:维度补全造成的数据存储的浪费、维度变化造成的数据更新量大、与范式理论差异很大,是典型的反三范式。
3.思考题:
P6再谈维度建模4个步骤
P7事实表基本概念
1.度量
2.一致性
P8常见事实表
1.事务事实表
2.周期快照事实表
3.累积快照事实表-记录事件的里程碑
4.无事实的事实表-单纯记录某一时间发生,用户点击日志行为等,可进行多种统计,但表中无度量
5.聚集事实表