• 数据仓库-(2)企业级数仓介绍


    本文记录木东居士bilibili-数仓主题分享内容

    P1企业级数据仓库介绍

    1. 数仓痛点

    2. 数仓模型

    类似ODS -> DW( DWD ->DWS) ->TDM ->ADS

      

    调用原则:(跨层指APP不要直接调ODS

    数仓规范

    1.表命名规范: 业务域指业务范围划分,如银行的零售业务、对公业务;数据主题是指业务通用的数据范围划分,如:支付行为、营销行为等。这两个构成的业务数据矩阵类似维度建模中的企业总线矩阵,可以用于企业的数仓规划。

    2.字段命名规范:

    3.需求对接规范:

    对接方:运营、分析、产品;模型评审、需求拆解、分配开发、是否需要调用测试资源、对接方数据确认、上线

    4.数据开发规范:对任务、调度也是有开发规范,与表命名规范保持基本一致

    一种实时架构:Lambda架构

    外围系统介绍

    1.调度系统: oozie; azkaban; Airflow

    2.元数据管理系统:把数据仓库看成产品,从服务的层面来做

    3.通用离线和实时计算平台

    4.数据质量监控: 早于数据使用方发现错误

    发展方向展望

    1.产品化与服务化

     2.单一技能变多项技能

    平台化趋势:可以全面发展数仓+数分+数挖

    不要把自己局限在SQL,多去接触新工具

    站在产品的角度去做数仓,了解产品+运营

  • 相关阅读:
    01-Django 简介
    函数及函数的嵌套等
    循环及循环嵌套
    运算符
    if, elif, else及if嵌套
    变量及变量计算和引用
    Python的3种执行方式
    Jmeter设置默认中文启动
    Vysor
    python基础学习(二)
  • 原文地址:https://www.cnblogs.com/foolangirl/p/14227240.html
Copyright © 2020-2023  润新知