• (四)数据分析-数据可视化


    数据可视化的目的

      让数据更高效

      让读者更高效阅读,而不单是自己使用

      突出数据背后的规律

      突出重要的因素

      最后是美观

    常见的初级图表

    图表的基础概念

    dimension:描述分析的角度和属性,分类数据

      时间、地理位置、产品类型

    measure:具体的参考数值,数值数据

      元、销量、销售金额等

    不同软件的处理方式:

    散点图:

     功能:散点图主要解释数据之间的规律

    维度:0+,作为颜色

    度量:2

    气泡图:

    散点图加一个维度,成为气泡图

    维度:1+,作为颜色

    度量:3,其中一个是气泡大小

    单轴散点图:

    维度作Y轴,更倾向于洞察数据在不同类别下对的数据规律

     维度:1+,Y轴

    度量:2

    客户消费维度

    消费金额和消费次数的关系

    消费金额和最后一次距今消费天数的关系

    消费次数和最后一次距今消费天数的关系

    客户其他消费维度

    消费金额和消费折扣的关系

    消费金额和会员积分的关系

    消费次数和会员距离的关系

    垂直领域消费维度

    投资金额和投资次数的关系(金融)

    最近一次距今消费和使用次数(SaaS)

    折线图

     折线图经常用来观察数据随时间变化的趋势。折线图中的维度不宜过多,否则会非常混乱和复杂。

     维度: 1+,可对比

    度量: 1+

    时间维度:X轴

    面积图

    是折线图的变种。面积图更注重数据类别之间随着时间趋势的变化关系。

    维度:1

    度量:2

    柱形图

    柱形图是类别之间的关系

    维度:2

    度量:1+

    直方图

    柱形图的统计型变种。

    维度:0

    度量:1

    饼图

    可以理解为环状的柱形图。饼图的类别不宜过多,除了PPT不适合分析时应用。

    维度:1

    度量:1

    漏斗图

    是对转化过程的直观展示。单一的漏斗图没有什么用处,也是面对PPT。漏斗图的转化步骤不应该超过7个。

     维度:1

    度量:1

    雷达图

    适用于个体的数据和属性可视化,比较偏描述性数据,常见于CRM,用户画像。

     维度: 1+

    度量:1+

    常见的高级图表

    树形图

    适合数据量较大的情况,尤其类别较多。比如各电商的SKU

    维度:1+

    度量:1

    桑基图

    是揭示数据复杂变化趋势的图表。面积图是线性维度,对桑吉图可以一对多或者多对一。

    维度:2 source,target

    度量:1

    热力图

    数据在空间上的变化规律,譬如地理空间、网页浏览

    维度:2

    度量:1

    空间也不一定是纯粹指地理空间,也可以是属性和维度的规律组合,比如将其变成星期表。

    维度:1

    度量:1  

    关系图

    展现不同类别之间的数据关系,常见于各类社交社会媒体。

    维度:2 source target

    度量:0+

    箱线图

    统计用图表,用于研究和观察数据分布,也能对比数据分布。

     维度:1+

    度量:1

    标靶图

    也称为子弹图,是变种的条形图。常用于衡量业务销售完成的情况。

    维度:1+

    度量:2

    词云图

    文本分析利器,PPT常客,卖弄大数据必备图表

    维度:1

    度量:0

    地理图

    数据和空间之间的关系。地理图即可以通过经纬度的数值度量绘制,也能通过省市的类别维度绘制。

    维度:1(经纬或行政)

    度量:1

    图表绘制

    Excel绘图:

    信息图 数据图表

    Power BI:

    必须从图表看到现象,透过现象分析出更深的原因。

    单一的图表可视化是没有意义的--->只能看到现象

    Dashboard设计:

    主次分明、贴合场景、指标结构

    层次分明:

     

     贴合使用人员场景:WHO,WHAT,HOW? 谁在使用?使用的目的是什么?使用者如何使用?

    指标:结构化、公式化

  • 相关阅读:
    socket (一)
    yield生成器及字符串的格式化
    python模块(json和pickle模块)
    python标准模块(time、datetime及hashlib模块)
    python标准模块(os及sys模块)
    python模块简介
    python --> 正则表达式
    python --> 递归 以及装饰器
    python基础知识(四)
    python基础知识(三)
  • 原文地址:https://www.cnblogs.com/jennifer224/p/12581024.html
Copyright © 2020-2023  润新知