• 一次完整的数据分析实战!仅用4步,效率吊打Excel和Python


    我最近发现很多人都走进了这样一个误区:觉得业务数据分析是专业的数据分析岗位的人才需要做的事情,业务人员只需要给他们提需求就可以了。

    但实际上业务人员一点数据分析都不会就是只会打仗,不会算账,缺乏了统筹决策的必备能力。因此一个优秀的业务人员是需要一定的数据分析的能力的,不需要多精通,但起码要懂基础的内容。

    那么问题来了:做数据分析需要什么工具,不想再用容易卡死的Excel了!

    Excel其实很强大的,但一般人充其量只会用其5%的功能,况且它还有这些致命缺点:数据安全性较低,跨平台性较低,数据量小....python就算了,看着简单,但做数据分析不是很适合。

    要不,就用专业的报表工具或者BI工具来做dashboard,给大家推荐FineBI这款敏捷数据分析工具,好处就在于用起来简单,数据透视、图表制作这些功能封装好的。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    整个过程就是连数据,设计模板,web展示。图表是内设好的或者开发对接Hcharts/Echarts/D3图标库,一般内置的图表以及够用了,解决分析问题才是主要的。

    今天就通过FineBI来带大家做一个简单的药品销售情况数据分析,帮助大家了解数据分析的基本流程。假设以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,这就需要知道几个业务指标,例如:月均消费次数,月均消费金额、客单价以及消费趋势。

    数据分析基本过程

    数据分析基本过程包括:导入数据、数据清洗、数据处理、数据可视化以及消费趋势分析。

    一、导入数据

    原表数据是excel形式的表格,但对于企业来说,需要分析的数据动辄上百万,excel无法带动,所以我们导入到FineBI中。点击主页的创建即可直接导入excel数据表。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    二、数据清洗

    因为一般数据集都会存在脏数据,比如数据出现负值、或者存在缺失值等,所以我们要对数据进行清洗。

    1、选择子集。企业日常的数据量非常庞大,各种数据指标也很多,但并不是每一列都有价值都需要分析,所以就需要从数据表中选择需要分析的子集来进行分析,这样能从数据中获取最大价值。

    通过添加自助数据集,选择刚刚导入的excel数据表就可以选择子集想要处理的数据子集,在本次案例列数较少,我直接选择了全部。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    2、不规范数据处理由于存在缺失值和负值,要把这些不规范的数据筛除才能够保证分析出来的结果是准确无误的。在自助数据集中,添加过滤功能,我们将所有数值型的数据都设置为大于0且其他数据列非空,这样系统就会自动筛除负数行和空值行

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    除了缺失值、负值等不规范的值,导入进来的业务数据有时候也会出现数据类型不匹配的情况,比如时间列是数值格式而不是时间格式,但是本次分析没有这一情况就不做处理。

    三、数据处理

    1、业务指标计算

    由于原始数据表中都是一些基础的数据,我们需要对这些数据进行简单的处理才能使其发挥出更大的价值。首先通过FineBI对这些数据进行分组求和,以便计算后面的指标。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    (1)业务月均指标月均消费次数 = 总消费次数 / 月份数(同一天内,同一个人所有消费算作一次消费)

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    月均消费金额 = 总消费金额 / 月份数

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    (2)客单价客单价 = 总消费金额 / 总消费次数

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    四、数据可视化

    通过密密麻麻的数据是很难直接看出数据变化情况的,只有将数据可视化了才能最直观地了解到数据的变化趋势。在FineBI中建立仪表板组件就可以进行实现数据可视化。

    1、每日消费趋势

    将购买时间拖入横轴,选择年月日,实收金额拖入纵轴,就可以显示出药品销售数据的日变化情况。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    从结果可以看出,每天消费总额差异较大,除了个别天出现比较大笔的消费,大部分人消费情况维持在1000-2000元以内。

    2、每月的消费金额

    接下来,再查看一下每月的消费金额变化趋势同样将购买时间拖入横轴,但是时间选择年月,实收金额拖至纵轴。可以看出月份之间的也存在较大的波动。由于7月份数据不完整,不作分析。2.3月份的数据骤降,需要重点关注,分析原因,以防再次出现类似的销售额走低现象。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    3、各药品销售情况

    将商品名称拖入横轴,实收金额拖入纵轴,可以发现不同药品之间的销售额差距显著。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    除了查看总体情况,还可以对可视化数据进行过滤,比如对实收金额进行过滤,选择最大的10个,就可以得到销售额排名前10的药品,同理也可得排名倒数的药品。根据可视化结果,可以对排名前列和倒数的药品销售数据进行具体分析,了解原因,帮助提高末位药品的销售额。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    如果觉得柱状图单调,最近大火的词云也是一个不错的选择,通过词云显示结果,我们也能发现开博通的销售额一骑绝尘,其次是络活喜、安内真、代文等药品。

    一次完整的数据分析实战!仅用4步,效率吊打Excel和Python

    以上就是一个简单的药品销售情况分析过程了。由于数据较为简单,本次只是做了一些非常基础的分析,主要是帮助大家了解数据分析的全过程,下一次教大家做一个复杂的数据分析。

    关注我,并转发该文章,私信回复“BI”,即可获得FineBI永久免费版,快来体验体验吧~

  • 相关阅读:
    队列课下作业
    20162305 2017-2018-1 《程序设计与数据结构》第6周学习总结
    20162305 2017-2018-1 《程序设计与数据结构》第5周学习总结
    线性结构 实验报告 20162305
    算法复杂度-实验博客
    2017-2018-1 《程序设计与数据结构》第3周学习总结
    20162305 2017-2018-1 《程序设计与数据结构》第2周学习总结
    20162316刘诚昊 课下排序测试
    20162316刘诚昊 17年10月9日测验“排序课堂测试”
    20162316刘诚昊 第五周学习总结
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13325596.html
Copyright © 2020-2023  润新知