• Excel_PoweQuery——条件计数、条件求和


    岁月不居,时节如流。

    时光荏苒,岁月如梭。

    前面两段充分体现了博主深厚的文学素养,别和博主争,博主说啥就是啥。

    其实,对于大量数据的处理,这几年微软Office做的不单单是2007的时候把Excel的行数从65536提高到了1048576。存得多了不是目的,目的是处理得了,处理得快,处理过程简单,2010的时候微软便引入了Power Query插件用以提升Excel的数据获取、处理能力,2016的时候PowerQuery便成了Excel的标配功能。没错,扯了这么多就是为了说出本系列案例要用PowerQuery,虽然标题上已经明白得不要不要的了,但还是想多扯几句,没办法,将就着看吧,谁让我是作者。

    Power Query,中文名“查询增强版”,简称"PQ”, 是Excel的一个功能模块,也是Power BI的一个组件。在Excel 2010/2013中Power Query以插件形式存在,需要另行安装,在2016版中已经内嵌为功能模块。在Excel中微软将其定义为“获取和转换”,主要用于数据的获取、转换、查询、抽取、汇总等。

    从今天开始,博主有可能会断断续续断断地更一些关于Power Query的知识,希望博主能坚持下来!


    但凡对Excel数据处理比较熟悉的用户,说到条件计数、条件求和一定会想到Countif、Sumif,没错,在Excel里这是两个使用频率很高的函数。但是,当“大数据”来临时,它们统统都成了“鸡肋”,屏幕上卡死不动的Excel与内存爆红的“加速计”说明了一切。

    1 条件计数,秒杀“Countif”

    操作目的

    案例大概是这样的,有数以十万计的记录条数在Excel里面,目的是轻松点点点就“秒完”计数。

    先来算下每户人数,再来算下每户男女各多少。

    操作步骤

    1、数据要先加载到PQ,至于不知道如何加载的请翻看其他案例,这里要特别点一下的是加载后一定要“点一下‘更改的类型’”前的x。删掉这一步,因为这一步PQ“自作主张”将长数字串转成了数值,而且还给科学计了数,而我们需要的就是原来的长数字串。

     

    2、【开始】选项卡—【分组依据】,按“户号”分组,分组操作是对“户号”列计数,这样每户多少人就出来了。

     

    3、“秒完”计数,上载至Excel就行了。

     

    4、为了把案例整复杂点以显示本博主的教程不太水,这里还要算下每户男女成员各几人。具体的操作其实和上边一样的简单,如果硬要说说多讲述这一步的必要性,下图已经明了,嗯,就是“依据”多了一个。

    2 条件求和,完败“Sumif”

    操作目的

    博主愣是没有找到案例,于是拿上边的例子“硬造”了一个每个人的收入信息,至于是什么收入,天晓得,随机来的…

    目的是求每户的总收入。

     

    操作步骤

    1、数据加载到PQ,依然是【开始】—【分组依据】,依据依然是“户号”,不过这波操作换成了“求和”,对,就是对“收入”求和。依然需要提醒的是注意叉掉PQ对长数字串的“自作主张”。

     

    2、就这么简单,还想多扯几千字呢,可是,这波操作确确实实已经轻轻松松的完了。

    想体验一下十万级数据的处理速度,你得先有十万级的数据,造起来怪辛苦的,博主这里贴心提供实验材料:

    链接:https://pan.baidu.com/s/1nsbUvqFi8cGsqISLON0EiQ 密码:de78

  • 相关阅读:
    Ubuntu18.04安装PHP7.3
    常用的正则表达式大全
    python实现感知机线性分类模型
    Python-基于向量机SVM的文本分类
    ssh远程登录命令简单实例
    js页面间通信方法(storage事件)(浏览器页面间通信方法)
    Node Sass could not find a binding for your current environment 解决办法
    git上传遇到 GitHub could not read Username 的解决办法
    Vue新手村之新手村概述
    Vue新手村任务之任务前言
  • 原文地址:https://www.cnblogs.com/yzhyingcool/p/10991724.html
Copyright © 2020-2023  润新知