• Excel & Python | 开始烹调——数据运算 | 06


    算术运算

    算术运算就是基本的加减乘除,在Excel或Python中数值类型的任意两列可以直接进行加、减、乘、除运算,而且是对应元素进行加、减、乘、除运算,Excel 中的算术运算比较简单,这里就不展开了,下面主要介绍Python中的算术运算。

    比较运算

    比较运算和Python基础知识中讲到的比较运算一致,也是常规的大于、等于、小于之类的,只不过这里的比较是在列与列之间进行的。

    在Excel中列与列之间的比较运算和Python中的方法一致,例子如下图所示。

    下面是一些Python中列与列之间比较的例子。

    汇总运算

    上面讲到的算术运算和比较运算都是在列与列之间进行的,运算结果是多少行就会返回多少个结果。

    而汇总运算是将数据进行汇总返回一个汇总以后的结果值。

    count非空值计数

    非空值计数就是计算某个区域中非空(单元格)数值的个数。

    在Excel中counta()函数用于计算某个区域中非空单元格的个数。与counta()函数类似的一个函数是count()函数,它用于计算某个区域中含有数字的单元格的个数。

    在 Python 中,直接在整个数据表上调用 count()函数,返回的结果为该数据表中每列的非空值的个数,具体实现如下所示。

    count()函数默认是求取每一列的非空数值的个数,可以通过修改axis参数让其等于1,来求取每一行的非空数值的个数。

    也可以把某一列或者某一行索引出来,单独查看这一列或这一行的非空值个数。

    sum求和

    求和就是对某一区域中的所有数值进行加和操作。

    在 Excel 中要求取某一区域的和,直接在 sum()函数后面的括号中指明要求和的区域,即要对哪些值进行求和操作即可。例子如下所示。

    在Python中,直接在整个数据表上调用sum()函数,返回的是该数据表每一列的求和结果,例子如下所示。

    sum()函数默认对每一列进行求和,可通过修改axis参数,让其等于1,来对每一行的数值进行求和操作。

    也可以把某一列或者某一行索引出来,单独对这一列或这一行数据进行求和操作。

    mean求均值

    max求最大值

    min求最小值

    median求中位数

    mode求众数

    var求方差

    std求标准差

    quantile求分位数

    分位数是比中位数更加详细的基于位置的指标,分位数主要有四分之一分位数,四分之二分位数,四分之三分位数,而四分之二分位数就是中位数。

    在Excel中求分位数用的是percentile()函数,示例如下:

    在Python中求分位数用的是quantile()函数,要在quantile后的括号中指明要求取的分位数值,quantile()函数与其他函数的使用规则相同。

    相关性运算

    相关性常用来衡量两个事物之间的相关程度,比如我们前面举的例子:啤酒与尿布二者之间的相关性很强。我们一般用相关系数来衡量两者的相关程度,所以相关性计算其实就是计算相关系数,比较常用的是皮尔逊相关系数。

    在Excel中求取相关系数用的是correl()函数,示例如下:

    在Python中求取相关系数用的是corr()函数,示例如下:

    还可以利用 corr()函数求取整个 DataFrame 表中各字段两两之间的相关性,示例如下

    小结

    算术运算 
    	列与列之间 列与一个数 + - * / %
    比较运算
    	列与列之间 列与一个数 > < >= <= !=
    汇总运算 从numpy来的 axis=0 列(默认)  axis=1 行
    	非空计数 count()
    	求和 sum()
    	最大值 max()
    	最小值 min()
    	平均值 mean()
    	众数 mode()
    	中位数 median()
    	方差 var()
    	标准差 std()
    	分位数 quantile(分位点)
    
    相关运算
    	corr()
    
  • 相关阅读:
    腾讯QQ强制下线,每天可能强抢会员300万元
    visual studio 2010 winform程序不能添加对system.web的引用
    一个用来将Excel中同一个人的多行记录中的特定列合并到第一行的宏
    很希望看到微软来一次“因为QQ未经用户允许扫描硬盘,在所有window平台拒绝运行QQ”
    windows2003的数据执行保护会造成无法正常安装SQL SERVER
    改变jboss部署目录(虚拟目录)
    SecureCRT6.5.0英文版,提示数据库里没有找到防火墙"无"
    spring注解事务
    windows下查看端口被哪个程序占用
    union和union all区别
  • 原文地址:https://www.cnblogs.com/Rowry/p/14978718.html
Copyright © 2020-2023  润新知