• pandas分类统计


    一、背景:在工作中总会用到各种统计工作,并且这个工作会反复的做,那么,可不可以让这些重复的工作自动化呢?

         基于这个想法,把工作中常做的重复的工作给自动化一下

    二、目标:实现分类统计,即统计相同项目的数量,如下表

           

      统计的结果应该是:经济管理学院 1

               电气信息工程学院  2

               机械科学与工程学院 1

    三、使用工具软件:python3.7  

      1、准备数据(g:/test.xlsx)

        

           2、实现

           

    1 # -*- coding:utf-8 -*-
    2 
    3 import pandas as pd
    4 import numpy as np
    5 
    6 df = pd.read_excel('G:/test.xlsx')
    7 pt1 = pd.pivot_table(df,index=["学院"], aggfunc='count',margins_name='合计',margins='True')
    8 #pt1 = df.groupby('学院')['学院'].agg('count')
    9 print(pt1)
    View Code

      (1)pt1 = pd.pivot_table(df,index=["学院"], aggfunc='count',margins_name='合计',margins='True') 的结果

          

      (2)pt1 = df.groupby('学院')['学院'].agg('count')的结果

          

       问题来了:

      为什么(1)(2)的结果有差别呢?

      如果让(1)结果跟(2)一样,不需要后面的两个字段呢?

      目前还没有找到解决办法,希望知道的人在后面回复一下,我也学习学习!

      

  • 相关阅读:
    shellscript 02 find & xargs
    PL/SQL exception
    PL/SQL 游标
    Eclipse
    【数据存储】操作资源文件
    【AsynTask】Android异步加载一张图品
    【数据存储】利用IO流操作文件
    【数据存储】DOM操作
    【特效】手指滑动:水波纹
    【数据存储】SAX操作
  • 原文地址:https://www.cnblogs.com/ssqhan/p/15820961.html
Copyright © 2020-2023  润新知