• pandas.DataFrame排除特定行


    使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame

    如果我们想要像Excel的筛选那样,只要其中的一行或某几行,可以使用isin()方法,将需要的行的值以列表方式传入,还可以传入字典,指定列进行筛选。

    但是如果我们只想要所有内容中不包含特定行的内容,却并没有一个isnotin()方法。我今天的工作就遇到了这样的需求,经常查找之后,发现只能换种方式使用isin()来实现这个需求。

    示例如下:

    In [3]: df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB'
       ...: , 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2
       ...: ', 'p3'])
    
    In [4]: df
    Out[4]:
        p1   p2   p3
    0   GD   GX   FJ
    1   SD   SX   BJ
    2   HN   HB   AH
    3  HEN  HEN  HLJ
    4   SH   TJ   CQ
    

    如果只想要p1为GD和HN的两行,可以这么做:

    In [8]: df[df.p1.isin(['GD', 'HN'])]
    Out[8]:
       p1  p2  p3
    0  GD  GX  FJ
    2  HN  HB  AH
    

    但是如果我们想要除了这两行之外的数据,就需要绕点路了。
    原理是先把p1取出并转换为列表,然后再从列表中去不需要的行(值)去除,然后再在DataFrame中使用isin()

    In [9]: ex_list = list(df.p1)
    
    In [10]: ex_list.remove('GD')
    
    In [11]: ex_list.remove('HN')
    
    In [12]: ex_list
    Out[12]: ['SD', 'HEN', 'SH']
    
    In [13]: df[df.p1.isin(ex_list)]
    Out[13]:
        p1   p2   p3
    1   SD   SX   BJ
    3  HEN  HEN  HLJ
    4   SH   TJ   CQ
    
  • 相关阅读:
    Es module vs require
    phaser3 画虚线实现
    新的计划
    [转]Boostrap Table的refresh和refreshOptions区别
    Storing Java objects in MySQL blobs
    【转】Ubuntu下搜狗输入法突然无法输入中文
    团队作业六
    团队作业七
    团队作业四
    团队作业三
  • 原文地址:https://www.cnblogs.com/wuzhiblog/p/python_pandas.html
Copyright © 2020-2023  润新知