• Pandas笔记:缺失值处理


    import pandas as pd
    import numpy as np
    data = pd.read_csv("./data/test.csv")
    print(data)
    print(pd.isnull(data))          # 缺失值True,其他False
    print(np.any(pd.isnull(data)))  # 有缺失值True,没有False
    print(np.all(pd.notnull(data))) # 没有缺失True,有False
    print(pd.isnull(data).any())    # 每列是否有缺失
    print(pd.notnull(data).all())   # 每列没有缺失
    print(data.dropna())    # 删除所有的缺失值
    print(data.fillna("NULL"))  # 替换NULL
    # 替换
    data_new = data.replace("?",value=np.nan)
    print(data_new.dropna())
     
      a  b    c    d
    0  1  2  3.0  4.0
    1  1  2  NaN  4.0
    2  1  ?  3.0  4.0
    3  1  2  3.0  4.0
    4  1  2  3.0  NaN
           a      b      c      d
    0  False  False  False  False
    1  False  False   True  False
    2  False  False  False  False
    3  False  False  False  False
    4  False  False  False   True
    True
    False
    a    False
    b    False
    c     True
    d     True
    dtype: bool
    a     True
    b     True
    c    False
    d    False
    dtype: bool
       a  b    c    d
    0  1  2  3.0  4.0
    2  1  ?  3.0  4.0
    3  1  2  3.0  4.0
       a  b     c     d
    0  1  2     3     4
    1  1  2  NULL     4
    2  1  ?     3     4
    3  1  2     3     4
    4  1  2     3  NULL
       a  b    c    d
    0  1  2  3.0  4.0
    3  1  2  3.0  4.0
     
  • 相关阅读:
    python基础代码2
    将博客搬至CSDN
    Python基础代码1
    使用函数处理数据
    创建计算字段
    用通配符进行过滤
    高级过滤数据
    过滤数据
    模式与架构
    工厂方法模式和简单工厂模式的选折
  • 原文地址:https://www.cnblogs.com/jumpkin1122/p/11509778.html
Copyright © 2020-2023  润新知