• pandas 基本操作


    1.     一维数据结构Series

    a.   概念:Series 是pandas 的一维数据结构,有重要的两个属性 index 和values

    b.  初始化: 可以通过 python 的 List 、dict 、np.array  初始化

    如果使用np.array或者python 的list 创建 Series 会得到其index 是默认的 0,1,2 这样的数字

    >>> s = pd.Series([1,2,3])

    >>> s.index

    RangeIndex(start=0, stop=3, step=1)

    如果使用 python 的dict 来创建的 Series 其 index 对应的是 dict 的key

    s2 = pd.Series({'1':1,'a':2,3:3})

    >>> s2.index

    Index([3, u'1', u'a'], dtype='object')

    c.  元素访问类似 dict 访问

    s[0] // 访问第一个元素

    s[‘a’]// 访问列名为a的元素

    s.a  // 访问列名为a的元素

    s[s>4]// 返回大于4的元素

    d.  转换dict 、np.array

    s.values 或者 s. as_matrix()

    s.to_dict()

     2.   二维数据dataframe    

    a.常用的读入方法

    1)     内存读入:pd.read_clipboard()

    2)     文件读入:pd.read_csv(path)

    b. 列操作

    (1)查看包含的所有的列的列名df.columns

    (2)过滤掉多个列,返回一个新的dataframe

    df_new = pd.DataFrame(df,columns=['id','section_id','start_road_id'])

    (3)过滤一个列

    df.id 或 df[‘id’]

    (4)增加一个列并赋初值

     df['new_ids']=1 或 df['new_ids']=np.arange(0,len(df)) (5) 增加一列,并赋初值,只给部分行填充数据

     df['new_id2']=pd.Series([200,300],index=[2,3]) # 只给第2,3行填充了数据,其余的数据为NAN

  • 相关阅读:
    js获得动态生成的标签
    自定义字段在List和ClassList等标签里的使用方法
    asp.net dropdownlist 取不到值
    MXCMS新增标签IFrame 包含标签
    JS打印
    Flash图表解决方案 Finger Chart
    推荐个免费的客户端控件
    C#利用反射获取对象属性值
    位置导航MXCMS Position标签说明
    OAuth简介
  • 原文地址:https://www.cnblogs.com/oftenlin/p/7857450.html
Copyright © 2020-2023  润新知