• Py之pandas:dataframe学习【转载】


    转自:https://www.tutorialspoint.com/python_pandas/python_pandas_dataframe.htm

    1.数据框4特性

    • 列是不同类型的数据元素。

    • 每列的长度可变

    • 行和列都有标签

    • 对行和列可进行算术运算。

    可将其视为SQL表。//这个十分容易理解了。

    2.创建

    pandas.DataFrame( data, index, columns, dtype, copy)

    其中Data可以是list,dict,array,series,map,等。

    • Lists
    • dict
    • Series
    • Numpy ndarrays
    • Another DataFrame

    index是对行的索引,column是列名。

     

    从List

    从dict

     

    3.列操作

    选择列,直接用列名即可。

    添加列:

    删除列,

    使用del函数或者pop函数:

    4.行操作

    对行索引,

    可以通过label来进行,那么使用loc;通过行数字来进行,使用iloc:

    //行号是从0开始的。

    对行进行数据切片: 

     

    //直接使用冒号即可,并且右边的数是取不到的。

    添加行,使用append函数

    //注意上述,append了之后,index是仍旧保持原来的,会有相同的index。

     

    对于相同的index,如果使用整数去iloc的话,实际上并不是一列,从上述结果可以看书,那么如果是使用loc呢?

    print(df.loc['0'])
    报错:KeyError: 'the label [0] is not in the [index]'
    那么就只能用iloc去索引了

     

    //去掉引号之后可以了。

    这说明,对于不指定index的,自动生成的0,1,2,3.是label,使用loc索引。

    删除行:

    使用pop函数,会将具有相同label的行删除。

    2020-3-3————————————

    1.行遍历数据框

    import pandas  as pd
    import numpy as np
    b=pd.read_csv("a.txt",names=['1','2','3','4','5'],skiprows=3,sep=' ')
    a=np.zeros((4,2))
    for i,v in b.iterrows():#这样就可以直接遍历行
        a[i,0]=v[0]#下面可以直接访问列对另一个矩阵赋值
        a[i,1]=v[2]

    a.txt:

    S.No Name Age City Salary df dfs
    1 Tom 28 Toronto 20000.0
    2 Lee 32 HongKong 3000.0
    3 Steven 43 BayArea 8300.0
    4 Ram 38 Hyderabad 3900.0

    2.对行按照行名进行重新放置

    import pandas  as pd
    import numpy as np
    b=pd.read_csv("a.txt",sep=' ')
    b.index=['a','b','c','d'] #直接这样就ok的啊。

    也是非常的简单,直接b.reindex([....])即可,也可以是别的df的index

  • 相关阅读:
    初始Dubbo
    ProcessBuilder执行本地命令
    Deep Learning的基本思想
    机器学习(Machine Learning)
    Group By和Order By的总结
    Oracle sqlldr命令
    redis的简单操作
    Java程序中做字符串拼接时可以使用的MessageFormat.format
    Bean的作用域
    DI延伸
  • 原文地址:https://www.cnblogs.com/BlueBlueSea/p/10284168.html
Copyright © 2020-2023  润新知