Py之pandas：dataframe学习【转载】

Py之pandas：dataframe学习【转载】
转自：https://www.tutorialspoint.com/python_pandas/python_pandas_dataframe.htm

1.数据框4特性
- 列是不同类型的数据元素。
- 每列的长度可变
- 行和列都有标签
- 对行和列可进行算术运算。
可将其视为SQL表。//这个十分容易理解了。

2.创建
```
pandas.DataFrame( data, index, columns, dtype, copy)
```
其中Data可以是list，dict，array，series，map，等。
- Lists
- dict
- Series
- Numpy ndarrays
- Another DataFrame
index是对行的索引，column是列名。

空

从List

从dict

3.列操作

选择列，直接用列名即可。

添加列：

删除列，

使用del函数或者pop函数：

4.行操作

对行索引，

可以通过label来进行，那么使用loc；通过行数字来进行，使用iloc:

//行号是从0开始的。

对行进行数据切片：

//直接使用冒号即可，并且右边的数是取不到的。

添加行，使用append函数

//注意上述，append了之后，index是仍旧保持原来的，会有相同的index。

对于相同的index，如果使用整数去iloc的话，实际上并不是一列，从上述结果可以看书，那么如果是使用loc呢？
```
print(df.loc['0'])
报错：KeyError: 'the label [0] is not in the [index]'
那么就只能用iloc去索引了
```
//去掉引号之后可以了。

这说明，对于不指定index的，自动生成的0，1，2，3.是label，使用loc索引。

删除行：

使用pop函数，会将具有相同label的行删除。

2020-3-3————————————

1.行遍历数据框
```
import pandas  as pd
import numpy as np
b=pd.read_csv("a.txt",names=['1','2','3','4','5'],skiprows=3,sep=' ')
a=np.zeros((4,2))
for i,v in b.iterrows():#这样就可以直接遍历行
    a[i,0]=v[0]#下面可以直接访问列对另一个矩阵赋值
    a[i,1]=v[2]
```
a.txt:
```
S.No Name Age City Salary df dfs
1 Tom 28 Toronto 20000.0
2 Lee 32 HongKong 3000.0
3 Steven 43 BayArea 8300.0
4 Ram 38 Hyderabad 3900.0
```
2.对行按照行名进行重新放置
```
import pandas  as pd
import numpy as np
b=pd.read_csv("a.txt",sep=' ')
b.index=['a','b','c','d'] #直接这样就ok的啊。
```
也是非常的简单，直接b.reindex([....])即可，也可以是别的df的index
相关阅读:
初始Dubbo
ProcessBuilder执行本地命令
 Deep Learning的基本思想
 机器学习（Machine Learning）
Group By和Order By的总结
 Oracle sqlldr命令
 redis的简单操作
 Java程序中做字符串拼接时可以使用的MessageFormat.format
Bean的作用域
 DI延伸
原文地址：https://www.cnblogs.com/BlueBlueSea/p/10284168.html

Py之pandas：dataframe学习【转载】

1.数据框4特性

2.创建

空

从List

从dict

3.列操作

添加列：

删除列，

4.行操作

对行索引，

对行进行数据切片：

添加行，使用append函数

删除行：

1.行遍历数据框

2.对行按照行名进行重新放置