一、介绍
Pandas
的基础结构分为两种:
- 数据框 DataFrame
- 序列 Series
数据框(DataFame)是拥有轴标签的二维链表,类似于 Excel 中的行列关系。
列标签为列名,行标签为索引。
iterrows()
是在数据框中的行进行迭代的一个生成器,返回每行的索引以及一个包含行本身的对象。
二、实操
建立测试数据集。
import pandas as pd
import numpy as np
df = pd.DataFrame({
'a': range(5),
'b': list('abcde'),
'c': np.random.randn(5),
'd': np.random.randn(5),
'e': np.random.randn(5)
})
df
'''
a b c d e
0 0 a -0.132885 0.565630 -0.837642
1 1 b -0.290722 2.363767 -0.581337
2 2 c 0.919731 -0.191452 -0.109648
3 3 d -0.509702 -2.129329 0.419094
4 4 e -0.041131 -0.672666 0.784658
'''
行遍历测试。
# 行遍历
for index, row in df.iterrows():
print(index)
print(row)
'''
0
a 0
b a
c -0.132885
d 0.56563
e -0.837642
Name: 0, dtype: object
1
a 1
b b
c -0.290722
d 2.36377
e -0.581337
Name: 1, dtype: object
'''
iterrows()
返回值为元组 (index, row)
。