Python-pandas
Python 中处理时间序列的主要工具是 pandas 库.
1.pannas 基础
1.1使用 DataFrame 类的第一步
#!/etc/bin/python
#coding=utf-8
import numpy as py
import pandas as pd
df = pd.DataFrame([10, 20, 30, 40], columns=['numbers'],index=['a','b','c','d'])
print df
1.2使用 DataFram 类的第二步
a = np.random.standard_normal((9,4))
print a.round(6)
df = pd.DataFrame(a)
print df
df.columns=[['No1','No2','No3','No4']]
1.3 pandas如何取出表中一列数据所有的值并转换为array类型
# -*-coding: utf-8 -*-
import pandas as pd
#读取csv文件
df=pd.read_csv('A_2+20+DoW+VC.csv')
#求‘ave_time’的平均值
aveTime=df['ave_time'].mean()
#把ave_time这列的缺失值进进行填充,填充的方法是按这一列的平均值进行填充
df2=df.fillna(aveTime)
#取表中的第3列的所有值
col=df2.iloc[:,2]
#取表中的第3列的所有值
arrs=col.values
#输出结果
print(arrs)