pandas常用操作

Series:

一维数据结构，，类似字典或者numpy中元素带标签的数组。其中每一个元素都有一个标签（可以为数字或字符串），具有索引，具有键值对对应关系，能够排序，切片等操作。

s=pd.Series([0,1,2,3,4,np.NAN,'a'])　　#也可以直接传入一个数组

DataFrame：

dates = pd.date_range('20130101',periods=6)
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['A','B','C','D'])
In [76]:df
Out[76]: 
                   A         B         C         D
2013-01-01 -2.359309 -0.065001  1.099911 -0.886392
2013-01-02  0.318336  0.715261  0.060752  1.326758
2013-01-03  0.515914  1.482326 -0.973154  1.766126
2013-01-04  1.875221 -0.316619 -0.543997  0.864037
2013-01-05 -0.697887  0.065137 -0.899040  0.826392
2013-01-06 -0.205943 -1.532289  1.849114  1.267895

df2 = pd.DataFrame({'A':1,
                    'B':pd.Timestamp('20130102'),
                    'C':pd.Series(1,index=range(4)),
                    'D':np.array([3]*4,dtype='int'),
                    'E':'foo'})

In [78]:df2
Out[78]: 
   A          B  C  D    E
0  1 2013-01-02  1  3  foo
1  1 2013-01-02  1  3  foo
2  1 2013-01-02  1  3  foo
3  1 2013-01-02  1  3  foo

dataframe常用操作：

查看前N行查看后M行	df.head(n) df.tail(m)
查看索引	df.index
查看值	df.values
查看列名	df.columns
查看数据有多少行	len(df)
查看数据信息均值，方差，最小，最大	df.describe()
复制一个完全一样的对象	df2=df.copy()
对数据进行行列转置	df.T

- 方法一、df['A']
- 方法二、df.A
- 方法三、df.loc[:,['A']]
In [20]:df['A']
Out[20]: 
2013-01-01    0.134964
2013-01-02    1.490029
2013-01-03    0.329824
2013-01-04    0.135711
2013-01-05    0.104873
2013-01-06   -0.218562
Freq: D, Name: A, dtype: float64
#选择一列
- 方法一、df[['A','B']]
- 方法二、df.loc[:,['A','B']]
- 方法三、df.ix[:,['A','B']]
#选择两列
In [30]:df[(df.A>0) & (df.B<0)]
Out[30]: 
                   A         B         C         D
2013-01-01  0.134964 -1.454443 -0.310064  1.195568
2013-01-02  1.490029 -0.561749  0.524751  0.522473
2013-01-04  0.135711 -0.148830 -0.380225 -0.753513
#根据某一列或者几列进行条件筛选

相关阅读:
UML用例图总结
项目管理心得：一个项目经理的个人体会、经验总结
UML类图符号简介
C++中栈和堆上建立对象的区别
Win32 API
Python
remove extra kernel
Create short cut
Set Form Position
Get folder

原文地址：https://www.cnblogs.com/pythonlearing/p/9812868.html