pandas 基本操作

pandas 基本操作

1.     一维数据结构Series

a. 概念：Series 是pandas 的一维数据结构，有重要的两个属性 index 和values

b. 初始化: 可以通过 python 的 List 、dict 、np.array 初始化

如果使用np.array或者python 的list 创建 Series 会得到其index 是默认的 0，1，2 这样的数字

>>> s = pd.Series([1,2,3])

>>> s.index

RangeIndex(start=0, stop=3, step=1)

如果使用 python 的dict 来创建的 Series 其 index 对应的是 dict 的key

s2 = pd.Series({'1':1,'a':2,3:3})

>>> s2.index

Index([3, u'1', u'a'], dtype='object')

c. 元素访问类似 dict 访问

s[0] // 访问第一个元素

s[‘a’]// 访问列名为a的元素

s.a // 访问列名为a的元素

s[s>4]// 返回大于4的元素

d.  转换dict 、np.array

s.values 或者 s. as_matrix()

s.to_dict()

2. 二维数据dataframe

a．常用的读入方法

1)     内存读入：pd.read_clipboard()

2)     文件读入：pd.read_csv(path)

b. 列操作

(1)查看包含的所有的列的列名df.columns

(2)过滤掉多个列，返回一个新的dataframe

df_new = pd.DataFrame(df,columns=['id','section_id','start_road_id'])

(3)过滤一个列

df.id 或 df[‘id’]

(4)增加一个列并赋初值

df['new_ids']=1 或 df['new_ids']=np.arange(0,len(df)) (5) 增加一列，并赋初值，只给部分行填充数据

df['new_id2']=pd.Series([200,300],index=[2,3]) # 只给第2，3行填充了数据，其余的数据为NAN
相关阅读:
js获得动态生成的标签
 自定义字段在List和ClassList等标签里的使用方法
 asp.net dropdownlist 取不到值
 MXCMS新增标签IFrame 包含标签
 JS打印
 Flash图表解决方案 Finger Chart
推荐个免费的客户端控件
 C#利用反射获取对象属性值
 位置导航MXCMS Position标签说明
 OAuth简介
原文地址：https://www.cnblogs.com/oftenlin/p/7857450.html