pandas DataFrame是一个表格类型的数据,含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值)。DataFrame即有行索引,也有列索引,可以看作由Series组成的字典(公用同一个索引)。
DataFrame是以一个或者多个二维块存放的(而不是列表,字典或别的一维数据结构)
构建DataFrame
传入一个等长列表或Numpy数组组成的字典
DataFrame会自动加上索引,且全部列会被有序排列
可以指定序列的排序
传入的列在数据中找不到,会产生Na值
从DataFrame中获取Series---类似字典的方式,返回与DataFrame一样的索引
给列赋值---注意长度必须跟DataFrame的长度相匹配
若赋值的是一个Series,会精确匹配DataFrame的索引,所有的空为会填上缺失值
注意:
通过索引返回的数据只是相应数据的视图而已,并不是副本。因此,对返回的Series做的任何修改会反应到源DataFrame上
嵌套指点---字典的字典
外层字典的键作为列,内层键作为行索引
也可以对结果进行转置