从Mar 25到现在May 7,3月25到5月7号,算起来也有一个半月,终于初步完成了这本书的学习,从numpy到pandas,再到matplotlib,对python有个初步的认识和理解,那么下一步该通过例子来加强和巩固所学的东西,再花一周的时间把基础全部给过一遍,总结和写博客。
在这一步完成后,开始搞kaggle,找俩个例子,精读。 [2018年05月07日22:47:44]
说好的一周实际上花了差不多一周耶,感觉时间花都了,近期健身回来感觉有点累,但比以前躺着就睡着了好多了,很喜欢这种状态。那么接下来帮助朋友把论文中数据分析搞定,然后开始进军kaggle啦。 [2018年05月15日23:20:38]
文件处理: csv, table, json, txt, db
数据排序: value_counts, argsort, sort_values, searchsorted
分组分类: groupby, pivot_table, stack, unstack, unique, cut, qcut
数据截取: take, loc, iloc, head, tail
可视化: 直方图,曲线图 (matplotlib, seaborn)
数据合并: merge, concat, cumsum
数据过滤: fillna, list迭代过滤, isin, drop_duplicates
数据转换: rename, map转换, apply
暂时这么多,看到后再分类[2018年05月07日23:08:34]
持续更新...
书籍《利用Python进行数据分析·第二版》 网上翻译来源