pandas去除重复的列

Pandas提供了duplicated、Index.duplicated、drop_duplicates函数来标记及删除重复记录。

duplicated函数用于标记Series中的值、DataFrame中的记录行是否是重复，重复为True，不重复为False。

函数定义：

其中参数解释如下：

若index有相同的

d = df[~df.index.duplicated(keep='last')]
keep可取 first，last. first指保留第一个值，last则保留最后一个值。

相关阅读:
chrome sarfri form.submit bug
ruby首字母大写
ubuntu 10.04 中文设置
添加centos用户
农行的短信提醒很滞后
从github删除敏感数据
从github删除敏感数据
国内有不有做虚拟化或是叫云平台的朋友
设置rails header编码
centos5.5

原文地址：https://www.cnblogs.com/sssblog/p/16395756.html