复合列名不好引用,我们想重新命名,假如有如下表:
我们直接使用重命名
card_state_nouse = card_state_nouse.rename(columns={('ref_id', 'count'):'weijihuo_count',('creditlimitamount', 'sum'):'weijihuo_amount', ('card_month', 'max'):'weijihuo_minmonth',('card_month', 'min'):'weijihuo_maxmonth' },errors='raise')
发现结果还是
经百度可以这样
card_state_nouse.columns = card_state_nouse.columns.to_flat_index() #然后再跑这段 card_state_nouse = card_state_nouse.rename(columns={('ref_id', 'count'):'weijihuo_count',('creditlimitamount', 'sum'):'weijihuo_amount', ('card_month', 'max'):'weijihuo_minmonth',('card_month', 'min'):'weijihuo_maxmonth' },errors='raise')
结果OK
但是我们也可以直接这样
card_state_nouse.columns = ['weijihuo_count','weijihuo_amount','weijihuo_minmonth','weijihuo_maxmonth']
如果我们想使用原来的拼接的列名,则可以这样
table_cnt.columns = [('_'.join(col).rstrip('_'))+'_cnt' for col in table_cnt.columns.values]
总结:
我们既可以使用rename,也可以使用columns=[],这二者的区别是,前者可以只修改某个列名,二后者必须给出全部的列名,当列名很多时候,前者就很有价值
还需要主要一下to_flat_index 的用法
2021.02.22补充
def flatten_multi_index(multi_index, join_str='_'): """把 MultiIndex 展平为 1 维。返回一维 Index 参数: ----------- multi_index: MultiIndex 对象 join_str: str, 连接第一层和第二层 label 的字符串 返回: ----------- index: 展平后的 index 对象。""" label0 = multi_index.get_level_values(0) label1 = multi_index.get_level_values(1) index = [i + join_str + j for i,j in zip(label0, label1)] return pd.Index(index)