• 用python实现多个表格合并按字段去重


    需求

    在xx银行项目中遇到的一个需求,是将系统中的8张余额表下载到指定的文件夹中,然后从文件夹中读取这8张余额表,将其合并为一张余额汇总表,在合并的时候要将组合名称重复的多行数据去重,并将其所对应的余额相加

    实现

    使用python中的pandas库来完成

    import pandas as pd
    
    
    def custody_merge(src_dic, path):
        '''
        src_dic:所有表汇总后的数据字典,有重复数据
        path:合并完成后文件要存放的路径
        '''
        df = {'账户号': [], '组合名称': [], '余额': []}
        table = pd.DataFrame(src_dic, columns=list(src_dic.keys()))
        # 按组合名称分组
        group_by_name = table.groupby('组合名称')
        for tuple_table in group_by_name:
            list_table = list(tuple_table)
    
            pd1 = pd.DataFrame(list_table[1])
    
            # 余额相加
            balance = sum(pd1['余额'])
    
            # 将pd1转换为字典
            df1 = pd1.to_dict(orient='records')[0]
            df['账户号'].append(df1['账户号'])
            df['组合名称'].append(df1['组合名称'])
            df['余额'].append(balance)
    
        # 写入excel
        cus_balance_table = pd.DataFrame(df, columns=list(df.keys()))
        writer = pd.ExcelWriter(path)
        cus_balance_table.to_excel(writer, index=False)
        writer.save()
    

      

  • 相关阅读:
    新词发现
    隐马尔可夫模型
    nodejs命令行解析工具之minimist
    react 生命周期
    react 中的 super super(props)
    object 常用方法总结
    前端安全 中间人攻击
    Postgresql的临时表的用法
    windows下postgresql数据库备份和还原
    PostgreSQL 数据库开发规范——命名规范 & 设计规范
  • 原文地址:https://www.cnblogs.com/rongge95500/p/11063233.html
Copyright © 2020-2023  润新知