• Series.str方法


    1 对dataframe的某一列用str处理后,其类型是<class 'pandas.core.strings.StringMethods'>.可以对df.['列名'].str直接进行切片操作.

    如下实现了将df中某列的字符串分割,后生成新的df.用apply函数也可以实现如下功能,但非常慢.

    参考:https://blog.csdn.net/yueyao121107/article/details/79730934

    df = pd.DataFrame({'appid':['a00140327#a00170298#a00184278#a00187480',
                                'a00158535#a00163116#a00170432#a00187480#a00224345',
                                'a00109386#a00170432#a0021880#a00244790#a00247567',
                                'a00170298#a00203358#a00275200']})
    df = df.head(2)
    print(df)
    # df = df['appid'].str.split('#', expand=True).stack().reset_index(level=1, drop=True)
    df = df['appid'].str
    df = df.split('#', expand=True)         # 参数expand,这个参数取True时,会把切割出来的内容当做一列,产生多列,否则切换出来的是一个list
    df = df.stack()
    df = df.reset_index(level=1,drop=True)  # 将索引的第一列置位普通列,并删除.
    print(df)
    print(type(df))
    #                                                appid
    # 0            a00140327#a00170298#a00184278#a00187480
    # 1  a00158535#a00163116#a00170432#a00187480#a00224345
    # 0    a00140327
    # 0    a00170298
    # 0    a00184278
    # 0    a00187480
    # 1    a00158535
    # 1    a00163116
    # 1    a00170432
    # 1    a00187480
    # 1    a00224345
    # dtype: object
    # <class 'pandas.core.series.Series'>
  • 相关阅读:
    更新内容
    小书匠预览操作说明
    小书匠预览操作说明
    2017-4-24(1493037086057未命名文件 测试资源是否正确上传
    ASDASASD
    2017-4-24(1493037086057未命名文件 测试资源是否正确上传
    HttpCanary使用指南——静态注入器
    HttpCanary实战教程
    TC软件分析笔记
    飘零金盾8.5本地笔记
  • 原文地址:https://www.cnblogs.com/xxswkl/p/11017725.html
Copyright © 2020-2023  润新知