• Pandas也能修改样式?快速给你的数据换个Style!


    前言

    在之前的很多文章中我们都说过,Pandasopenpyxl有一个很大的区别就是openpyxl可以进行丰富的样式调整,但其实在Pandas中每一个DataFrame都有一个Style属性,我们可以通过修改该属性来给数据添加一些基本的样式。

    使用说明

    我们可以编写样式函数,并使用CSS来控制不同的样式效果,通过修改Styler对象的属性,将样式传递给DataFrame,主要有两种传递方式

    • Styler.applymap:逐元素
    • Styler.apply:列/行/表方式

    Styler.applymap通过DataFrame逐个元素地工作。Styler.apply根据axis参数,按列使用axis=0,按行使用axis=1,以及axis=None作用于整个表。所以若使用Styler.applymap,我们的函数应返回带有CSS属性-值对的单个字符串。若使用Styler.apply,我们的函数应返回具有相同形状的Series或DataFrame,其中每个值都是具有CSS属性值对的字符串。

    不会CSS?没关系,作为调包侠的我们大多是改改HTML颜色代码即可完成样式修改,下面看一些示例。

    一些例子

    基本样式

    首先我们创建一组没有任何样式的数据

    img

    我们之前说过,DataFrame是有style属性的,所以在没有做任何修改的情况下,使用df.style应该和上图一样

    img

    现在让我们编写一个简单的样式函数,该函数可以将负数变为红色,使正数保持黑色。

    def color_negative_red(val):
    
        color = 'red' if val < 0 else 'black'
        return 'color: %s' % color
    

    现在来应用这段函数(思考Excel如何实现)

    img

    现在如果我们想突出显示每列中的最大值,需要重新定义一个函数

    def highlight_max(s):
    
        is_max = s == s.max()
        return ['background-color: yellow' if v else '' for v in is_max]
    

    因为之前我们是以元素为单位判断,所以使用的是.applymap,所以现在我们应对列进行.apply``操作

    img

    现在可以使用

    df.style.applymap(color_negative_red).apply(highlight_max)
    

    来混合修改样式或使用.实现

    img

    当然我们也可以通过修改样式函数并使用.apply来高亮整个DataFrame的最大值,

    img

    切片

    当然我们也可以使用subset通过切片来完成对指定列进行样式修改,比如高亮部分列的最大值

    df.style.apply(highlight_max, subset=['B', 'C', 'D'])
    

    img

    对于行和列切片,可以使用我们熟悉的.loc,不过目前仅支持基于标签的切片,不支持位置切片。

    格式化输出

    我们也可以使用Styler.format来快速格式化输出,比如将小数格式化为百分数

    img

    也支持使用字典或lambda表达式来更灵活的使用

    img

    当然是支持和之前的样式结合使用

    img

    内置样式

    开发者们为了尽可能的让作为调包侠的我们使用起来更方便,已经内置了很多写好的样式,拿走就用,比如将空值设置为红色

    img

    或是结合seaborn使用热力图

    img

    现在我们就可以通过修改Styler.background_gradient来轻松的修改颜色等样式

    img

    最后我们可以将数据修改为条形图的样式,这也是我最喜欢的一个功能,能够快速的看出数据的变化!

    img

    在最新的版本中可以进一步自定义条形图:我们现在可以将df.style.bar以零或中点值为中心来快速观察数据变化,并可以传递颜色[color_negative, color_positive],比如使用align='mid'

    img

    以上就是对Pandas中如何修改样式的一个简单介绍,更多的操作可以在官方文档https://pandas.pydata.org/pandas-docs/stable/user_guide/style.html中找到与学习。

  • 相关阅读:
    win7承载网络状态不可用,无线网卡驱动更新后也仍然不可用。
    oracle中读写blob字段的问题
    The import javax.servlet cannot be resolved
    关于BLOB数据类型插入ORACLE数据库的操作
    Android Spinner自动弹出列表,设置title
    java.lang.LinkageError: loader constraint violation: when resolving interface... 异常解决
    Java获取网络时间
    android 改变CheckBox和后面文字的间距
    大白话系列之C#委托与事件讲解(序言)
    大白话系列之C#委托与事件讲解(一)
  • 原文地址:https://www.cnblogs.com/liuzaoqi/p/13335217.html
Copyright © 2020-2023  润新知