• Python机器学习(九十七)Pandas 绘图


    Pandas的另一个优点是与Matplotlib的集成,可以直接绘制DataFrame和Series。

    注意:如没有安装Matplotlib,需首先安装:pip install matplotlib

    import matplotlib.pyplot as plt
    plt.rcParams.update({'font.size': 20, 'figure.figsize': (10, 8)}) # 将字体和图形设置为更大

    接下来开始绘图。

    首先画一下电影的评分和票房之间的关系,调用movies_df上的.plot()方法:

    # 加载数据
    movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title")
    movies_df.columns = ['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime', 
                         'rating', 'votes', 'revenue_millions', 'metascore']
    
    # 绘图                     
    movies_df.plot(kind='scatter', x='rating', y='revenue_millions', title='Revenue (millions) vs Rating')
    
    plt.show()

    输出

    图

    如果想要绘制单个列的简单直方图,可以调用列上的plot:

    movies_df['rating'].plot(kind='hist', title='Rating')

    输出

    图

    回忆一下describe()rating列中给出的统计信息:

    movies_df['rating'].describe()

    输出

    count    1000.000000
    mean        6.723200
    std         0.945429
    min         1.900000
    25%         6.200000
    50%         6.800000
    75%         7.400000
    max         9.000000
    Name: rating, dtype: float64

    使用箱线图,我们可以可视化这些数据:

    movies_df['rating'].plot(kind="box")

    输出

    图

    图

    箱线图说明

    通过组合rating_categoryrevenue_millions,可以创建一个票房箱线图:

    movies_df.boxplot(column='revenue_millions', by='rating_category')

    输出

    图

  • 相关阅读:
    C#基础 const和readonly关键字
    C#基础 base与this关键字
    ASP.NET Web Form 与 ASP.NET MVC 区别
    qt 零星笔记
    我应该记录一下我不太了解的一些c语言函数
    Linux学习书籍推荐
    更改arch的默认终端
    让arch阻止某个软件包的升级
    python pachong zhuanzai
    从贴吧看的逆向网络协议过程逆向校园网客户端
  • 原文地址:https://www.cnblogs.com/huanghanyu/p/13174217.html
Copyright © 2020-2023  润新知