• python 中关于词云wordcloud的一些总结:


    wordcloud类

    from wordcloud import WordCloud
    
    wc = WordCloud(参数)
    
    #参数
    # font_path:字体文件(OTF或TTF)的路径,字符串
    
    # 绘图区宽度,默认400,整型
    
    # height:绘图区高度,默认200,整型
    
    # prefer_horizontal:单词倾向于水平放置还是垂直放置,如果值小于1,则会在不合适的情况下旋转单词,浮点型,默认0.9
    
    # mask:是否在给定的形状内绘制单词,这个参数使我们能够根据给定的轮廓形状绘制各种词云图,当此参数不为None时,width和height将被忽略,nd-array型或None,默认None
    
    # scale:计算过程和实际绘图的比例,浮点型,默认1
    
    # min_font_size:绘图时最小的字体大小,整型,默认4
    
    # font_step:字体大小的迭代步长,大于1时可能会出现错误排列,整型,默认1
    
    # max_words:绘图使用的最大单词数,整型,默认200
    
    # stopwords:排除的单词集,字符串集或None,默认为None时,内置的字符串集将会被使用
    
    # background_color:背景颜色,颜色值,默认为'black'
    
    # max_font_size:绘图时最大字体大小,整型或None,默认为None
    
    # mode:模式,默认为'RGB',当为'RGBA'时,倘若背景颜色为None,则会得到透明的背景
    
    # relative_scaling:单词出现频率对其字体大小的权重,值为0时,只考虑单词排名对字体大小的影响,值为1时,具有2倍出现频率的单词具有2倍的字体大小,一般值设置为0.5最棒,浮点型
    
    # color_func:颜色函数,用于生成不同颜色单词的词云图,默认为None
    
    # regexp:正则表达式,用于分词,默认为 r"w[w']+" 
    
    # collocations:是否包括二元词组,布尔型,默认为True
    
    # colormap:颜色图,随机分配颜色给每个单词,如果指定了color_func,则本参数被忽略,字符串或matplotlib colormap型,默认为'viridis'
    
    # normalize_plurals:移除单词末尾的's',布尔型,默认为True
    

    属性

    wc.words_
    #对应频率的词例,字典类型{字符串:浮点数}
    
    wc.layout_
    #记录每个单词的值,字体大小,位置,方向以及颜色,由一系列元组组成的列表,每个元组格式为(string, int, (int, int), int, color)
    

    方法

    wc.generate(text)
    #从文本中生成词云图
    
    wc.fit_words(frequencies)
    #根据给定单词及频率生成词云图
    #frequencies:元组型数组,每个元组包含一个单词及其频率
    
    wc.generate_from_frequencies(frequencies, max_font_size=None)
    #根据给定单词及频率生成词云图
    #frequencies:字典,包含字符串(单词):浮点数(频率)的值对
    #max_font_size:最大字体大小
    
    wc.process_text(text)
    #将长文本分词,并移除stopwords集合中的单词
    #返回字典,dict (string, int)
    
    wc.recolor(random_state=None, color_func=None, colormap=None)
    #重新上色
    #random_state:随机种子,整型或None
    
    wc.to_array()
    #以numpy矩阵的格式返回词云图
    
    to_file(filename)
    #以图片的格式返回词云图
    #filename:保存路径
    

      

  • 相关阅读:
    程序员修炼之道阅读笔记02
    第十五周课堂练习-查找最长单词链
    文件读写总结
    第十五周
    暑假总结1
    软件工程课程总结
    第十六周总结
    用户场景分析
    学期课后个人总结
    第十五周总结
  • 原文地址:https://www.cnblogs.com/chengxiaoxiao/p/14818051.html
Copyright © 2020-2023  润新知