• 有txt文本和图片,就能用python生成词云图


    使用现有的txt文本和图片,就可以用wordcloud包生成词云图。大致步骤是:

    1、读取txt文本并简单处理;

    2、读取图片,以用作背景;

    3、生成词云对象,保存为文件。

    需要用到3个库:jieba(用于分割文本为词语)、imageio(用于读取图片)、wordcloud(功能核心,用于生成词云)。

    我用简历和我的照片,生成了一个词云图:

    代码如下:

    import jieba
    import imageio
    import wordcloud
    
    
    # 读取txt文本
    with open('resume.txt','r',encoding='utf-8') as f:
        text = f.read()
    
    # 简单处理文本,删除空格等多余字符
    text = text.replace(' ','').replace('	','').replace('
    ','')
    # 使用jieba分隔词语
    wordlist = jieba.lcut(text)   # ['aa','bb','cc'...]
    # print(wordlist)
    # 用空格连接各个词语,又形成一个大字符串
    string = ' '.join(wordlist)   # 'aa bb cc'
    
    # 读取图片
    image = imageio.imread('ding.jpg')
    
    
    # 生成词云图片
    # 先实例化一个词云对象
    wc = wordcloud.WordCloud(width=image.shape[0],  # 词云图宽度同原图片宽度
                            height=image.shape[1],
                            background_color='white',  # 背景颜色白色
                            font_path='msyh.ttc',  # 指定字体路径,微软雅黑,可从win自带的字体库中找
                            mask=image,   # mask 指定词云形状图片,默认为矩形
                            scale=3)   # 默认为1,越大越清晰
    # 再给词云输入文字
    wc.generate(string)
    # 保存成文件
    wc.to_file('wordcloud21.png')
  • 相关阅读:
    贝叶斯定理经典案例
    java 简单秒杀
    menu JPopupMenu JTabbedPane
    java String matches 正则表达
    gg mirror
    后台计时
    css 标题
    ajax dataType
    jQuery ajax
    java null 空指针
  • 原文地址:https://www.cnblogs.com/djlbolgs/p/12912625.html
Copyright © 2020-2023  润新知