python生成词云图

代码示例：


#!/usr/bin/python
#  coding: UTF-8
# coding:utf8
# wordcloud库默认为英文文本设置，默认字体也是英文
# jieba支持中文

import sys
from os import path
import os
from PIL import Image
import numpy as np
import matplotlib.pyplot
import jieba
import jieba.analyse
from wordcloud import WordCloud

matplotlib.use('TkAgg')
d=path.dirname(__file__)

# stopwords_path = 'stopwordsstopwords1893.txt' # 停用词词表

# 添加的自定义中文语句的代码在这里
jieba.add_word('路明非')

# 读取整个文本-要分析的文本
text=open(path.join(d,'doubancomment.csv')).read()

def jiebaclearText(text):
    mywordlist = []
    seg_list = jieba.cut(text, cut_all=False)  #精确模式
    liststr="/ ".join(seg_list)
    f_stop = open(path.join(d,'stopwords1893.txt'))
    try:
        f_stop_text = f_stop.read( )
        f_stop_text= f_stop_text.encode("utf-8")
    finally:
        f_stop.close( )
    f_stop_seg_list=str(f_stop_text,encoding="utf-8").split('
')
    for myword in liststr.split('/'):
        if not(myword.strip() in f_stop_seg_list) and len(myword.strip())>1:
            mywordlist.append(myword)
    return ''.join(mywordlist)

text1 = jiebaclearText(text)
print(text1)
file_path = os.path.abspath('.')
alice_mask=np.array(Image.open(path.join(d,"pyworld.png")))
font =file_path+ '/huawen.ttf'   #一定要设置中文字体否则显示乱码 先下载
print(file_path)
wc=WordCloud(background_color="black",font_path=font,max_words=2000,mask=alice_mask,stopwords=open(path.join(d,file_path + "/stopwords/stopwords1893.txt")).read())
# 生成一个词云图像
wordcloud=wc.generate(text1)
image=wordcloud.to_image()
# 展示生成的词云图像
image.show()

相关阅读:
linux打包解压包（.tar .gz .tar.gz .zip）
centos安装fusesshfs通过挂载目录实现数据双向同步
WSL远程访问Windows下的MySQL方法
Linux中hugepage的使用方法
Python科普系列——类与方法（下篇）
Treevalue(0x02)——函数树化详细解析（上篇）
Treevalue(0x03)——函数树化详细解析（下篇）
Python科普系列——类与方法（上篇）
个人网站迁移之旅：从博客到知识库，从 Hexo 到 Docusaurus
wpf 动画结束后保留end值，动画结束后会失去绑定，可以在completed事件重新进行绑定

原文地址：https://www.cnblogs.com/niuniumother/p/11321029.html