博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
jieba+wordcloud+imageio—自定义词云
阅读量:5149 次
发布时间:2019-06-13

本文共 1199 字,大约阅读时间需要 3 分钟。

import jieba import wordcloud from imageio import imread mask=imread('fivestar.png') def shuchu():     txt=open('threekingdoms.txt','r',encoding='gb18030').read()     excludes={'将军','却说','荆州','二人','不可','不能','如此'}     words=jieba.lcut(txt)     counts={}     for word in words:         if len(word)==1:             continue         elif word=='诸葛亮' or word=='孔明曰':             rword='孔明'         elif word=='关公' or word=='云长':             rword='关羽'         elif word=='玄德' or word=='玄德曰':             rword='刘备'         elif word=='孟德' or word=='丞相':             rword='曹操'         else:             rword=word         counts[rword]=counts.get(rword,0)+1     for word in excludes:         del counts[word]     items = list(counts.items())     items.sort(key=lambda x:x[1],reverse=True)     for i in range(10):         word,count=items[i]         print('{0:<10}{1:>5}'.format(word,count)) shuchu() f=open('threekingdoms.txt','r',encoding='gb18030') t=f.read() f.close() ls=jieba.lcut(t) txt=' '.join(ls) w=wordcloud.WordCloud(font_path='msyh.ttc',width=1000,height=700,background_color='white',mask=mask) w.generate(txt) w.to_file('grwordcloud.png')

 

转载于:https://www.cnblogs.com/Aluosen/p/11509480.html

你可能感兴趣的文章
HTML5简单入门系列(四)
查看>>
AndroidStudio快捷键
查看>>
c++并发编程之原子操作的实现原理
查看>>
实现字符串反转
查看>>
Rotate Image
查看>>
WPF combobox 圆角制作
查看>>
转载:《TypeScript 中文入门教程》 5、命名空间和模块
查看>>
时间复杂度的计算
查看>>
苹果开发中常用英语单词
查看>>
MSSQL2005约束(三)-外键约束
查看>>
ubuntu下单网卡绑定多个IP
查看>>
[USACO 1.4.3]等差数列
查看>>
第二周 数据获取与表示 第二节 数据表示 Data representation
查看>>
Shader Overview
查看>>
[python]python学习笔记(五)
查看>>
Reveal 配置与使用
查看>>
Java中反射的学习与理解(一)
查看>>
多个jquery.datatable共存,checkbox全选异常问题的解决
查看>>
error LNK1112:模块计算机类型"X64" 与目标计算机类型"X86" 冲突
查看>>
数据库的操作
查看>>