使用jieba库与wordcloud库第三方库进行词频统计

怎甘沉沦 提交于 2020-04-25 09:46:54

一、jieba库与wordcloud库的使用

1.jieba库与wordcloud库的介绍

  jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。

  wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。

2.安装jieba库与wordcloud库

  在运行里输入 pip install wordcloud和pip install jieba,等待安装完成。

二、jieba函数介绍

三、调用库函数

from wordcloud import WordCloud
with open("斗破苍穹.txt" ,encoding="utf-8")as file:
    #1.读取文本内容
    text=file.read()
    #2.设置词云的背景颜色、宽高、字数
    wordcloud=WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",
    background_color="black",width=600,
    height=300,max_words=50).generate(text)
    #3.生成图片
    image=wordcloud.to_image()
    #4.显示图片
    image.show()

 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!