nltk.probability.FreqDist 自动识别语料库中词汇的频率分布

折月煮酒 提交于 2020-08-07 07:03:03

自动识别语料库中词汇的频率分布

方法 描述
fdist=FreqDist(samples) 创建包含给定样本的频率分布(samples可以是nltk.text.Text、空格分割的字符串、列表或者其他)
fdist.inc(sample) 增加样本
fdist[word] word在样本中出现的次数
fdist.freq(word) word在样本中出现的频率
fdist.N() 样本总数
fdist.keys() 样本list
for sample in fdist: 以频率递减顺序遍历样本
fdist.max() 数值最大样本
fdist.plot() 绘制频率分布图
fdist.plot(cumulative=True) 绘制累积频率分布图
>>> fdist = FreqDist(text1) >>> fdist.plot(50, cumulative=True)




标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!