Python 使用 NLTK 实现简单情感分析--Twitter(推特)分析
一、环境搭建 1、安装第三方包nltk pip intall nltk==3.4.5 2、安装 nltk_data nltk_data 存放了很多语料数据, 包括大量的数据集,本文中就是用到了其中的 positive_tweets 和 negative_tweets 两个数据集来训练模型 安装方式有两种, 离线和在线, 推荐【使用离线】, 因为数据量很大, 在线下载通常会失败 [ a ] 在线下载 python交互式命令行中输入 import nltk nltk.download() 执行后会弹出下载窗口, 如果不需要全量下载, 选择对应分类下, 进行点击下载即可, 下载成功后会相应提示 installed 或者指定包进行下载, 同样还是python交互式命令行输入 import nltk nltk.download( ' punkt ' ) [ b ] 离线下载 (推荐使用) GitHub 下载地址: https://github.com/nltk/nltk_data 主要用到的是packages 文件夹下的内容 这就是全部的nltk_data 的内容 下载后需要进行简单配置 1、 将下载的packages 文件夹重命名为nltk_data 2、将重命名后的 nltk_data文件夹放置到nltk可以找到的路径下, 查看方法为 : >>>from nltk import data