topicrank:是文本关键词抽取的一个模型方法,因为课程原因需要了解这篇论文,想跑下它的代码
想跑下topicrank的代码,结果还搞了半天,特此记录一下。
首先给出代码的链接:https://github.com/smirnov-am/pytopicrank
然后给出环境的配置:(相关环境的要求如下)
在配置的文件中给出了了需要的包的版本,python3就可以,我用的是3.6.9
因为在我之前的环境中安装了某个包时出错了,所以我打算重新创建了一个新的环境,这里就要安利一下anaconda的方便之处了。
其中出现的主要问题是:
一、安装langdetect这个包时,发现老是出现错误,后面我的解决办法是删除了anaconda的一些镜像源地址,然后单独地使用一个镜像源地址进行下载,发现就可以了。
在安装的过程中发现windows下可能会出现问题,后面装在Linux的服务器上就没有问题了。
1.删除所有的镜像源,换回默认源:
换回默认源:conda config --remove-key channels
2.然后下载包的时候单独添加一个清华的镜像源:
conda install -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ langdetect==1.0.7
二、在所有的库都安装后,运行时发现出现了nltk模块的报错信息:
会给出类似的错误,我记得大概是还要装3个类似的工具,解决办法就是根据他的提示在Python用命令安装所需要的工具。
import nltk
nltk.download('punkt')
然后根据他的提示下载了一些里面的数据包,最终成功解决问题。有一个包比较慢,请耐心等待。
来源:CSDN
作者:痛快最重要
链接:https://blog.csdn.net/qq_38247544/article/details/103758002