nltk

使用 skip-thoughts 提取句子特征

…衆ロ難τιáo~ 提交于 2020-11-11 08:20:18
文章目录 1. 原理 2. 使用 2.1 环境要求 2.2 步骤 3. 结果 1. 原理 参考以下博客学习原理, https://blog.csdn.net/liujh845633242/article/details/102572241 可以理解为, 此模型能够将一个句子 提取其特征, 与word2vec类似, 相当于一个 sentence2vec 是16年的 Skip-Thought Vectors 论文提出的 2. 使用 2.1 环境要求 首先我们需要用以下 环境 ,注意容易搞错的点就是 NLTK == 3 , 在ubantu系统下 16.04 Python 2.7 Theano 0.7 scikit-learn NLTK 3 Keras gensim 如果是python3 版本 建议使用 mkvirtualenv 工具,创建一个python2环境, 这里加了 -p /usr/bin/python2.7, 其中/usr/bin/python2.7 表示python2的路径,需要换成自己的python2路径 mkvirtualenv -p /usr/bin/python2.7 py2env 其中我的版本如下, 如果不知道按照什么版本,那建议用以下版本 在下载nltk 后, 可能会要你下载一个punkt 包,这里建议直接从提示找不到的位置,新建 nltk_data 文件夹,