原文: http://blog.gqylpy.com/gqy/356
安装:pip install jieba
jieba
模块用于将一句或多句话按词组分割为列表.
如下示例:
import jieba """cut""" s = '我就喜欢写代码' res01 = list(jieba.cut(s)) # ['我', '就', '喜欢', '写', '代码'] # 还可以添加词组: jieba.add_word('写代码') res02 = list(jieba.cut(s)) # 添加词组后的结果: # ['我', '就', '喜欢', '写代码'] """cut_for_search""" # cut_for_search方法适用于搜索引擎构建倒排索引的分词,力度比较细 s = '人如果没有梦想,那跟咸鱼有什么区别呢?' # 添加词组 jieba.add_word('有什么') res03 = list(jieba.cut_for_search(s)) # 添加词组后,使用cut_for_search的结果: # ['人', '如果', '没有', '梦想', ',', '那', '跟', '咸鱼', '什么', '有什么', '区别', '呢', '?']