《自然语言处理实战入门》 ---- 第4课 :中文分词原理及相关组件简介 之 分词算法原理
文章大纲 分词算法介绍 语言模型 HMM CRF 结构化感知器 开源实现 bi LSTM 开源实现 汉语分词技术----以jieba 分词为例 Jieba分词的特点 分词算法 未登录词识别与词性标注 未登录词识别 词性标注 分词算法介绍 上一节课我们介绍了分词算法主要分为三个类别,除了基于统计算法的分词算法,基于规则的分词,一般都较为简单高效,但是词典的维护对于网络发达、新词层出不穷的今天,很难通过词典覆盖到所有的词。 随着大规模语料库的建立,统计机器学习方法的研究和发展, 来源: CSDN 作者: shiter 链接: https://blog.csdn.net/wangyaninglm/article/details/104206064