NER,英文全称:Named Entity Recognition。主要是用来识别一段文本中哪些是物体的名字,比如人名、公司名。
常见算法如下:
CRF(Conditional random field,条件随机场)是一种判别式模型
对于NER任务,常见的标签体系包括IO、BIO、BMEWO、BMEWO+。下面举例说明不同标签体系的区别。
CRF++:C++实现,提供python 和 java接口。 详情参考这里。
NLTK : Python 的自然语言处理工具箱,使用方式参考这里。
Stanford NLP: Java 实现,但是集成到了 NLTK 里,所以也可以使用 Python。详情参考这里。
Sklearn_crfsuite: Python 的一个包,使用方式参考这里。
来源:博客园
作者:农夫三拳有点疼
链接:https://www.cnblogs.com/chen8023miss/p/11558320.html