nlp概述
接触NLP也有好长一段时间了,但是对NLP限于知道,但是对整体没有一个很好的认识。特整理了一下思绪,总结记录下: 一、NLP的定义 还是按照常规的逻辑来看下定义:NLP(Natural Languange Processing,自然语言处理),方法是应用计算机来处理,理解和应用人类语言,目的是达到人机之间进行交流。 分成自然语言理解和自然语言生成两部分。引用一个表来概括下: 二、NLP的应用 机器翻译:将一种语言翻译成另外一种语言,例如:百度翻译 情感分析:挖掘人们的观点,情绪对产品、服务等的态度,来评价服务等。起源博客等社交网络。 智能问答:机器人回答输入的问题,一些网站的智能问答。 文摘生成:机器准确归纳,总结并产生文本摘要。 文本分类:采集各种文章,进行主题分析,从而进行自动分类。例如垃圾邮件等。 舆论分析:通过舆论的内容,半段舆论的导向。分析传播路径以及发展规律,对不好的舆论进行有效控制。 知识图谱:把知识点通过相互之间的连理连接起来的网络图。 三、NLP知识构成 自然语言处理作为一门比较热的行业,需要语言学、统计学、机器学习、深度学习及自然语言相关理论知识。 句法语义分析:针对目标句子进行分词,词性标注,命名实体识别,句法分析,语义角色识别和多一次消歧等。 关键词提取:提取目标文本中的主要信息。主要明确,谁,什么时间,什么原因,干了什么事,有啥结果。主要涉及实体识别