文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。
《驾驭文本:文本的发现组织和处理》中文PDF,342页,带书签目录,文字可以复制。
《驾驭文本:文本的发现组织和处理》英文PDF,322页,带书签目录,文字可以复制。配套源代码。
链接:https://pan.baidu.com/s/1Skd-ELn_MCiSipTha6naIA
提取码:siet
复制这段内容后打开百度网盘手机App,操作更方便哦
《驾驭文本:文本的发现组织和处理》的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。

