中文全文检索

PostgreSQL的中文全文检索(二)

夙愿已清 提交于 2019-12-10 07:14:31
上一篇介绍了postgresql全文检索的环境和一些示例,http://my.oschina.net/Kenyon/blog/80904,都是基于其自带的模式,目前版本默认并不支持中文的全文检索,但是我们的实际使用过程中肯定会有用到中文的检索,好在有强大的社区支持,结合第三方工具可以简单实现PG的中文全文检索。 PG的中文全文检索步骤也主要分三步走: 1.将中文分词 2.转换分词,去掉无意义分词 3.按一定顺序排序,建索引加快查询 一、使用到的测试环境与工具 VMWARE 6.0 PostgreSQL 9.1.2 CRF++-0.57 下载地址:http://crfpp.googlecode.com/svn/trunk/doc/index.html nlpbamboo-1.1.2 下载地址:http://code.google.com/p/nlpbamboo/downloads/list index.tar.bz2 下载地址:http://code.google.com/p/nlpbamboo/downloads/list 二、部署过程 (root用户) 1.先安装CRF cd CRF++-0.57 ./configure make make install 2.安装nlpbamboo cd nlpbamboo mkdir build cd build cmake ..