[coreseek/sphinx学习笔记1]--简介
[参考Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册,详情见 http://www.coreseek.cn/docs/sphinx_doc_zhcn_0.9.pdf ] 1.1 什么是Sphinx Sphinx 是 SQL Phrase Index 的缩写,但不幸的和 CMU 的 Sphinx 项目重名。Coreseek 全文检索服务器 2.0 是在 Sphinx 基础上开发的全文检索软件,按照 GPLv2 协议发行 1.2 特称: (1)高速的建立索引(在当代 CPU 上,峰值性能可达到 10 MB/秒); (2)高性能的搜索(在 2 – 4GB 的文本数据上,平均每次检索响应时间小于 0.1 秒); (3)可处理海量数据(目前已知可以处理超过 100 GB 的文本数据, 在单一 CPU 的系统上可处理 100 M 文档); (4)提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合 Ranking 方法; (5)支持分布式搜索; (6)provides document exceprts generation; (7)可作为 MySQL 的存储引擎提供搜索服务; (8)支持布尔、短语、词语相似度等多种检索模式; (9)文档支持多个全文检索字段(最大不超过 32 个); (10)文档支持多个额外的属性信息(例如:分组信息,时间戳等);