[coreseek/sphinx学习笔记3]--建立索引
[参考Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册,详情见 http://www.coreseek.cn/docs/sphinx_doc_zhcn_0.9.pdf ] 3.1 数据源 索引数据是一个结构化的文档的集合,其中每个文档是字段的集合。 如果确有必要,一个索引的数据可以来自多个数据源。这些数据将严格按照配置文件中定义的顺序进行处理。所有从这些数据源获取到的文档将被合并,共同产生一个索引,如同他们来源于同一个数据源一样。 3.2 属性 属性是附加在每个文档上的额外的信息(值),可以在搜索的时候用于过滤和排序。目前支持的属性类型如下: 无符号整数(1-32 位宽) UNIX 时间戳(timestamps) 浮点值(32 位,IEEE 754 单精度) 字符串叙述 (尤其是计算出的整数值); 多值属性 MVA(multi-value attributes)(32 位无符号整形值的变长序列). 3.3 多值属性 MVA 多值属性 MVA(multi-valued attributes)是文档属性的一种重要的特例,MVA 使得向文档附加一系列的值作为属性的想法成为可能。这对文章的 tags,产品类别等等非常有用。MVA 属性支持过滤和分组(但不支持分组排序)。目前 MVA 列表项的值被限制为 32 位无符号整数。列表的长度不受限制,只要有足够的RAM