Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册文档版本:v0.9
目录
1. 简介
1.1. 什么是Sphinx
1.2. Sphinx 的特性
1.3. 如何获得Sphinx
1.4. 许可协议
1.5. 作者和贡献者
1.6. 开发历史
2. 安装
2.1. 支持的操作系统
2.2. 依赖的工具
2.3. 安装Sphinx
2.4. 已知的问题和解决方法
2.5. Sphinx 快速入门教程
3. 建立索引
3.1. 数据源
3.2. 属性
3.3. 多值属性 (MV A: multi-valued attributes)
3.4. 索引
3.5. 数据源的限制
3.6. 字符集 , 大小写转换 , 和转换表
3.7. SQL 数据源 (MySQL, PostgreSQL)
3.8. xmlpipe 数据源
3.9. xmlpipe2 数据源
3.10. 实时索引更新
3.11. 索引合并
4. 搜索
4.1. 匹配模式
4.2. 布尔查询
4.3. 扩展查询
4.4. 权值计算
4.5. 排序模式
4.6. 结果分组(聚类)
4.7. 分布式搜索
4.8. searchd日志格式
5. API 参考
5.1. 通用API 方法
5.1.1. GetLastError
5.1.2. GetLastWarning
5.1.3. SetServer
5.1.4. SetRetries
5.1.5. SetArrayResult
5.2. 通用搜索设置
5.2.1. SetLimits
5.2.2. SetMaxQueryTime
5.3. 全文搜索设置
5.3.1. SetMatchMode
5.3.2. SetRankingMode
5.3.3. SetSortMode
5.3.4. SetWeights
5.3.5. SetFieldWeights
5.3.
6. SetIndexWeights
5.4. 结果集过滤设置
5.4.1. SetIDRange
5.4.2. SetFilter
5.4.3. SetFilterRange
5.4.4. SetFilterFloatRange
5.4.5. SetGeoAnchor
5.5. GROUP BY 设置
5.5.1. SetGroupBy
5.5.2. SetGroupDistinct
5.6. 搜索
5.6.1. Query
5.6.2. AddQuery
5.6.3. RunQueries
5.6.4. ResetFilters
5.6.5. ResetGroupBy
5.7. 额外的方法
5.7.1. BuildExcerpts
5.7.2. UpdateAttributes
6. MySQL 存储引擎 (SphinxSE)
6.1. SphinxSE 概览
6.2. 安装SphinxSE
6.2.1. 在MySQL 5.0.x 上编译SphinxSE
6.2.2. 在MySQL 5.1.x 上编译SphinxSE
6.2.3. SphinxSE 安装测试
6.3. 使用SphinxSE
7. 报告bugs
8. f选项参考
8.1. Data source 配置选项
8.1.1. type
8.1.2. sql_host
8.1.3. sql_port
8.1.4. sql_user
8.1.5. sql_pass
8.1.6. sql_db
8.1.7. sql_sock
8.1.8. mysql_connect_flags
8.1.9. sql_query_pre
8.1.10. sql_query
8.1.11. sql_query_range
8.1.12. sql_range_step
8.1.13. sql_attr_uint
8.1.14. sql_attr_bool
8.1.15. sql_attr_timestamp
8.1.16. sql_attr_str2ordinal
8.1.17. sql_attr_float
8.1.18. sql_attr_multi
8.1.19. sql_query_post
8.1.20. sql_query_post_index
8.1.21. sql_ranged_throttle
8.1.22. sql_query_info
8.1.23. xmlpipe_command
8.1.24. xmlpipe_field
8.1.25. xmlpipe_attr_uint
8.1.26. xmlpipe_attr_bool
8.1.27. xmlpipe_attr_timestamp
8.1.28. xmlpipe_attr_str2ordinal
8.1.29. xmlpipe_attr_float
8.1.30. xmlpipe_attr_multi
8.2. 索引配置选项
8.2.1. type
8.2.2. source
8.2.3. path
8.2.4. docinfo
8.2.5. mlock
8.2.6. morphology
8.2.7. stopwords
8.2.8. wordforms
8.2.9. exceptions
8.2.10. min_word_len
8.2.11. charset_type
8.2.12. charset_table
8.2.13. ignore_chars
8.2.14. min_prefix_len
8.2.15. min_infix_len
8.2.16. prefix_fields
8.2.17. infix_fields
8.2.18. enable_star
8.2.19. ngram_len
8.2.20. ngram_chars
8.2.21. phrase_boundary
8.2.22. phrase_boundary_step
8.2.23. html_strip
8.2.24. html_index_attrs
8.2.25. html_remove_elements
8.2.26. local
免费下载mysql8.2.27. agent
8.2.28. agent_connect_timeout
8.2.29. agent_query_timeout
8.2.30. preopen
8.2.31. charset_dictpath
8.3. indexer程序配置选项
8.3.1. mem_limit
8.3.2. max_iops
8.3.3. max_iosize
8.4. searchd程序配置选项
8.4.1. address
8.4.2. port
8.4.3. log
8.4.4. query_log
8.4.5. read_timeout
8.4.6. max_children
8.4.7. pid_file
8.4.8. max_matches
8.4.9. seamless_rotate
8.4.10. preopen_indexes
8.4.11. unlink_old
1. 简介
1.1. 什么是Sphinx
Sphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)
需要(Sphinxsearch)以获得商业授权。
一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。
当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS
的原生支持)。
搜索API支持PHP、Python、Perl、Rudy和Java,并且也可以用作MySQL存储引擎。搜索API非常简单,可以在若干个小时之内移植到新的语言上。
Sphinx 是SQL Phrase Index的缩写,但不幸的和CMU的Sphinx项目重名。
Coreseek 全文检索服务器2.0 是在Sphinx基础上开发的全文检索软件,按照GPLv2协议发行。Coreseek (seek) 为sphinx在中国地区的用户提供支持服务,如果您不希望
纠缠与琐碎的技术细节,请直接联系我。
本文可能存在潜在的翻译错误,如果您发现本文的翻译错误,请联系我:
我的:
coreseek@gmail李沫南
1.2. Sphinx的特性
高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒);
高性能的搜索(在2 – 4GB 的文本数据上,平均每次检索响应时间小于0.1秒);
可处理海量数据(目前已知可以处理超过100 GB的文本数据, 在单一CPU的系统上可处理100 M 文档);
提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法;
支持分布式搜索;
provides document exceprts generation;
可作为MySQL的存储引擎提供搜索服务;
支持布尔、短语、词语相似度等多种检索模式;
文档支持多个全文检索字段(最大不超过32个);
文档支持多个额外的属性信息(例如:分组信息,时间戳等);
停止词查询;
支持单一字节编码和UTF-8编码;
原生的MySQL支持(同时支持MyISAM 和InnoDB );
原生的PostgreSQL 支持.
1.3. 如何获得Sphinx
Sphinx 可以从www.sphinxsearch/ 下载,支持中文分词的Sphinx可以从seek/ 下载。
目前,Sphinx的发布包包括如下软件:
indexer: 用于创建全文索引;
search: 一个简单的命令行(CLI) 的测试程序,用于测试全文索引;
searchd: 一个守护进程,其他软件可以通过这个守护进程进行全文检索;
sphinxapi: 一系列searchd 的客户端API 库,用于流行的Web脚本开发语言(PHP, Python, Perl, Ruby)。
1.4. 许可协议
This program is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation; either version 2 of the License, or (at your option) any later version. See COPYING file for details.
This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details.
You should have received a copy of the GNU General Public License along with this program; if not, write to the Free Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
02111-1307 USA
If you don't want to be bound by GNU GPL terms (for instance, if you would like to embed Sphinx in your software, but would not like to disclose its source code), please contact the author to obtain
a commercial license.
1.5. 作者和贡献者
作者
Sphinx 的最初作者和目前的主要开发人员:
Andrew Aksyonoff, <shodan(at)shodan.ru>
贡献者
为Sphinx的开发出过力的人员和他们的贡献如下(以下排名不分先后):
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论