首页 > CMS > PhpCMS > 正文

phpcms中使用sphinx全文索引教程

2024-09-10 07:16:20
字体:
来源:转载
供稿:网友

Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件

phpcms sphinx全文索引教程

英文介绍:http://www.sphinxsearch.com/docs/manual-0.9.9.html

一、首先需要在服务器上安装sphinx

在Windows上安装sphinx

1.下载支持mysql的包 http://www.sphinxsearch.com/downloads/sphinx-0.9.9-win32.zip

2.解压缩 sphinx-0.9.9-win32.zip 到 D:\sphinx

3.安装sphinx服务,在命令行执行命令

D:\sphinx\searchd –install –config d:\sphinx\sphinx.conf –servicename SphinxSearch

英文参照:http://www.sphinxsearch.com/docs … #installing-windows

1.下载源码包 http://www.sphinxsearch.com/downloads/sphinx-0.9.9.tar.gz

  1. $ tar xzvf sphinx-0.9.8.tar.gz 
  2. $ cd sphinx 
  3. $ ./configure –prefix=/usr/local/sphinx –with-mysql=/usr/local/mysql 
  4. $ make 
  5. $ make install 

常见问题1

  1. /usr/local/sphinx-0.9.9/src/sphinx.cpp:20060: undefined reference to libiconv_open' 
  2. /usr/local/sphinx-0.9.9/src/sphinx.cpp:20078: undefined reference to libiconv‘  //开源软件:Vevb.com 
  3. /usr/local/sphinx-0.9.9/src/sphinx.cpp:20084: undefined reference to libiconv_close' 
  4. collect2: ld returned 1 exit status 
  5. make[2]: *** [indexer] Error 1 
  6. make[2]: Leaving directory /home/jling/sphinx-0.9.9/src’ 
  7. make[1]: *** [all] Error 2 
  8. make[1]: Leaving directory `/home/jling/sphinx-0.9.9/src‘ 
  9. make: *** [all-recursive] Error 1 

解决办法:打开configure文件,找到“#define USE_LIBICONV 1”,将注释去掉,并将1改成0.

常见问题2

error while loading shared libraries: libmysqlclient.so.16: cannot open shared object file: No such file or directory

解决办法:

64位系统ln -s /usr/local/webserver/mysql/lib/mysql/libmysqlclient.so.16.0.0 /usr/lib64/libmysqlclient.so.16

32位系统ln -s /usr/local/webserver/mysql/lib/mysql/libmysqlclient.so.16.0.0 /usr/lib/libmysqlclient.so.16

sphinx.conf样例

  1. source main 
  2. type     = mysql    #数据库类型 
  3. sql_host    = 10.228.134.211 #数据库ip 
  4. sql_user    = admin    #数据库用户名 
  5. sql_pass    = admin    #数据库密码 
  6. sql_db     = phpcms_v9   #数据库名 
  7. sql_port    = 3306    # 数据库端口 
  8.   sql_query_pre = SET NAMES utf8 
  9. sql_query_pre = REPLACE INTO v9_sphinx_counter SELECT 1, MAX(searchid) FROM v9_search 
  10. sql_query = SELECT searchid, adddate, siteid, typeid, id, data FROM v9_search \ 
  11. WHERE searchid>=$start AND searchid<=$end 
  12. sql_query_range  = SELECT 1,max_doc_id FROM v9_sphinx_counter WHERE counter_id=1 
  13. sql_range_step = 5000 
  14.   #字符串属性设置、需要过滤、排序的时候用到 
  15. sql_attr_uint  = typeid 
  16. sql_attr_uint  = siteid 
  17. sql_attr_uint  = id 
  18. sql_attr_timestamp  = adddate 
  19. sql_query_info  = SELECT * FROM v9_search WHERE searchid=$id 
  20.  source delta 
  21. type     = mysql    #数据库类型 
  22. sql_host    = 10.228.134.211 #数据库ip 
  23. sql_user    = admin    #数据库用户名 
  24. sql_pass    = admin    #数据库密码 
  25. sql_db     = phpcms_v9   #数据库名 
  26. sql_port    = 3306    # 数据库端口 
  27.      sql_query_pre = SET NAMES utf8 
  28. sql_query = SELECT searchid, adddate, siteid, typeid, id, data FROM v9_search \ 
  29. WHERE searchid >( SELECT max_doc_id FROM v9_sphinx_counter WHERE counter_id=1 ) 
  30. sql_query_post = REPLACE INTO v9_sphinx_counter SELECT 1, MAX(searchid) FROM v9_search 
  31. #字符串属性设置、需要过滤、排序的时候用到 
  32. sql_attr_uint  = typeid 
  33. sql_attr_uint  = siteid 
  34. sql_attr_uint  = id 
  35. sql_attr_timestamp  = adddate 
  36. sql_query_info  = SELECT * FROM v9_search WHERE searchid=$id 
  37.  #主索引 
  38. index main 
  39. source = main 
  40. # 放索引的目录 
  41. path = D:\sphinx\data\main 
  42. # 编码 
  43. charset_type = utf-8 
  44. # 指定utf-8的编码表 
  45. charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F 
  46. # 简单分词,只支持0和1,如果要搜索中文,请指定为1 
  47. ngram_len = 1 
  48. # 需要分词的字符,如果要搜索中文,去掉前面的注释 
  49. ngram_chars   = U+3000..U+2FA1F 
  50.  #增量索引 
  51. index delta 
  52. source = delta 
  53. path = D:\sphinx\data\delta 
  54. # 编码 
  55. charset_type = utf-8 
  56. # 指定utf-8的编码表 
  57. charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F 
  58. # 简单分词,只支持0和1,如果要搜索中文,请指定为1 
  59. ngram_len = 1 
  60. # 需要分词的字符,如果要搜索中文,去掉前面的注释 
  61. ngram_chars   = U+3000..U+2FA1F 
  62.  indexer 
  63. mem_limit    = 128M 
  64.  searchd 
  65. port     = 9312 
  66. log      = D:\sphinx\data\phpcms\searchd.log 
  67. query_log    = D:\sphinx\data\phpcms\query.log 
  68. read_timeout   = 5 
  69. max_children   = 30 
  70. pid_file    = D:\sphinx\data\phpcms\searchd.pid 
  71. max_matches    = 2000 
  72. seamless_rotate   = 0 
  73. preopen_indexes   = 0 
  74. unlink_old    = 1 

附件:设置计划任务更新索引

1.windows下

需要设置计划任务

  1. #凌晨4点合并索引,执行merge.bat 
  2. #其余时间每分钟更新索引,执行delta.bat 
  3. merge.bat 
  4.  
  5. @ECHO off 
  6. D:\sphinx\bin\indexer.exe –config D:\sphinx\sphinx.conf –merge main delta –rotate 
  7. echo indexing, window will close when complete 
  8.  
  9. delta.bat 
  10.  @ECHO off 
  11. D:\sphinx\bin\indexer.exe –config D:\sphinx\sphinx.conf delta –rotate 
  12. echo indexing, window will close when complete 
  13. 2.linux下编辑定时任务 crontab -e 
  14.  
  15. #凌晨4点合并索引,其余时间每分钟更新索引 
  16. * 0-3 * * * /usr/local/sphinx/bin/indexer –config /usr/local/sphinx/etc/sphinx.conf delta –rotate 
  17. * 6-23 * * * /usr/local/sphinx/bin/indexer –config /usr/local/sphinx/etc/sphinx.conf delta –rotate 
  18. 0 4 * * * /usr/local/sphinx/bin/indexer –config /usr/local/sphinx/etc/sphinx.conf –merge main delta –rotate 

各种路径、权限需要应用所在服务器一致,如:

sphinx.conf 中需要配置

sql_host 数据库主机地址

sql_user 数据库用户名

sql_pass 数据库密码

sql_db 数据库名

sql_port 数据库端口

phpcms表前缀样例中为phpcms_

索引路径 D:\sphinx\data\delta

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表