首页 > 数据库 > MySQL > 正文

MySQL创建全文索引学习笔记

2024-07-24 12:36:47
字体:
来源:转载
供稿:网友

全文索引是mysql数据库索引的一种,全文索引可以快速的实现全文的搜索,它的类型为fulltext了,下面我们一起来看看MySQL创建全文索引的创建与mysql配置全文索引的方法,希望本文章对大家有帮助。

使用索引是数据库性能优化的必备技能之一。在MySQL数据库中,有四种索引:聚集索引(主键索引)、普通索引、唯一索引以及我们这里将要介绍的全文索引(FULLTEXT INDEX)。

全文索引(也称全文检索)是目前seo搜索引擎使用的一种关键技术。它能够利用“分词技术“等多种算法智能分析出文本文字中关键字词的频率及重要性,然后按照一定的算法规则智能地筛选出我们想要的搜索结果。在这里,我们就不追根究底其底层实现原理了,现在我们来看看在MySQL中如何创建并使用全文索引。

全文索引只能在MyISAM数据表中创建 少于3个字符的单词不会被包含在全文索引里,可以通过修改my.cnf修改选项:

ft_min_word_len=3 

重新启动MySQL服务器,用:

repair table tablename quick 为有关数据表重新生成全文索引 

select * from tablename

where match(column1,column2) against('word1 word2 word3')>0.001 

match ... against 把column1,column2数据列中至少包含word1,word2,word3三个单词之一的数据记录查找到,在关键字match后的数据列必须跟创建全文索引的数据列相同,检索词不区分大小写和先后顺序,少于3个字符的单词通常被忽略。match... against ...表达式返回一个浮点数作为它本身的求值结果,这个数字反映了结果记录与被检索单词的匹配程度。如果没有匹配到任何记录,或者匹配到的结果记录太多反而被忽略,表达式将返回0,表达式>0.001的作用是排除match的返回值太小的结果记录,代码如下:

  1. select *,match(column1,column2) against ('word1 word2 word3'as mtch 
  2.  
  3. from tablename 
  4.  
  5. having mtch>0.01 
  6.  
  7. order by mtch desc 
  8.  
  9. limit 5 

找出最匹配的5条记录,在where字句中不能使用假名,所以用having.

创建全文索

在MySQL中,创建全文索引相对比较简单。例如,我们有一个文章表(article),其中有主键ID(id)、文章标题(title)、文章内容(content)三个字段。现在我们希望能够在title和content两个列上创建全文索引,article表及全文索引的创建SQL语句如下:

  1. --创建article表 
  2.     CREATE TABLE article ( 
  3.         id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY
  4.         title VARCHAR(200), 
  5.         content TEXT, 
  6.         FULLTEXT (title, content) --在title和content列上创建全文索引 
  7.     );  

上面就是在创建表的同时建立全文索引的SQL示例,此外,如果我们想要给已经存在的表的指定字段创建全文索引,同样以article表为例,我们可以使用如下SQL语句进行创建:

  1. --给现有的article表的title和content字段创建全文索引 
  2. --索引名称为fulltext_article//Vevb.com 
  3. ALTER TABLE article 
  4. ADD FULLTEXT INDEX fulltext_article (title, content) 

在MySQL中创建全文索引之后,现在就该了解如何使用了。众所周知,在数据库中进行模糊查询是使用LIKE关键字进行查询,例如:

SELECT * FROM article WHERE content LIKE '%查询字符串%'

那么,我们使用全文索引也是这样用的吗?当然不是,我们必须使用特有的语法才能使用全文索引进行查询。例如,我们想要在article表的title和content列中全文检索指定的查询字符串,可以如下编写SQL语句:

SELECT * FROM article WHERE MATCH(title, content) AGAINST('查询字符串')

强烈注意:MySQL自带的全文索引只能用于数据库引擎为MyISAM的数据表,如果是其他数据引擎,则全文索引不会生效。此外,MySQL自带的全文索引只能对英文进行全文检索,目前无法对中文进行全文检索。如果需要对包含中文在内的文本数据进行全文检索,我们需要采用Sphinx(斯芬克斯)/Coreseek技术来处理中文。本站将会在后续文章中对Sphinx以及Coreseek进行介绍.

备注1:目前,使用MySQL自带的全文索引时,如果查询字符串的长度过短将无法得到期望的搜索结果。MySQL全文索引所能找到的词的默认最小长度为4个字符。另外,如果查询的字符串包含停止词,那么该停止词将会被忽略。

备注2:如果可能,请尽量先创建表并插入所有数据后再创建全文索引,而不要在创建表时就直接创建全文索引,因为前者比后者的全文索引效率要高。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表