当前位置:七道奇文章资讯数据防范MySQL防范
日期:2011-01-25 22:43:00  来源:本站整理

适合做简单搜索的MySQL数据库全文索引[MySQL防范]

赞助商链接



  本文“适合做简单搜索的MySQL数据库全文索引[MySQL防范]”是由七道奇为您精心收集,来源于网络转载,文章版权归文章作者所有,本站不对其观点以及内容做任何评价,请读者自行判断,以下是其具体内容:

全文索引在 MySQL 中是一个 FULLTEXT 范例索引.FULLTEXT 索引用于 MyISAM 表,可以在 CREATE TABLE 时或之后利用 ALTER TABLE 或 CREATE INDEX 在 CHAR、VARCHAR 或 TEXT 列上成立.关于大的数据库,将数据装载到一个没有 FULLTEXT 索引的表中,然后再利用 ALTER TABLE (或 CREATE INDEX) 成立索引,这将是非常快的.将数据装载到一个已经有 FULLTEXT 索引的表中,将是非常慢的.

全文搜索通过 MATCH() 函数完成:

mysql> CREATE TABLE articles (

-> id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,

-> title VARCHAR(200),

-> body TEXT,

-> FULLTEXT (title,body)

-> );

Query OK, 0 rows affected (0.00 sec)


mysql> INSERT INTO articles VALUES

-> (NULL,'MySQL Tutorial', 'DBMS stands for DataBase ...'),

-> (NULL,'How To Use MySQL Efficiently', 'After you went through a ...'),

-> (NULL,'Optimising MySQL','In this tutorial we will show ...'),

-> (NULL,'1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),

-> (NULL,'MySQL vs. YourSQL', 'In the following database comparison ...'),

-> (NULL,'MySQL Security', 'When configured properly, MySQL ...');

Query OK, 6 rows affected (0.00 sec)

Records: 6 Duplicates: 0 Warnings: 0


mysql> SELECT * FROM articles

-> WHERE MATCH (title,body) AGAINST ('database');

+----+-------------------+------------------------------------------+

| id | title | body |

+----+-------------------+------------------------------------------+

| 5 | MySQL vs. YourSQL | In the following database comparison ... |

| 1 | MySQL Tutorial | DBMS stands for DataBase ... |

+----+-------------------+------------------------------------------+

2 rows in set (0.00 sec)

函数 MATCH() 对比一个文本集(包含在一个 FULLTEXT 索引中的一个或多个列的列集)履行一个自然语言搜索一个字符串.搜索字符串做为 AGAINST() 的参数被给定.搜索以忽视字母大小写的方法履行.关于表中的每个记录行,MATCH() 返回一个相关性值.即,在搜索字符串与记录行在 MATCH() 列表中指定的列的文本之间的类似性尺度.


当 MATCH() 被利用在一个 WHERE 子句中时 (参看上面的例子),返回的记录行被自动地以相关性从高到底的次序排序.相关性值是非负的浮点数字.零相关性意味着不类似.相关性的计算是基于:词在记录行中的数目、在行中唯一词的数目、在集合词的全部数目和包含一个特别词的文档(记录行)的数目.


它也可以履行一个逻辑情势的搜索.这在下面的章节中被描写.


前面的例子是函数 MATCH() 利用上的一些基本阐明.记录行以类似性递减的次序返回. 下一个示例显示若何检索一个明确的类似性值.假如即没有 WHERE 也没有 ORDER BY 子句,返回行是不排序的.


mysql> SELECT id,MATCH (title,body) AGAINST ('Tutorial') FROM articles;

+----+-----------------------------------------+

| id | MATCH (title,body) AGAINST ('Tutorial') |

+----+-----------------------------------------+

| 1 | 0.64840710366884 |

| 2 | 0 |

| 3 | 0.66266459031789 |

| 4 | 0 |

| 5 | 0 |

| 6 | 0 |

+----+-----------------------------------------+

6 rows in set (0.00 sec)

下面的示例更复杂一点.查询返回类似性并仍然以类似度递减的次序返回记录行.为了完成这个后果,你应当指定 MATCH() 两次.这不会惹起附加的开销,因为 MySQL 优化器会注意到两次一样的 MATCH() 调用,并只调用一次全文搜索代码.

mysql> SELECT id, body, MATCH (title,body) AGAINST

-> ('Security implications of running MySQL as root') AS score

-> FROM articles WHERE MATCH (title,body) AGAINST

-> ('Security implications of running MySQL as root');

+----+-------------------------------------+-----------------+

| id | body | score |

+----+-------------------------------------+-----------------+

| 4 | 1. Never run mysqld as root. 2. ... | 1.5055546709332 |

| 6 | When configured properly, MySQL ... | 1.31140957288 |

+----+-------------------------------------+-----------------+

2 rows in set (0.00 sec)


MySQL 利用一个非常简单的解析器来将文本脱离成词.一个“词”是由文字、数据、“'” 和 “_” 构成的任何字符序列.任安在 stopword 列表上呈现的,或太短的(3 个字符或更少的)的 “word” 将被忽视.


在集和查询中的每个符合的词按照其在集与查询中的重要性衡量.这样,一个呈目前多个文档中的词将有较低的权重(大概乃至有一个零权重),因为在这个特定的集合,它有较低的语义值.不然,假如词是较少的,它将得到一个较高的权重.然后,词的权重将被结实用于计算记录行的类似性.


这样一个技术工作可很好地工作与大的集(实际上,它会当心地与之谐调). 关于非常小的表,词分类不足以充份地反映它们的语义值,有时这个情势大概产生奇特的后果.


mysql> SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('MySQL');

Empty set (0.00 sec)


在上面的例子中,搜索词 MySQL 却没有得到任何后果,因为这个词在超越一半的记录行中呈现.一样的,它被有效地处理为一个 stopword (即,一个零语义值的词).这是最抱负的行为 -- 一个自然语言的查询不该该从一个 1GB 的表中返回每个次行(second row).


匹配表中一半记录行的词很少大概找到相关文档.实际上,它大概会发现很多不相关的文档.我们都知道,当我们在互联网上通过搜索引擎试图搜索某些东西时,这会常常发生.因为这个缘由,在这个特别的数据集合,这样的行被设置一个低的语义值.


到 4.0.1 时,MySQL 也可以利用 IN BOOLEAN MODE 修饰语来履行一个逻辑全文搜索.


mysql> SELECT * FROM articles WHERE MATCH (title,body)

-> AGAINST ('+MySQL -YourSQL' IN BOOLEAN MODE);

+----+------------------------------+-------------------------------------+

| id | title | body |

+----+------------------------------+-------------------------------------+

| 1 | MySQL Tutorial | DBMS stands for DataBase ... |

| 2 | How To Use MySQL Efficiently | After you went through a ... |

| 3 | Optimising MySQL | In this tutorial we will show ... |

| 4 | 1001 MySQL Tricks | 1. Never run mysqld as root. 2. ... |

| 6 | MySQL Security | When configured properly, MySQL ... |

+----+------------------------------+-------------------------------------+

12 下一
  以上是“适合做简单搜索的MySQL数据库全文索引[MySQL防范]”的内容,如果你对以上该文章内容感兴趣,你可以看看七道奇为您推荐以下文章:
  • 适合做简单搜索的MySQL数据库全文索引
  • 本文地址: 与您的QQ/BBS好友分享!
    • 好的评价 如果您觉得此文章好,就请您
        0%(0)
    • 差的评价 如果您觉得此文章差,就请您
        0%(0)

    文章评论评论内容只代表网友观点,与本站立场无关!

       评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
    Copyright © 2020-2022 www.xiamiku.com. All Rights Reserved .