MySQL是怎样实现全文搜索的?实际上mysql的全文搜索用的就是布尔搜索,那么什么是布尔搜索?
本文讲述了应用MySQL内置函数来实现全文搜索功能中的布尔全文搜索,希望可以给您带来帮助。
利用INBOOLEANMODE修改程序,MySQL也可以执行布尔全文搜索:
这个问询检索所有包含单词“MySQL”的行,但不检索包含单词“YourSQL”的行。
布尔全文搜索具有以下特点:
◆它们不使用50%域值。.
◆它们不会按照相关性渐弱的顺序将行进行分类。你可以从上述问询结果中看到这一点:相关性最高的行是一个包含两个“MySQL”的行,但它被列在最后的位置,而不是开头位置。
◆即使没有FULLTEXT,它们仍然可以工作,尽管这种方式的搜索执行的速度非常之慢。
◆最小单词长度全文参数和最大单词长度全文参数均适用。
◆停止字适用。
布尔全文搜索的性能支持以下操作符:
◆+
一个前导的加号表示该单词必须出现在返回的每一行的开头位置。
◆-
一个前导的减号表示该单词一定不能出现在任何返回的行中。
◆(无操作符)
在默认状态下(当没有指定+或–的情况下),该单词可有可无,但含有该单词的行等级较高。这和MATCH()…AGAINST()不使用INBOOLEANMODE修改程序时的运作很类似。
◆><
这两个操作符用来改变一个单词对赋予某一行的相关值的影响。>操作符增强其影响,而<操作符则减弱其影响。请参见下面的例子。
◆()
括号用来将单词分成子表达式。括入括号的部分可以被嵌套。
◆~
一个前导的代字号用作否定符,用来否定单词对该行相关性的影响。这对于标记“noise(无用信息)”的单词很有用。包含这类单词的行较其它行等级低,但因其可能会和-号同时使用,因而不会在任何时候都派出所有无用信息行。
◆*
星号用作截断符。于其它符号不同的是,它应当被追加到要截断的词上。
◆”
一个被括入双引号的短语(‘”’)只和字面上包含该短语输入格式的行进行匹配。全文引擎将短语拆分成单词,在FULLTEXT索引中搜索该单词。非单词字符不需要严密的匹配:短语搜索只要求符合搜索短语包含的单词且单词的排列顺序相同的内容。例如,”testphrase”符合”test,phrase”。
若索引中不存在该短语包含的单词,则结果为空。例如,若所有单词都是禁用词,或是长度都小于编入索引单词的最小长度,则结果为空。
以下例子展示了一些使用布尔全文符号的搜索字符串:
◆'applebanana'
寻找包含至少两个单词中的一个的行。
◆'+apple+juice'
寻找两个单词都包含的行。
◆'+applemacintosh'
寻找包含单词“apple”的行,若这些行也包含单词“macintosh”,则列为更高等级。
◆'+apple-macintosh'
寻找包含单词“apple”但不包含单词“macintosh”的行。
◆'+apple+(>turnover
寻找包含单词“apple”和“turnover”的行,或包含“apple”和“strudel”的行(无先后顺序),然而包含“appleturnover”的行较包含“applestrudel”的行排列等级更为高。
◆'apple*'
寻找包含“apple”、“apples”、“applesauce”或“applet”的行。
◆'”somewords”'
寻找包含原短语“somewords”的行(例如,包含“somewordsofwisdom”的行,而非包含“somenoisewords”的行)。注意包围词组的‘”’符号是界定短语的操作符字符。它们不是包围搜索字符串本身的引号。
mysql的布尔搜索实现了全文搜索功能,通过例子我们体会到了mysql全文搜索能力的强大。