這里描述了菜鳥(niǎo)們搜索時(shí)容易犯的七個(gè)低級(jí)錯(cuò)誤,正是因?yàn)槟憬?jīng)常犯這些錯(cuò)誤,所以你總是得到無(wú)用的、荒謬的或者完全沒(méi)有意義的搜索結(jié)果。而一旦你認(rèn)識(shí)到這些錯(cuò)誤,將很容易把這些小鬼從你的搜索工具箱中永遠(yuǎn)驅(qū)逐出去。
1:停用詞Sputtering on 'Stop Words'
=======================================
一些搜索引擎會(huì)忽略這些詞,當(dāng)你把停用詞輸入搜索框時(shí),不管網(wǎng)上有多少數(shù)量的相關(guān)文件,它們一個(gè)都不會(huì)找回來(lái)給你。
這些被叫做“停用詞”(stop words),因?yàn)樗阉饕嬖谒臄?shù)據(jù)庫(kù)里碰到這些詞時(shí)不會(huì)搜索。
為什么不搜么?因?yàn)橥S迷~可能太常見(jiàn)了以至于無(wú)法搜索出有意義的結(jié)果,或者是語(yǔ)言中的副詞、連詞、介詞,或者是'be' 的變體如is、are、were、been等無(wú)意義的詞,除非它們?cè)谝粋(gè)短語(yǔ)中且有重要的名詞和動(dòng)詞相伴。
如果你在一個(gè)搜索請(qǐng)求中使用了停用詞,那么你得到大量毫不相關(guān)的搜索結(jié)果。比如,短語(yǔ)'searching the Web' 包含了兩個(gè)停用詞,'the' 和 'Web'。雖然這還不算特別常見(jiàn)的詞匯,但Web 在網(wǎng)絡(luò)上實(shí)在是太常見(jiàn)了,使它事實(shí)上不能幫你搜索到什么有用的內(nèi)容。
如果去掉停用詞,'searching the Web' 變成 'searching',這個(gè)關(guān)鍵詞帶給你的搜索結(jié)果會(huì)從搜索一個(gè)逃犯直到尋求啟蒙。(quests for enlightenment)—如果你夠幸運(yùn),當(dāng)然也會(huì)得到一些關(guān)于“searching the Web”的搜索結(jié)果。
怎樣辨別停用詞呢?300個(gè)最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關(guān)鍵詞中含有停用詞時(shí),會(huì)把它忽略的每個(gè)停用詞告訴你,就顯示在搜索結(jié)果頁(yè)最上邊。你可以用一個(gè)含停用詞 'web' 的關(guān)鍵詞試一下。
2:布爾操作符Bungling with Boolean
=====================================
布爾操作符,象and、or 和not,能夠使你的搜索結(jié)果更精確——如果使用正確的話(huà)。
問(wèn)題在于布爾操作符看上去太簡(jiǎn)單了,似乎非常容易使用,這真的可能是一種誤解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說(shuō)法, 各種搜索引擎對(duì)布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用'not',有的搜索引擎卻要用'and not'才能達(dá)到。而且,有些搜索引擎要求布爾符必須是大寫(xiě)的,另一些就沒(méi)有這種要求。
如果你真的想使用布爾符,請(qǐng)認(rèn)真學(xué)習(xí)它的使用方法。
3:普通詞Being Ever So Vulgar
==================================
Vulgar來(lái)自拉丁語(yǔ)vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對(duì)普通詞的搜索存在缺陷。不是因?yàn)樗鼈兺宰鸫蠡蜃悦环。而是因(yàn)檫@些詞太常見(jiàn)了,以至于出現(xiàn)在成百萬(wàn)上千萬(wàn)的網(wǎng)頁(yè)中,使得它們事實(shí)上不能被用來(lái)幫你找到什么有用的內(nèi)容。
比如說(shuō)“weather”, 有成千上萬(wàn)的網(wǎng)站提供跟“weather”相關(guān)的信息,從地方天氣預(yù)報(bào)到學(xué)術(shù)論文到氣象學(xué),
所以使用更多的關(guān)鍵詞或更明確的關(guān)鍵詞來(lái)搜索要比單單搜索'weather'好得多。 設(shè)計(jì)一個(gè)類(lèi)似 'Cicely Alaska annual snowfall'這樣特殊的搜索關(guān)鍵詞,會(huì)給你真正有用的結(jié)果。
4:尋找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務(wù)主管,舉了'bond' 作為例子。我們不得不問(wèn)自己,他們?cè)谡业男畔⑹顷P(guān)于金融公債的、化學(xué)粘合劑的、還是大名鼎鼎的007邦德的?
最好的解決辦法是,在搜索引擎之前先問(wèn)自己這個(gè)問(wèn)題,然后用短語(yǔ)代替多義單詞作為關(guān)鍵詞。
搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 'lead' ,發(fā)音LEED的時(shí)候, 意思是領(lǐng)導(dǎo),發(fā)音LED的時(shí)候指的是一種金屬元素。
如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.
5:大寫(xiě)字母Committing Capital Offenses
========================================
搜索者的另一個(gè)問(wèn)題是要不要在關(guān)鍵詞中使用大寫(xiě)字母。
有的搜索引擎是區(qū)分大小寫(xiě)的,但也有搜索引擎是不分大小寫(xiě)的。憑經(jīng)驗(yàn)來(lái)說(shuō),總是使用小寫(xiě)字母搜索是個(gè)好主意。
這樣搜索,會(huì)得到所有包含你的搜索關(guān)鍵詞的網(wǎng)頁(yè),不管其中的關(guān)鍵詞首字母大寫(xiě)還是小寫(xiě)。
如果你在搜索關(guān)鍵詞中使用大寫(xiě)字母,那么搜索引擎返回的結(jié)果將只有一種,其網(wǎng)頁(yè)中含有大小寫(xiě)跟你的搜索關(guān)鍵詞完全相同的單詞。
象人名和地名之類(lèi)關(guān)鍵詞使用大寫(xiě)字母是個(gè)好選擇,但是其它對(duì)大小寫(xiě)沒(méi)那么敏感的單詞,如果也使用大寫(xiě)字母,可能使你錯(cuò)過(guò)很多有用的網(wǎng)頁(yè)。 如果想知道哪個(gè)搜索引擎對(duì)大寫(xiě)敏感,以及如何處理大小寫(xiě)字母,就對(duì)Danny Sullivan的網(wǎng)站“Search Engine Watch”上的Search Engines And Capitalization花點(diǎn)時(shí)間吧。
6:Close, But No Cigar
==================================
多數(shù)搜索引擎對(duì)于 'Kosovo refugees' 或 'space shuttle missions' 這樣的短語(yǔ)搜索效果很好。然而,當(dāng)你使用類(lèi)似這一節(jié)的標(biāo)題的短語(yǔ)“Close, But No Cigar”進(jìn)行搜索時(shí),就遇到問(wèn)題了。 在一個(gè)主流搜索引擎中搜索'close but no cigar',得到的第二條結(jié)果是:The Common Cold: Relief But No Cure. Definitely no cigar!
兩個(gè)關(guān)鍵詞之間的距離稱(chēng)為接近程度。 當(dāng)你的搜索關(guān)鍵詞們分散在一個(gè)網(wǎng)頁(yè)的不同位置時(shí),有些搜索引擎會(huì)給你一個(gè)積極的結(jié)果,不管它們是否彼此靠近,還是位于同一個(gè)短語(yǔ)中。
如果你希望你用的搜索關(guān)鍵詞們?cè)谒阉鞯降膬?nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個(gè)操作符號(hào),而 Lycos 的高級(jí)搜索提供了多種設(shè)置關(guān)鍵詞接近程度的可能。
好,現(xiàn)在說(shuō)最容易犯的那個(gè)搜索錯(cuò)誤
7:在錯(cuò)誤的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你決定找某種內(nèi)容之前,先確認(rèn)你對(duì)這次搜索任務(wù)使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒(méi)有為你的每次搜索分別選擇正確的搜索工具,你將浪費(fèi)自己大量的時(shí)間。
你應(yīng)該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強(qiáng)項(xiàng)和弱點(diǎn),然后選擇最適合這次搜索任務(wù)的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太過(guò)苛求自己。我所聽(tīng)過(guò)的最荒謬可笑的說(shuō)法是:“你能在ingternet上找到任何東西”。這就象在說(shuō),你能在每一個(gè)煤礦里都找到鉆石。
也許聽(tīng)上去有點(diǎn)異端邪說(shuō)的味道,但是有個(gè)網(wǎng)絡(luò)搜索指南確實(shí)說(shuō)過(guò),有時(shí)你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書(shū)館。圖書(shū)館里網(wǎng)上找不到的成噸的信息資源。而且圖書(shū)館員一般是受過(guò)訓(xùn)練的的專(zhuān)家,它們通常會(huì)很樂(lè)意幫你找東西。當(dāng)你在網(wǎng)上無(wú)處可去的時(shí)候,試一下真正的“人工智能搜索引擎”吧,你會(huì)發(fā)現(xiàn)它們真的非常優(yōu)秀 。
讓錯(cuò)誤走開(kāi)Begone, Mistakes!
===================================
在你逐漸獲得網(wǎng)絡(luò)搜索經(jīng)驗(yàn)的過(guò)程中,避免這七個(gè)常見(jiàn)的搜索錯(cuò)誤將成為一種自然而然的習(xí)慣。無(wú)論何時(shí),當(dāng)你得到意料之外和怪異的搜索結(jié)果時(shí),記得檢查一下你用的搜索關(guān)鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個(gè)自己需要避免的搜索錯(cuò)誤。
不可不信,也不可全信,呵呵!
1:停用詞Sputtering on 'Stop Words'
=======================================
一些搜索引擎會(huì)忽略這些詞,當(dāng)你把停用詞輸入搜索框時(shí),不管網(wǎng)上有多少數(shù)量的相關(guān)文件,它們一個(gè)都不會(huì)找回來(lái)給你。
這些被叫做“停用詞”(stop words),因?yàn)樗阉饕嬖谒臄?shù)據(jù)庫(kù)里碰到這些詞時(shí)不會(huì)搜索。
為什么不搜么?因?yàn)橥S迷~可能太常見(jiàn)了以至于無(wú)法搜索出有意義的結(jié)果,或者是語(yǔ)言中的副詞、連詞、介詞,或者是'be' 的變體如is、are、were、been等無(wú)意義的詞,除非它們?cè)谝粋(gè)短語(yǔ)中且有重要的名詞和動(dòng)詞相伴。
如果你在一個(gè)搜索請(qǐng)求中使用了停用詞,那么你得到大量毫不相關(guān)的搜索結(jié)果。比如,短語(yǔ)'searching the Web' 包含了兩個(gè)停用詞,'the' 和 'Web'。雖然這還不算特別常見(jiàn)的詞匯,但Web 在網(wǎng)絡(luò)上實(shí)在是太常見(jiàn)了,使它事實(shí)上不能幫你搜索到什么有用的內(nèi)容。
如果去掉停用詞,'searching the Web' 變成 'searching',這個(gè)關(guān)鍵詞帶給你的搜索結(jié)果會(huì)從搜索一個(gè)逃犯直到尋求啟蒙。(quests for enlightenment)—如果你夠幸運(yùn),當(dāng)然也會(huì)得到一些關(guān)于“searching the Web”的搜索結(jié)果。
怎樣辨別停用詞呢?300個(gè)最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關(guān)鍵詞中含有停用詞時(shí),會(huì)把它忽略的每個(gè)停用詞告訴你,就顯示在搜索結(jié)果頁(yè)最上邊。你可以用一個(gè)含停用詞 'web' 的關(guān)鍵詞試一下。
2:布爾操作符Bungling with Boolean
=====================================
布爾操作符,象and、or 和not,能夠使你的搜索結(jié)果更精確——如果使用正確的話(huà)。
問(wèn)題在于布爾操作符看上去太簡(jiǎn)單了,似乎非常容易使用,這真的可能是一種誤解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說(shuō)法, 各種搜索引擎對(duì)布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用'not',有的搜索引擎卻要用'and not'才能達(dá)到。而且,有些搜索引擎要求布爾符必須是大寫(xiě)的,另一些就沒(méi)有這種要求。
如果你真的想使用布爾符,請(qǐng)認(rèn)真學(xué)習(xí)它的使用方法。
3:普通詞Being Ever So Vulgar
==================================
Vulgar來(lái)自拉丁語(yǔ)vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對(duì)普通詞的搜索存在缺陷。不是因?yàn)樗鼈兺宰鸫蠡蜃悦环。而是因(yàn)檫@些詞太常見(jiàn)了,以至于出現(xiàn)在成百萬(wàn)上千萬(wàn)的網(wǎng)頁(yè)中,使得它們事實(shí)上不能被用來(lái)幫你找到什么有用的內(nèi)容。
比如說(shuō)“weather”, 有成千上萬(wàn)的網(wǎng)站提供跟“weather”相關(guān)的信息,從地方天氣預(yù)報(bào)到學(xué)術(shù)論文到氣象學(xué),
所以使用更多的關(guān)鍵詞或更明確的關(guān)鍵詞來(lái)搜索要比單單搜索'weather'好得多。 設(shè)計(jì)一個(gè)類(lèi)似 'Cicely Alaska annual snowfall'這樣特殊的搜索關(guān)鍵詞,會(huì)給你真正有用的結(jié)果。
4:尋找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務(wù)主管,舉了'bond' 作為例子。我們不得不問(wèn)自己,他們?cè)谡业男畔⑹顷P(guān)于金融公債的、化學(xué)粘合劑的、還是大名鼎鼎的007邦德的?
最好的解決辦法是,在搜索引擎之前先問(wèn)自己這個(gè)問(wèn)題,然后用短語(yǔ)代替多義單詞作為關(guān)鍵詞。
搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 'lead' ,發(fā)音LEED的時(shí)候, 意思是領(lǐng)導(dǎo),發(fā)音LED的時(shí)候指的是一種金屬元素。
如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.
5:大寫(xiě)字母Committing Capital Offenses
========================================
搜索者的另一個(gè)問(wèn)題是要不要在關(guān)鍵詞中使用大寫(xiě)字母。
有的搜索引擎是區(qū)分大小寫(xiě)的,但也有搜索引擎是不分大小寫(xiě)的。憑經(jīng)驗(yàn)來(lái)說(shuō),總是使用小寫(xiě)字母搜索是個(gè)好主意。
這樣搜索,會(huì)得到所有包含你的搜索關(guān)鍵詞的網(wǎng)頁(yè),不管其中的關(guān)鍵詞首字母大寫(xiě)還是小寫(xiě)。
如果你在搜索關(guān)鍵詞中使用大寫(xiě)字母,那么搜索引擎返回的結(jié)果將只有一種,其網(wǎng)頁(yè)中含有大小寫(xiě)跟你的搜索關(guān)鍵詞完全相同的單詞。
象人名和地名之類(lèi)關(guān)鍵詞使用大寫(xiě)字母是個(gè)好選擇,但是其它對(duì)大小寫(xiě)沒(méi)那么敏感的單詞,如果也使用大寫(xiě)字母,可能使你錯(cuò)過(guò)很多有用的網(wǎng)頁(yè)。 如果想知道哪個(gè)搜索引擎對(duì)大寫(xiě)敏感,以及如何處理大小寫(xiě)字母,就對(duì)Danny Sullivan的網(wǎng)站“Search Engine Watch”上的Search Engines And Capitalization花點(diǎn)時(shí)間吧。
6:Close, But No Cigar
==================================
多數(shù)搜索引擎對(duì)于 'Kosovo refugees' 或 'space shuttle missions' 這樣的短語(yǔ)搜索效果很好。然而,當(dāng)你使用類(lèi)似這一節(jié)的標(biāo)題的短語(yǔ)“Close, But No Cigar”進(jìn)行搜索時(shí),就遇到問(wèn)題了。 在一個(gè)主流搜索引擎中搜索'close but no cigar',得到的第二條結(jié)果是:The Common Cold: Relief But No Cure. Definitely no cigar!
兩個(gè)關(guān)鍵詞之間的距離稱(chēng)為接近程度。 當(dāng)你的搜索關(guān)鍵詞們分散在一個(gè)網(wǎng)頁(yè)的不同位置時(shí),有些搜索引擎會(huì)給你一個(gè)積極的結(jié)果,不管它們是否彼此靠近,還是位于同一個(gè)短語(yǔ)中。
如果你希望你用的搜索關(guān)鍵詞們?cè)谒阉鞯降膬?nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個(gè)操作符號(hào),而 Lycos 的高級(jí)搜索提供了多種設(shè)置關(guān)鍵詞接近程度的可能。
好,現(xiàn)在說(shuō)最容易犯的那個(gè)搜索錯(cuò)誤
7:在錯(cuò)誤的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你決定找某種內(nèi)容之前,先確認(rèn)你對(duì)這次搜索任務(wù)使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒(méi)有為你的每次搜索分別選擇正確的搜索工具,你將浪費(fèi)自己大量的時(shí)間。
你應(yīng)該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強(qiáng)項(xiàng)和弱點(diǎn),然后選擇最適合這次搜索任務(wù)的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太過(guò)苛求自己。我所聽(tīng)過(guò)的最荒謬可笑的說(shuō)法是:“你能在ingternet上找到任何東西”。這就象在說(shuō),你能在每一個(gè)煤礦里都找到鉆石。
也許聽(tīng)上去有點(diǎn)異端邪說(shuō)的味道,但是有個(gè)網(wǎng)絡(luò)搜索指南確實(shí)說(shuō)過(guò),有時(shí)你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書(shū)館。圖書(shū)館里網(wǎng)上找不到的成噸的信息資源。而且圖書(shū)館員一般是受過(guò)訓(xùn)練的的專(zhuān)家,它們通常會(huì)很樂(lè)意幫你找東西。當(dāng)你在網(wǎng)上無(wú)處可去的時(shí)候,試一下真正的“人工智能搜索引擎”吧,你會(huì)發(fā)現(xiàn)它們真的非常優(yōu)秀 。
讓錯(cuò)誤走開(kāi)Begone, Mistakes!
===================================
在你逐漸獲得網(wǎng)絡(luò)搜索經(jīng)驗(yàn)的過(guò)程中,避免這七個(gè)常見(jiàn)的搜索錯(cuò)誤將成為一種自然而然的習(xí)慣。無(wú)論何時(shí),當(dāng)你得到意料之外和怪異的搜索結(jié)果時(shí),記得檢查一下你用的搜索關(guān)鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個(gè)自己需要避免的搜索錯(cuò)誤。
不可不信,也不可全信,呵呵!