搜尋引擎技術

簡介

搜尋技巧

類別中搜尋

許多搜尋引擎（如Yahoo）都顯示類別，如計算機和Internet、商業和經濟。如果您單擊其中一個類別，然後再使用搜尋引擎，您將可以選擇搜尋整個Internet還是搜尋當前類別。顯然，在一個特定類別下進行搜尋所耗費的時間較少，而且能夠避免大量無關的Web站點。

當然，您或許還想搜尋整個Internet，以搜尋特定類別之外的信息。

使用具體的關鍵字

如果想要搜尋以鳥為主題的Web站點，您可以在搜尋引擎中輸入關鍵字“鳥(bird)”。但是，搜尋引擎會因此返回大量無關信息，如談論高爾夫的“小鳥球（birdie）”或烹飪game birds不同方法的Web站點。為了避免這種問題的出現，請使用更為具體的關鍵字，如“ornithology”（鳥類學，動物學的一個分支）。您所提供的關鍵字越具體，搜尋引擎返回無關Web站點的可能性就越小。

使用多個關鍵字

您還可以通過使用多個關鍵字來縮小搜尋範圍。例如，如果想要搜尋有關佛羅里達州邁阿密市的信息，則輸入兩個關鍵字“邁阿密(Miami)”和“佛羅里達州(Florida)”。如果只輸入其中一個關鍵字，搜尋引擎就會返回諸如Miami Dolphins足球隊或Florida Marlins棒球隊的無關信息。一般而言，您提供的關鍵字越多，搜尋引擎返回的結果越精確。

引擎返回的結果

搜尋引擎返回的Web站點順序可能會影響人們的訪問。好的搜尋引擎會鑑別Web站點的內容，並據此安排它們的順序，但其他搜尋引擎大概不會這么做。

此外，因為搜尋引擎經常對最為常用的關鍵字進行搜尋，所以許多Web站點在自己的網頁中隱藏了同一關鍵字的多個副本。這使得搜尋引擎不再去查找Internet，以返回與關鍵字有關的更多信息。

正如讀報紙、聽收音機或看電視新聞一樣，請留意您所獲得的信息的來源。搜尋引擎能夠幫您找到信息，但無法驗證信息的可靠性。因為任何人都可以在網上發布信息，它不能知道誰的信息更準確，只要網上出現不算違法的信息都會抓取。

架構

下圖是一個通用的搜尋引擎架構示意圖：

搜尋引擎由很多技術模組構成，各自負責整體功能的一部分，相互紀合形成了完善的整體架構。

智慧型技術

網路機器人(Robot)又被稱作Spider、Worm或Random，核心目的是為獲取Internet上的信息。一般定義為“一個在網路上檢索檔案且自動跟蹤該檔案的超文本結構並循環檢索被參照的所有檔案的軟體”。機器人利用主頁中的超文本連結遍歷WWW，通過URL引用從一個HTML文檔爬行到另一個HTML文檔。網上機器人收集到的信息可有多種用途，如建立索引、HIML檔案合法性的驗證、URL連結點驗證與確認、監控與獲取更新信息、站點鏡像等。

搜尋引擎技術

基本介紹

簡介

架構

智慧型技術

索引技術

處理技術

搜尋套用

抓取優先

相關詞條

熱門詞條