混合型搜尋引擎

元搜尋引擎集成了多搜尋引擎的搜尋結果,在一定的程度上提高了查全率和查準率,但效果並不是太顯著,所以提出了混合型搜尋引擎,混合型搜尋引擎集成數個獨立搜尋引擎,使它能查詢比較多的網頁和文檔。

基本介紹

  • 中文名:混合型搜尋引擎
  • 外文名:Hybrid search engine                  
  • 特點:集成數個獨立搜尋引擎
  • 意義:提高了查全率和查準率
  • 代表:百度、谷歌等
  • 領域:計算機
引擎優點,工作原理,體系結構,引擎評價,

引擎優點

如何從Intemet浩瀚的網路信息資源中,快速、全面而準確地獲取檢索者所感興趣的信息,一直是網站建設者最關心的問題之一。搜尋引擎作為最有效、最常用的檢索工具,更是他們研究和套用的重點。但在實踐中發現,單個常規搜尋引擎很難獲得全面的檢索結果,並且發現不同的常規搜尋引擎搜尋的結果有很大的不同,這樣,元搜尋引擎就適時地出現了。元搜尋引擎集成了多搜尋引擎的搜尋結果,在一定的程度上提高了查全率和查準率,但效果並不是太顯著,所以提出了混合型搜尋引擎。

工作原理

元搜尋引擎的工作原理為:元搜尋引擎通過一個統一的檢索界面,將檢索詞發給所配置好的多個搜尋引擎,由這些搜尋引擎實現初步檢索操作,然後把初步檢索結果經過合併、篩選等特殊處理,生成更全面、更準確的結果再傳送給用戶。元搜尋引擎沒有自己獨立的資料庫,他藉助其他搜尋引擎形成一個具有獨立功能的虛擬邏輯體,通過元搜尋引擎的功能,實現對這個虛擬邏輯體中各搜尋引擎資料庫的查詢等一切操作。
混合型搜尋引擎採用了元搜尋引擎集成性的特點,但也採用了全文搜尋引擎的Robot網路搜尋程式和工作原理。不同的是,混合搜尋引擎的查詢重點是元搜尋引擎的查詢結果所指的連結url,並對此連結所在網站作更細緻、更深入以及更多層次的站內搜尋,然後再把最終結果返回給用戶
混合型搜尋引擎不僅可以利用其他獨立搜尋引擎查詢數據,而且可以根據查詢結果所在網站上目標資料相對較多的特點,採用更為複雜、智慧型的搜尋程式對此網站作更深入、更細緻的站內全文搜尋。混合搜尋引擎的目的是,力圖幫助用戶獲得更高的查全率和查準率。混合型搜尋引擎的Robot網路搜尋程式與獨立搜尋引擎的不同,它更具有靈活性、針對性。還有,它是現場查詢的,面對的是最新的狀態。

體系結構

混合型搜尋引擎的體系結構包括以下幾個部分:
1.客戶向客戶代理提交查詢對象請求,客戶代理負責查詢處理調用,並對客戶隱藏全部實現細節;
2.查詢對象被送到外部搜尋引擎進行初步查詢,並把查詢結果送至數據預處理模組;
3.數據預處理模組把送到的初步查詢結果數據進行過濾、篩選、重新組織等預處理後,交由Robot網路檢索程式進行細緻的再搜尋;
4.Robot網路檢索程式利用文本檢索、Web挖掘等技術對目標網站進行更專業、更智慧型的搜尋。由於Robot網路檢索程式搜尋的力度和智慧型性進一步得到提高,所以再搜尋的結果更加全面、準確;
5.結果數據終處理模組把再搜尋的結果數據按重要程度等參數進一步作排序、索引等最後處理,並把處理的結果經客戶代理以網頁的形式傳給客戶。

引擎評價

評價搜尋引擎的標準有:搜尋引擎分類系統的合理性、查詢網站的廣泛性、查詢功能的便利性、搜尋結果的滿意度和搜尋資料的時效性。
混合型搜尋引擎集成數個獨立搜尋引擎,使它能查詢比較多的網頁文檔,而且它集成的搜尋引擎有著很好的分類系統,使它的虛擬分類系統有著比較理想的深度和廣度;它採用了基於全文檢索的技術作進一步的站內搜尋,這也保證了它檢索的資料是最新、最細緻、最全面的;它採用了信息格式支持、轉換和信息過濾等數據預處理技術以及信息索引、排序等處理技術,雖然查詢時間相對多了一些,但增加了結果的滿意度,再加上機器學習人工智慧神經網路知識挖掘等技術的套用,搜尋引擎的查準率和查全率得到相當程度的提高。

相關詞條

熱門詞條

聯絡我們