全文檢索系統

在當今信息爆炸的時代,每個單位或個人都在為信息的快速增長做出了各種貢獻。信息的種類也在不斷的擴展,越來越多的非結構化信息不斷出現,包括企業的各種報表、帳單、電子文檔、網站的各種元素、圖片、傳真、掃描影像,以及大量的多媒體的音頻、視頻信息等等。所有的存儲數據中,有85%採用的是非結構化格式的,非結構化信息每三個月增長一倍。 由於信息格式的差異很大,所以基本無法整合為統一的接口供政府工作人員或廣大民眾方便使用。

基本介紹

  • 中文名:全文檢索系統
  • 途徑電腦程式
  • 對象:政府工作人員或廣大民眾
  • 類型:信息系統
系統概述,系統結構,功能特點,

系統概述

全文檢索是電腦程式通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置,當用戶查詢時根據建立的索引查找,類似於通過字典的檢索字表查字的過程。全文檢索系統是按照全文檢索理論建立起來的用於提供全文檢索服務的軟體系統。全文檢索系統的核心則具有建立索引、處理查詢返回結果集、增加索引、最佳化索引結構等功能。Goonie全文檢索系統的主要目標是實現文本索引的快速構建(Index Construction),動態文檔集的索引維護(Index Maintenance),短語查詢(Phrase Query),Top-k查詢的快速處理(Top-k Query Process)以及各種檢索模型(IR Model)等。高性能和靈活的架構也使Goonie全文檢索系統可以套用在內外網檢索、專業系統資料檢索、行業專業資料庫檢索

系統結構

全文檢索結構圖全文檢索結構圖

功能特點

強大的信息採集能力
全文檢索系統是以先進的搜尋技術為核心,並針對專業用戶所要求的搜尋深度深、採集精度高和抓取速度快等進行了專門的最佳化,採用了分散式多執行緒並發指令執行體系結構,95%信息分鐘級到達本地。能夠採集多種動態和靜態網頁類型、多種文檔、資料庫類型,同時網頁實時增量採集技術實現分秒監測網站信息變化動態,使網站隨時獲取最新的信息資源。
分秒級的實時檢索
全文檢索系統採用獨有的增量實時索引技術保證信息即時採集即時檢索,使用戶隨時檢索到行業/地區最新的信息。
快速的檢索回響
全文檢索系統可實現亞秒級的檢索速度以及每秒上百次的並發檢索支持,保證全面快速的回響用戶檢索需求。
全面的檢索功能
全文檢索系統可實現全文檢索,完全支持布爾邏輯檢索、支持n階漸進檢索、支持同義詞檢索、支持自定義用戶詞典,模糊檢索,相關檢索等,並可以由系統管理員人工過濾不當網頁,為用戶提供最為適當的檢索結果。
精確的檢索結果
全文檢索系統採用智慧型中文切詞技術,避免中文檢索的歧義與多義現象,同時採用相關性算法對網頁進行排序,保證檢索相關性最高的頁面放在最前面。
豐富的檢索結果展示
全文檢索系統為用戶提供豐富的檢索結果展示,能夠根據每個網站的不同風格和要求定製結果顯示模版。檢索結果包括智慧型動態摘要、獨有的網頁快照,以及多種檢索結果排序方式等等。能夠極大的方便用戶對檢索結果的瀏覽查看,提高用戶對檢索效果的滿意度。
基於Web的系統管理平台
全文檢索系統採用標準的B/S架構,系統管理員可以隨時隨地通過瀏覽器登入Web管理界面對整個系統的各項功能進行管理和系統維護,操作簡單易用,無需專業培訓即可迅速上手。

相關詞條

熱門詞條

聯絡我們