索引庫

索引庫就類似於我們查字典時候的檢索表,或者是圖書館的書目檢索。Google的蜘蛛在抓取網頁之後,就把這些頁面放到對應的索引庫裡面。在用戶搜尋的時候,只需要到相應的檢索庫裡面搜尋相應的信息,而不是從所有的頁面當中。

基本介紹

  • 中文名:索引庫
  • 類似於:我們查字典時候的檢索表
  • 分類根據:詞語
  • 用於:網路
索引庫的分類方式,

索引庫的分類方式

索引庫里用詞語來分類。因為儘管網際網路上的網頁是不斷激增的,但是每一種語言裡,詞語的數量都是相對固定的。比如英語就是一百多萬個單詞,100億 ÷ 1百萬 = 1 萬;漢語是8萬多個詞語,100億÷8萬=12萬5千。都是計算機很容易處理得過來的。
用詞語來分類還有一個好處,就是可以匹配用戶查詢的那個詞語。本來用戶就是要查這個詞語的,那我就按這個詞語去分類就是。所以,搜尋引擎的索引庫,最後就是這個樣子的:
索引庫的分類方式索引庫的分類方式

相關詞條

熱門詞條

聯絡我們