Lucene+nutch搜尋引擎開發

版權資訊

ISBN: 9787115182166

開本： 16

定價: 59.00 元

編輯推薦

《Lucene+nutch搜尋引擎開發》適合對搜尋引擎開發有興趣的讀者閱讀，包括搜尋引擎開發的初學者、高等院校、信息專業學生、從事搜尋開發的程式設計人員等。入門：引導讀者快速掌握（Lucene和nutch的使用方法）；揭秘：深度剖析搜尋引擎核心；實戰：手把手帶您構建企業級搜尋引擎；推薦：Web開發專家強烈推薦。

網際網路搜尋的使用水平可以反映全民的信息處理能力，幾年前有研究發現美國用戶比歐洲用戶的網際網路使用水平領先半年左右，主要是根據誰搜尋時平均使用的關鍵字的個數多。中文用戶的搜尋使用水平相對於西文用戶目前仍然處於比較初級的階段，而中文網站搜尋功能的缺失也是一個重要的因素。

網站擁有了較多內容後，最先會考慮基於目錄的內容分類，以解決信息快速定位的問題，隨著內容量的進一步增加，很多內容在發表之後就很快被湮沒，成為“信息孤島”，而不斷加深的目錄結構也會讓用戶逐漸失去耐心，這時，關鍵字檢索的優勢就體現出來了：

關鍵字檢索可以讓處於“信息孤島”狀態的內容以一種更直接的方法提供給用戶；

和基於目錄/分類的樹形結構不同，基於關鍵字檢索還可以讓內容之間實現網狀的關聯結構，從而大大提高信息的引用密度。

基於傳統資料庫的關鍵字檢索由於性能問題讓很多網站放棄了搜尋功能，問題的解決歸根結底還是需要一個全文引擎。而Lucene開源引擎的出現讓這種原來被少數公司掌握的技術得到了迅速的普及，這裡應該再次感謝引擎的核心貢獻者DougCutting先生，同時也希望有更多的中文開發人員能積極投入：到Lucene的相關項目開發中去，尤其在中文和其他亞洲雙位元組語言處理方面的問題。

Lucene也是我學習的第一個Java程式，當初是通過jdb一行行dubug了解其中的原理和機制的，非常高興有這樣一本專門的參考書出現，它無疑會為開發人員了解並更快掌握全文檢索技術節省大量的時間。

目錄　入門篇

第1章　搜尋引擎概述

1.1　什麼是搜尋引擎

1.1.1　搜尋引擎與信息檢索

1.1.2　搜尋引擎的概念

1.1.3　搜尋引擎的使用

1.1.4　搜尋引擎發展歷史

1.2　搜尋引擎分類

1.2.1　按照工作方式分類

1.2.2　按照領域範圍分類

1.2.3　信息類型分類

1.3　主流搜尋引擎

1.3.1　全球著名搜尋引擎

Lucene+nutch搜尋引擎開發

基本介紹

版權資訊

編輯推薦

目錄　入門篇

第1章　搜尋引擎概述

第2章　搜尋引擎原理探秘

第3章　開源搜尋引擎入門

目錄　核心揭秘篇

第4章　搜尋引擎數據獲取

第5章　搜尋引擎信息索引

第6章　搜尋引擎查詢處理

第7章　搜尋引擎結果排序

第8章　文檔分析器與中文分詞

第9章　搜尋引擎文本分析

第10章　分散式搜尋與快取

目錄　實戰篇

第11章　Nutch專題搜尋引擎實例

第12章　Lucene實現企業搜尋實例

相關詞條

熱門詞條

Lucene+nutch搜尋引擎開發

基本介紹

版權資訊

編輯推薦

目錄 入門篇

第1章 搜尋引擎概述

第2章 搜尋引擎原理探秘

第3章 開源搜尋引擎入門

目錄 核心揭秘篇

第4章 搜尋引擎數據獲取

第5章 搜尋引擎信息索引

第6章 搜尋引擎查詢處理

第7章 搜尋引擎結果排序

第8章 文檔分析器與中文分詞

第9章 搜尋引擎文本分析

第10章 分散式搜尋與快取

目錄 實戰篇

第11章 Nutch專題搜尋引擎實例

第12章 Lucene實現企業搜尋實例

相關詞條

熱門詞條

目錄　入門篇

第1章　搜尋引擎概述

第2章　搜尋引擎原理探秘

第3章　開源搜尋引擎入門

目錄　核心揭秘篇

第4章　搜尋引擎數據獲取

第5章　搜尋引擎信息索引

第6章　搜尋引擎查詢處理

第7章　搜尋引擎結果排序

第8章　文檔分析器與中文分詞

第9章　搜尋引擎文本分析

第10章　分散式搜尋與快取

目錄　實戰篇

第11章　Nutch專題搜尋引擎實例

第12章　Lucene實現企業搜尋實例