本書特點
結合理論與實務運用,除了介紹搜尋引擎系統外,也詳細說明開發過程。
提供完整實例,讀者可以依據自己的專案需求,稍微修改相關的內容,就可以應用在自己研發的實際項目當中。
針對開發時常遇到的問題進行深入探討,有效解決讀者困擾。
本書內容
本書透過Lucene和Heritrix,講解目前搜尋引擎的構建方式,透過對應用程式介面和原始碼的分析,讓讀者了解搜尋引擎背後的架構過程,並且深入搜尋引擎的核心,認識搜尋引擎的高價值和實用性,進而開發出類似的搜尋引擎網站,提高自己的企業價值。
本書附光碟
本書搭配章節的範例檔
目錄
本書大綱
Ch01 搜尋引擎與資訊檢索
Ch02 Lucene入門實例
Ch03 索引的建立
Ch04 Lucene搜尋
Ch05 排序、過濾和分頁
Ch06 Lucene的分析器
Ch07 Word、Excel和PDF的處理
Ch08 Compass:封裝了Lucene的框架
Ch09 Lucene分散式
Ch10 無比強大的網路爬蟲Heritrix
Ch11 搜尋引擎綜合實例:準備篇
Ch12 搜尋引擎綜合實例:下載篇
Ch13 使用正則運算式與HTMLParser分析網頁
Ch14 網頁內容儲存與索引
Ch15 搜尋引擎綜合實例:互動篇
Ch16 搜尋引擎綜合實例:Web篇
附錄 Lucene 2.4更新內容
本書大綱
Ch01 搜尋引擎與資訊檢索
Ch02 Lucene入門實例
Ch03 索引的建立
Ch04 Lucene搜尋
Ch05 排序、過濾和分頁
Ch06 Lucene的分析器
Ch07 Word、Excel和PDF的處理
Ch08 Compass:封裝了Lucene的框架
Ch09 Lucene分散式
Ch10 無比強大的網路爬蟲Heritrix
Ch11 搜尋引擎綜合實例:準備篇
Ch12 搜尋引擎綜合實例:下載篇
Ch13 使用正則運算式與HTMLParser分析網頁
Ch14 網頁內容儲存與索引
Ch15 搜尋引擎綜合實例:互動篇
Ch16 搜尋引擎綜合實例:Web篇
附錄 Lucene 2.4更新內容
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。