首頁上奇資訊緣起線上購書認證考試學校目錄下載會員中心讀者服務資源下載
DeepStone JobExam SSE國際證照 拓客TALK 有意思JOYCE 上奇時代 佳魁資訊 佳魁文化 上奇科技 回頭書展
參觀人數
3399868
開發專屬個人的搜尋引擎 - 使用Lucene & Heritrix (第二版)
作者:邱哲、符滔滔、王學松(譯者:胡嘉璽)
出版日期:2012/09/10
語言:繁體中文
書號:HR1250
ISBN:9789862574638
裝訂:平裝
定價:560
特價:8448
查看我的購物清單
書籍介紹
上奇資訊推薦
購物說明


[本書特點]

• 結合理論與實務運用,除了介紹搜尋引擎系統外,也詳細說明開發過程。
• 提供完整實例,讀者可以依據自己的專案需求,稍微修改相關的內容,就可以應用在自己研發的實際項目當中。
• 針對開發時常遇到的問題進行深入探討,有效解決讀者困擾。

top


[本書內容]

本書透過Lucene和Heritrix,講解目前搜尋引擎的構建方式,透過對應用程式介面和原始碼的分析,讓讀者了解搜尋引擎背後的架構過程,並且深入搜尋引擎的核心,認識搜尋引擎的高價值和實用性,進而開發出類似的搜尋引擎網站,提高自己的企業價值。

top


[本書附光碟]

• 本書搭配章節的範例檔

top

[本書大綱]

Ch01 搜尋引擎與資訊檢索
1.1 搜尋引擎的歷史
1.2 資訊檢索系統的基本知識
1.3 Lucene的簡介
1.4 小結

Ch02 Lucene入門實例
2.1 實例介紹
2.2 準備工作
2.3 建立Eclipse專案
2.4 執行效果
2.5 小結

Ch03 索引的建立
3.1 Document邏輯檔案
3.2 Field的內部實現
3.3 Lucene的索引工具IndexWriter
3.4 Lucene索引過程詳解
3.5 索引檔案格式
3.6 索引過程的最佳化
3.7 索引的合併與索引的最佳化
3.8 從索引中刪除檔案
3.9 Lucene的同步問題
3.10 Lucene 2.0的新類別:IndexModifier類別
3.11 小結

Ch04 Lucene搜尋
4.1 使用IndexSearcher進行搜尋
4.2 Hits 類別詳解
4.3 對搜尋結果的評分
4.4 建構各種Lucene內建的Query物件
4.5 協力廠商提供的Query 物件:RegexQuery
4.6 透過QueryParser轉換使用者關鍵字
4.7 多Field 搜尋與多索引搜尋
4.8 小結

Ch05 排序、過濾和分頁
5.1 相關度排序
5.2 使用Sort來排序
5.3 搜尋的篩檢程式
5.4 翻頁問題
5.5 小結

Ch06 Lucene的分析器
6.1 分析
6.2 Lucene與JavaCC
6.3 分析器的進階
6.4 對中文的分析
6.5 小結

Ch07 Word、Excel和PDF的處理
7.1 使用PDFBox處理PDF文件
7.2 使用xpdf來處理中文PDF文件
7.3 使用POI來處理Excel 和Word檔案格式
7.4 使用Jacob來處理Word文件
7.5 小結

Ch08 Compass:封裝了Lucene的框架
8.1 Compass簡介
8.2 Compass的初始設定
8.3 域模型的設定
8.4 使用Compass來建立索引
8.5 使用Compass來搜尋
8.6 設定Analyzer和Optimizer
8.7 小結

Ch09 Lucene分散式
9.1 Lucene與分散式
9.2 小結

Ch10 無比強大的網路爬蟲Heritrix
10.1 Heritrix的使用入門
10.2 Heritrix的架構
10.3 擴充和訂製Heritrix
10.4 小結

Ch11 搜尋引擎綜合實例:準備篇
11.1 數位產品垂直搜尋引擎實例簡介
11.2 準備Eclipse的Web開發環境
11.3 準備垂直搜尋引擎專案
11.4 搜尋引擎設定資訊管理及相關類
11.5 小結

Ch12 搜尋引擎綜合實例:下載篇
12.1 數位產品網路爬蟲
12.2 數位產品資訊來源清單準備
12.3 Eclipse中訂製數位產品Heritrix爬蟲
12.4 抓取pconline網頁的訂製擴充類
12.5 抓取網易手機頻道的訂製擴充類別
12.6 小結

Ch13 使用正則運算式與HTMLParser分析網頁
13.1 網頁內容分析方法概述
13.2 正則運算式精確分析網頁內容
13.3 HTMLParser高效分析網頁內容
13.4 數位產品網頁內容解析系統
13.5 pconline手機產品網頁內容解析
13.6 網易手機頻道產品內容解析
13.7 小結

Ch14 網頁內容儲存與索引
14.1 建構產品檢索名稱資訊詞庫
14.2 手機產品資料庫與檔案索引結構
14.3 產品資訊資料庫儲存與處理
14.4 產品資訊檔案儲存與Lucene 索引
14.5 產品資訊綜合處理與執行
14.6 小結

Ch15 搜尋引擎綜合實例:互動篇
15.1 DWR的技術介紹
15.2 DWR安裝與設定
15.3 DWR入門與實例示範
15.4 dwr.xm 的設定進階
15.5 使用DWR工具庫util.js
15.6 小結

Ch16 搜尋引擎綜合實例:Web篇
16.1 Web設定檔
16.2 各種搜尋相關Bean類別
16.3 資料庫存取SearchResultDAO類別實現
16.4 Lucene索引檢索SearchService類別實現
16.5 前景Web頁面設計
16.6 實例中的問題與功能擴充
16.7 小結

附錄ChA Lucene 2.4更新內容
A.1 IndexWriter的建構函數
A.2 IndexWriter的init 方法
A.3 IndexWriter中的flush、commit 和close
A.4 Lucene 2.4中的Segment
A.5 IndexCommit和IndexDeletionPolicy
A.6 IndexWriter中的addDocument
A.7 DocumentsWriter類別的addDocument方法
A.8 DocumentsWriter的索引鏈

top
 
(無推薦書籍)

下訂後,請勿先行匯款,我們會有專人與您聯繫,確認訂單明細後,再請您匯款。

處理訂單時間:
周一至周五09:00~17:00,12:00~13:00為休息時間,謝謝!

提供的付款方式:
郵政劃撥: 50133309
戶名: 深石數位科技股份有限公司。

訂單成立後,請完成劃撥並將收據、收件詳細資料傳真至02-2562-5269或掃描後e-mail至kathyhsu@grandtech.info,我們會儘速為您處理。
若您超過三日未匯款,我們將取消此次訂單。

運費:
每次線上購書,未滿$500元酌收$100元運費。

關於退書和換書:
在您收到貨七日以內,我們接受您的退書和換書。在非人為損壞的情況(書籍本身有缺頁、破損的情況不在此限)我們接受您兩次退換書。
退書和換書時請務必連同發票、出貨單一併退回並註明退款帳戶資料,我們將於收到退貨二至三天退還款項,未退還發票者,恕無法辦理退貨。

若您對書籍有任何問題,歡迎e-mail至kathyhsu@grandtech.info,或來電02-2562-7969分機2353詢問。

首頁上奇資訊緣起線上購書國際證照學校目錄下載會員中心讀者服務資源下載
上奇資訊股份有限公司
104台北市中山區南京東路二段98號8樓之1 / 電話 : 2562-7969 / 傳真 : 2562-5269
版權所有 © 2013 GrandTech Information Co.,Ltd. All Rights Reserved.
購物總金額:0
購物筆數:0 筆 │