這就是搜索引擎 : 核心技術(shù)詳解
搜索引擎作為互聯(lián)網(wǎng)發(fā)展中至關(guān)重要的一種應(yīng)用,已經(jīng)成為互聯(lián)網(wǎng)各個(gè)領(lǐng)域的制高點(diǎn),其重要性不言而喻。搜索引擎領(lǐng)域也是互聯(lián)網(wǎng)應(yīng)用中不多見的以核心技術(shù)作為其命脈的領(lǐng)域,搜索引擎各個(gè)子系統(tǒng)是如何設(shè)計(jì)的?這成為廣大技術(shù)人員和搜索引擎優(yōu)化人員密切關(guān)注的內(nèi)容。
本書的最大特點(diǎn)是內(nèi)容新穎全面而又通俗易懂。對于實(shí)際搜索引擎所涉及的各種核心技術(shù)都有全面細(xì)致的介紹,除了作為搜索系統(tǒng)核心的網(wǎng)絡(luò)爬蟲、索引系統(tǒng)、排序系統(tǒng)、鏈接分析及用戶分析外,還包括網(wǎng)頁反作弊、緩存管理、網(wǎng)頁去重技術(shù)等實(shí)際搜索引擎必須關(guān)注的技術(shù),同時(shí)用相當(dāng)大的篇幅講解了云計(jì)算與云存儲的核心技術(shù)原理。另外,本書也密切關(guān)注搜索引擎發(fā)展的前沿技術(shù):Google的咖啡因系統(tǒng)及Megastore等云計(jì)算新技術(shù)、百度的暗網(wǎng)抓取技術(shù)阿拉丁計(jì)劃、內(nèi)容農(nóng)場作弊、機(jī)器學(xué)習(xí)排序等。諸多新技術(shù)在相關(guān)章節(jié)都有詳細(xì)講解,同時(shí)對于社會化搜索、實(shí)...
搜索引擎作為互聯(lián)網(wǎng)發(fā)展中至關(guān)重要的一種應(yīng)用,已經(jīng)成為互聯(lián)網(wǎng)各個(gè)領(lǐng)域的制高點(diǎn),其重要性不言而喻。搜索引擎領(lǐng)域也是互聯(lián)網(wǎng)應(yīng)用中不多見的以核心技術(shù)作為其命脈的領(lǐng)域,搜索引擎各個(gè)子系統(tǒng)是如何設(shè)計(jì)的?這成為廣大技術(shù)人員和搜索引擎優(yōu)化人員密切關(guān)注的內(nèi)容。
本書的最大特點(diǎn)是內(nèi)容新穎全面而又通俗易懂。對于實(shí)際搜索引擎所涉及的各種核心技術(shù)都有全面細(xì)致的介紹,除了作為搜索系統(tǒng)核心的網(wǎng)絡(luò)爬蟲、索引系統(tǒng)、排序系統(tǒng)、鏈接分析及用戶分析外,還包括網(wǎng)頁反作弊、緩存管理、網(wǎng)頁去重技術(shù)等實(shí)際搜索引擎必須關(guān)注的技術(shù),同時(shí)用相當(dāng)大的篇幅講解了云計(jì)算與云存儲的核心技術(shù)原理。另外,本書也密切關(guān)注搜索引擎發(fā)展的前沿技術(shù):Google的咖啡因系統(tǒng)及Megastore等云計(jì)算新技術(shù)、百度的暗網(wǎng)抓取技術(shù)阿拉丁計(jì)劃、內(nèi)容農(nóng)場作弊、機(jī)器學(xué)習(xí)排序等。諸多新技術(shù)在相關(guān)章節(jié)都有詳細(xì)講解,同時(shí)對于社會化搜索、實(shí)時(shí)搜索及情境搜索等搜索引擎的未來發(fā)展方向做了技術(shù)展望。為了增進(jìn)讀者的理解,全書大量引入形象的圖片來講解算法原理,相信讀者會發(fā)現(xiàn)原來搜索引擎的核心技術(shù)理解起來比原先想象的要簡單得多。
張俊林:本科畢業(yè)于天津大學(xué)管理學(xué)院,2004年于中科院軟件所直接獲得博士學(xué)位并留所從事科研工作,研究方向?yàn)樗阉饕媾c自然語言處理。2005年在CSDN博客發(fā)布系列博文“搜索引擎設(shè)計(jì)實(shí)用教程:以百度為例”,在網(wǎng)絡(luò)上獲得了廣泛轉(zhuǎn)載與良好口碑。2006年作為聯(lián)合創(chuàng)始人建立了智能信息聚合網(wǎng)站“玩聚網(wǎng)”,曾先后于阿里巴巴搜索技術(shù)中心任資深搜索技術(shù)研究員、房價(jià)網(wǎng)首席研究員,現(xiàn)任職于新浪微博,從事微博搜索與語義分析及推薦方面的研發(fā)工作。
