查詢百億級數(shù)據(jù)毫秒級返回!牛逼哄哄的ElasticSearch是如何做到的?
來源:GitHub指南
1、你是否有這樣的需求?
1、想做一個類似于谷歌、或者百度一樣的網(wǎng)站,用戶隨意輸入一些詞,毫秒之間快速檢索大量相關(guān)文章。
2、或者類似于淘寶、京東這樣的網(wǎng)站中的檢索功能,用戶隨意輸入,然后快速檢索出用戶期望的產(chǎn)品。
3、想做一個博客網(wǎng)站,支持快速檢索
4、在公司內(nèi)部做一個日志檢索系統(tǒng),能夠收集公司所有系統(tǒng)的日志,支持關(guān)鍵字快速定位日志,方便排錯。
如果你有這樣的需求,那么這篇文章就可以幫你實現(xiàn)這種訴求。
2、如何實現(xiàn)我們的訴求?
剛剛上面提到的需求就是全文檢索技術(shù)解決的問題,能夠從大量非結(jié)構(gòu)化的數(shù)據(jù)中快速檢索出符合條件的結(jié)果。
比如百度可能收錄了萬億以上的文章,但是你輸入一個 python,百度能在毫秒之間從萬億文章中檢索出包含 python 的結(jié)果返回給你,而這個就是全文檢索技術(shù)的功能。
3、Elasticsearch
這里給大家推薦全球排名第一的全文檢索框架:Elasticsearch,特點如下:
1、java 語言開發(fā)的一個全文檢索框架,源碼已開源
2、支持 restfull 接口的方式調(diào)用,所以基本上和任何開發(fā)語言都可以非常方便的集成
3、支持無限擴展,這個什么意思呢?不管你的數(shù)量多大,elasticsearch 都可以在快速幫你檢索出結(jié)果;因為他采用分布式集群的方式部署,支持無限擴張
4、高可用
可能這里還不能體現(xiàn)他到底有多牛,這么說吧,除了谷歌、百度他們的檢索技術(shù)是自己實現(xiàn)的,而其他公司 99%都使用的是 Elasticsearch,而這家公司光靠對外提供全文檢索技術(shù)服務(wù),市值已經(jīng) 100 億美元了。

4、官網(wǎng)
https://www.elastic.co/cn/

5、學(xué)習(xí)文檔
學(xué)習(xí)資料可以直接看官網(wǎng)文檔,地址如下:
https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html

6、學(xué)習(xí)視頻
通過視頻學(xué)習(xí),會更容易一些,b 站上很多,可以去看看
https://search.bilibili.com/all?keyword=elasticsearch

