Apache Solr全文搜索服務(wù)器
solr 名稱來源
Search On Lucene Replication
solr 基本概況
Apache Solr (讀音: SOLer) 是基于 Lucene 的全文搜索服務(wù)器,也是最流行的企業(yè)級(jí)搜索引擎,其主要功能包括全文檢索、命中高亮、分面搜索、動(dòng)態(tài)聚類、數(shù)據(jù)庫集成,以及對(duì)富文本(如 Word、PDF)的處理。Solr 高度可擴(kuò)展,并提供了分布式搜索和索引復(fù)制,Solr 4 還增加了 NoSQL 支持。
Solr 使用 Java 語言開發(fā),主要基于 HTTP 和 Apache Lucene 實(shí)現(xiàn)。Apache Solr 中存儲(chǔ)的資源是以 Document 為對(duì)象進(jìn)行存儲(chǔ)的。每個(gè)文檔由一系列的 Field 構(gòu)成,每個(gè) Field 表示資源的一個(gè)屬性。Solr 中的每個(gè) Document 需要有能唯一標(biāo)識(shí)其自身的屬性,默認(rèn)情況下這個(gè)屬性的名字是 id,在 Schema 配置文件中使用:id進(jìn)行描述。
Solr是一個(gè)高性能,采用Java開發(fā),基于Lucene的全文搜索服務(wù)器。文檔通過Http利用XML加到一個(gè)搜索集合中。查詢?cè)摷弦彩峭ㄟ^ http收到一個(gè)XML/JSON響應(yīng)來實(shí)現(xiàn)。它的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結(jié)果,通過索引復(fù)制來提高可用性,提 供一套強(qiáng)大Data Schema來定義字段,類型和設(shè)置文本分析,提供基于Web的管理界面等。
solr 歷史
2004年 CNET 開發(fā) Solar,為 CNET 提供站內(nèi)搜索服務(wù)
2006年1月捐獻(xiàn)給 Apache ,成為 Apache 的孵化項(xiàng)目
一年后 Solr 孵化成熟,發(fā)布了1.2版,并成為 Lucene 的子項(xiàng)目
2010年6月,solr 發(fā)布了的1.4.1版,這是1.4的 bugfix 版本,1.4.1的solr使用的lucene是2.9版本的
solr 從1.4.x版本以后,為了保持和lucene同步的版本,solr直接進(jìn)入3.0版本。
更多屏幕截圖:
