Tantivy全文搜索引擎庫(kù)
Tantivy 是一個(gè)用 Rust 編寫(xiě)的搜索引擎庫(kù),其靈感來(lái)自于 Lucene。
得益于 Rust 語(yǔ)言加持,Tantivy 性能比 Lucene 要好得多
主要特性:
- 全文搜索
- 可配置的分詞器,支持 17 種語(yǔ)言詞干,包括中文、日文和韓文
- 速度非???check out the ?? ? benchmark ? ??)
- 啟動(dòng)時(shí)間極短 (<10ms), perfect for command-line tools
- BM25 評(píng)分 (與 Lucene 相同)
- 自然查詢語(yǔ)言 (e.g.
(michael AND jackson) OR "king of pop") - 短語(yǔ)查詢搜索 (e.g.
"michael jackson") - 增量索引
- 多線程索引
- Mmap 目錄
- SIMD 整數(shù)壓縮,支持 SSE2 指令集
- 快速的單值和多值 u64, i64, f64 字段 (等同于 lucene 中的 doc values)
-
&[u8]fast fields - Text, i64, u64, f64, dates, and hierarchical facet fields
- LZ4 壓縮文檔存儲(chǔ)
- 范圍搜索
- Faceted 搜索
- 可配置的索引
- JSON 字段
- 聚合收集器,包括 range buckets, average, and stats metrics
- LogMergePolicy with deletes
- Searcher Warmer API
- Cheesy logo with a horse
評(píng)論
圖片
表情
