<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Sphinx Search全文搜索引擎

          聯(lián)合創(chuàng)作 · 2023-09-29 03:09

          Sphinx 是一個(gè)開(kāi)源的全文搜索服務(wù)器,從頭開(kāi)始設(shè)計(jì)時(shí)就考慮到了性能、相關(guān)性(又名搜索質(zhì)量)和集成的簡(jiǎn)單性。它是用 C++ 編寫(xiě)的,適用于 Linux(RedHat、Ubuntu 等)、Windows、MacOS、Solaris、FreeBSD 和其他一些系統(tǒng)。

          Sphinx 讓你可以快速輕松地批量索引和搜索存儲(chǔ)在 SQL 數(shù)據(jù)庫(kù)、NoSQL 存儲(chǔ)或文件中的數(shù)據(jù),或者即時(shí)索引和搜索數(shù)據(jù),使用 Sphinx 就像使用數(shù)據(jù)庫(kù)服務(wù)器一樣。各種文本處理功能可以根據(jù)你的特定應(yīng)用程序要求微調(diào) Sphinx,并且許多相關(guān)功能確保你也可以調(diào)整搜索質(zhì)量。

          通過(guò)SphinxAPI進(jìn)行搜索只需3行代碼,而通過(guò)SphinxQL進(jìn)行查詢(xún)則更簡(jiǎn)單,搜索查詢(xún)可以用古老的SQL來(lái)表達(dá)。Sphinx 集群每天可擴(kuò)展到數(shù)百億個(gè)文檔和數(shù)億個(gè)搜索查詢(xún),其目前已為 Craigslist、 Living Social、 MetaCafe和 Groupon等頂級(jí)網(wǎng)站提供了支持。

          性能和可擴(kuò)展性

          • 索引性能。Sphinx 每個(gè) CPU 內(nèi)核每秒索引高達(dá) 10-15 MB 的文本,即每臺(tái)服務(wù)器 60+ MB/秒(在專(zhuān)用索引機(jī)器上)。
          • 搜索性能。搜索我們用于日常開(kāi)發(fā)和測(cè)試的 1,000,000 個(gè)文檔、1.2 GB 的文本集合,在具有 2 GB RAM 的 2 核臺(tái)式機(jī)上以 每秒 500 多個(gè)查詢(xún)的速度運(yùn)行。
          • 可擴(kuò)展性。已知最大的 Sphinx 集群索引25+ 十億個(gè)文檔,產(chǎn)生超過(guò) 9TB 的數(shù)據(jù)。最繁忙的知名網(wǎng)站是 Craigslist ,每天提供300+ 百萬(wàn)次搜索查詢(xún)。

          主要特征

          • 批處理和實(shí)時(shí)全文索引。支持高效離線(xiàn)索引構(gòu)建和增量即時(shí)索引更新的兩個(gè)索引后端可用。
          • 非文本屬性支持. 任意數(shù)量的屬性(產(chǎn)品 ID、公司名稱(chēng)、價(jià)格等)可以存儲(chǔ)在索引中并用于檢索(避免訪(fǎng)問(wèn)數(shù)據(jù)庫(kù)),或用于高效的 Sphinx 端搜索結(jié)果集后處理。
          • SQL數(shù)據(jù)庫(kù)索引。Sphinx 可以直接訪(fǎng)問(wèn)和索引存儲(chǔ)在 MySQL(支持所有存儲(chǔ)引擎)、PostgreSQL、Oracle、Microsoft SQL Server、SQLite、Drizzle 以及任何其他支持 ODBC 的系統(tǒng)中的數(shù)據(jù)。
          • 非 SQL 存儲(chǔ)索引。數(shù)據(jù)也可以以稱(chēng)為 XMLpipe 的簡(jiǎn)單 XML 格式流式傳輸?shù)脚饕?,或直接插入到增?RT 索引中。
          • 簡(jiǎn)單的應(yīng)用程序集成。Sphinx 帶有三種不同的 API,SphinxAPI、SphinxSE 和 SphinxQL。SphinxAPI 是一個(gè)原生庫(kù),可用于 Java、PHP、Python、Perl、C 和其他語(yǔ)言。SphinxSE 是 MySQL 的可插拔存儲(chǔ)引擎,可將龐大的結(jié)果集直接傳送到 MySQL 服務(wù)器進(jìn)行后期處理。SphinxQL 允許應(yīng)用程序使用標(biāo)準(zhǔn) MySQL 客戶(hù)端庫(kù)和查詢(xún)語(yǔ)法查詢(xún) Sphinx。
          • 高級(jí)全文搜索語(yǔ)法。我們的查詢(xún)引擎支持結(jié)合布爾運(yùn)算符、短語(yǔ)、接近度、嚴(yán)格順序和群體匹配、字段和位置限制、精確關(guān)鍵字形式匹配、子字符串搜索等的任意復(fù)雜查詢(xún)。
          • 豐富的類(lèi)數(shù)據(jù)庫(kù)查詢(xún)功能。Sphinx 并不局限于關(guān)鍵字搜索。在全文搜索結(jié)果集之上,可以計(jì)算任意算術(shù)表達(dá)式,添加WHERE條件,做ORDER BY,GROUP BY,使用MIN/MAX/AVG/SUM,聚合等。本質(zhì)上是支持成熟的SQL SELECT。
          • 更好的相關(guān)性排名。與許多其他引擎不同,Sphinx 并不完全依賴(lài) 30 年前只考慮關(guān)鍵字頻率的統(tǒng)計(jì)排名,也不限制您使用它。默認(rèn)情況下,Sphinx 還會(huì)分析關(guān)鍵字接近度,并將更接近的短語(yǔ)匹配排名更高,完美匹配排名靠前。此外,排名是靈活的:您可以從許多內(nèi)置相關(guān)函數(shù)中進(jìn)行選擇,通過(guò)使用表達(dá)式調(diào)整它們的權(quán)重,或開(kāi)發(fā)新的函數(shù)。
          • 靈活的文本處理。Sphinx 索引功能包括對(duì) SBCS 和 UTF-8 編碼的全面支持(這意味著實(shí)際上支持世界上所有的語(yǔ)言);停用詞刪除和可選的命中位置刪除(無(wú)中斷索引);通過(guò)詞形詞典和詞干分析器進(jìn)行形態(tài)學(xué)和同義詞處理;異常和混合字符;還有很多。
          • 分布式搜索。搜索可以分布在多臺(tái)機(jī)器上,從而實(shí)現(xiàn)橫向擴(kuò)展和 HA(高可用性)。
          瀏覽 28
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产午夜精品久久久 | 五月不婷婷深爱月天 | 丰满老妇高潮一级A片免费看 | 日本成人网址 | 给我下载一个三级片黄色录像毛片 |