www.想要xx,亚洲AV免费看,无码一区四区,欧美性爱少妇性爱,JiZZ性欧美191看片,黄网在线免费,日日骚av一区二区三区,琪琪色导航

Python實戰(zhàn)社群

Java實戰(zhàn)社群

長按識別下方二維碼，按需求添加

掃碼關(guān)注添加客服

進Python社群▲

掃碼關(guān)注添加客服

進Java社群▲

作者丨匠心Java
來源丨匠心Java

JanusGraph圖解系列文章~

文章為作者跟蹤源碼和查看官方文檔整理，如有任何問題，請聯(lián)系我或在評論區(qū)指出，感激不盡！

圖數(shù)據(jù)庫網(wǎng)上資源太少，評論區(qū)評論 or 私信我，邀你加入“圖庫交流微信群”，一起交流學習！

源碼分析相關(guān)可查看github（求star~~）：https://github.com/YYDreamer/janusgraph

下述流程高清大圖地址：https://www.processon.com/view/link/5f471b2e7d9c086b9903b629

版本：JanusGraph-0.5.2 、

正文

在介紹JanusGraph的分布式ID生成策略之前，我們來簡單分析一下分布式ID應(yīng)該滿足哪些特征？

全局唯一：必須保證ID是分布式環(huán)境中全局性唯一的，這是基本要求

高性能：高可用低延時，ID生成響應(yīng)快；否則可能會成為業(yè)務(wù)瓶頸
高可用：提供分布式id的生成的服務(wù)要保證高可用，不能隨隨便便就掛掉了，會對業(yè)務(wù)產(chǎn)生影響
趨勢遞增：主要看業(yè)務(wù)場景，類似于圖存儲中節(jié)點的唯一id就盡量保持趨勢遞增；但是如果類似于電商訂單就盡量不要趨勢遞增，因為趨勢遞增會被惡意估算出當天的訂單量和成交量，泄漏公司信息
接入方便：要秉著拿來即用的設(shè)計原則，在系統(tǒng)設(shè)計和實現(xiàn)上要盡可能的簡單

一：常用分布式id生成策略

當前常用的分布式id的生成策略主要分為以下四種：

UUID
數(shù)據(jù)庫+號段模式（優(yōu)化：數(shù)據(jù)庫+號段+雙buffer）
基于Redis實現(xiàn)
雪花算法（SnowFlake）

還有一些其他的比如：基于數(shù)據(jù)庫自增id、數(shù)據(jù)庫多主模式等，這些在小并發(fā)的情況下可以使用，大并發(fā)的情況下就不太ok了

市面上有一些生成分布式id的開源組件，包括滴滴基于數(shù)據(jù)庫+號段實現(xiàn)的TinyID 、百度基于SnowFlake的Uidgenerator、美團支持號段和SnowFlake的Leaf等

那么，在JanusGraph中分布式id的生成是采用的什么方式呢？

二：JanusGraph的分布式id策略

在JanusGraph中，分布式id的生成采用的是數(shù)據(jù)庫+號段+雙buffer優(yōu)化的模式；下面我們來具體分析一下：

分布式id生成使用的數(shù)據(jù)庫就是JanusGraph當前使用的第三方存儲后端，這里我們以使用的存儲后端Hbase為例；

JanusGraph分布式id生成所需元數(shù)據(jù)存儲位置：

在Hbase中有column family 列族的概念；JanusGraph在初始化Hbase表時默認創(chuàng)建了9大列族，用于存儲不同的數(shù)據(jù)，具體看《圖解圖庫JanusGraph系列-一文知曉圖數(shù)據(jù)底層存儲結(jié)構(gòu)》；

其中有一個列族janusgraph_ids簡寫為i這個列族，主要存儲的就是JanusGraph分布式id生成所需要的元數(shù)據(jù)！

JanusGraph的分布式id的組成結(jié)構(gòu)：

??//?源碼中有一句話體現(xiàn)
?????/*??---?JanusGraphElement?id?bit?format?---
??????*??[?0?|?count?|?partition?|?ID?padding?(if?any)?]
?????*/

主要分為4部分：0、count、partition、ID padding（每個類型是固定值）；

其實這4部分的順序在序列化為二進制數(shù)據(jù)時，順序會有所改變；這里只是標明了id的組成部分！

上述部分的partition + count來保證分布式節(jié)點的唯一性；

partition id：分區(qū)id值，JanusGraph默認分了32個邏輯分區(qū)；節(jié)點分到哪個分區(qū)采用的是隨機分配;
count：每個partition都有對應(yīng)的一個count范圍：0-2的55次冪；JanusGraph每次拉取一部分的范圍作為節(jié)點的count取值；JanusGraph保證了針對相同的partition，不會重復(fù)獲取同一個count值！

保證count在partition維度保持全局唯一性，就保證了生成的最終id的全局唯一性！！

則分布式id的唯一性保證，就在于count基于partition維度的唯一性！下面我們的分析也是著重在count的獲??！

JanusGraph分布式id生成的主要邏輯流程如下圖所示：（推薦結(jié)合源碼分析觀看?。?/strong>

分析過程中有一個概念為id block：指當前獲取的號段范圍

JanusGraph主要使用``PartitionIDPool 類來存儲不同類型的StandardIDPool；在StandardIDPool`中主要包含兩個id Block：

current block：當前生成id使用的block
next block：double buffer中的另一個已經(jīng)準備好的block

為什么要有兩個block呢？

主要是如果只有一個block的話，當我們在使用完當前的block時，需要阻塞等待區(qū)獲取下一個block，這樣便會導(dǎo)致分布式id生成較長時間的阻塞等待block的獲??；

怎么優(yōu)化上述問題呢？double buffer；

除了當前使用的block，我們再存儲一個next block；當正在使用的block假設(shè)已經(jīng)使用了50%，觸發(fā)next block的異步獲取，如上圖的藍色部分所示；

這樣當current block使用完成后可以直接無延遲的切換到next block如上圖中綠色部分所示；

在執(zhí)行過程中可能會因為一些異常導(dǎo)致節(jié)點id獲取失敗，則會進行重試；重試次數(shù)默認為1000次；

private?static?final?int?MAX_PARTITION_RENEW_ATTEMPTS?=?1000;
for?(int?attempt?=?0;?attempt????//?獲取id的過程
}

ps：上述所說的IDPool和block是基于當前圖實例維度共用的！

三：源碼分析

在JanusGraph的源碼中，主要包含兩大部分和其他的一些組件：

Graph相關(guān)類：用于對節(jié)點、屬性、邊的操作
Transaction相關(guān)類：用于在對數(shù)據(jù)或者Schema進行CURD時，進行事務(wù)處理
其他一些：分布式節(jié)點id生成類；序列化類；第三方索引操作類等等

Graph和Transaction相關(guān)類的類圖如下所示：

分布式id涉及到id生成的類圖如下所示：

初始數(shù)據(jù)：

????@Test
????public?void?addVertexTest(){
????????List

圖解Janusgraph系列-分布式id生成策略分析

正文

一：常用分布式id生成策略

二：JanusGraph的分布式id策略

三：源碼分析

四：其他類型的id生成

1、property id的生成

2、Edge id的生成

3、Schema相關(guān)id的生成

圖解Janusgraph系列-分布式id生成策略分析

正文

一：常用分布式id生成策略

二：JanusGraph的分布式id策略

三：源碼分析

四：其他類型的id生成

1、property id的生成

2、Edge id的生成

3、Schema相關(guān)id的生成

3、Schema相關(guān)id的生成