ULID 是什么?比 UUID 更好用的全局唯一標(biāo)識(shí)符?
點(diǎn)擊上方“Java技術(shù)江湖”,選擇“設(shè)為星標(biāo)”
回復(fù)”666“獲取全網(wǎng)最熱的Java核心知識(shí)點(diǎn)整理
作者:pushqiang
https://blog.csdn.net/pushiqiang/article/details/117365290
ULID :Universally Unique Lexicographically Sortable Identifier(通用唯一詞典分類標(biāo)識(shí)符)
UUID :Universally Unique Identifier(通用唯一標(biāo)識(shí)符)
為什么不選擇UUID?
UUID 目前有 5 個(gè)版本:
版本1:在許多環(huán)境中是不切實(shí)際的,因?yàn)樗枰L問唯一的,穩(wěn)定的MAC地址,容易被攻擊;
版本2:將版本 1 的時(shí)間戳前四位換為 POSIX 的 UID 或 GID,問題同上;
版本3:基于 MD5 哈希算法生成,生成隨機(jī)分布的ID需要唯一的種子,這可能導(dǎo)致許多數(shù)據(jù)結(jié)構(gòu)碎片化;
版本4:基于隨機(jī)數(shù)或偽隨機(jī)數(shù)生成,除了隨機(jī)性外沒有提供其他信息;
版本5:通過 SHA-1 哈希算法生成,生成隨機(jī)分布的ID需要唯一的種子,這可能導(dǎo)致許多數(shù)據(jù)結(jié)構(gòu)碎片化;
這里面常用的就是 UUID4 了,但是,即使是隨機(jī)的,但是也是存在沖突的風(fēng)險(xiǎn)。
和 UUID 要么基于隨機(jī)數(shù),要么基于時(shí)間戳不同,ULID 是既基于時(shí)間戳又基于隨機(jī)數(shù),時(shí)間戳精確到毫秒,毫秒內(nèi)有1.21e + 24個(gè)隨機(jī)數(shù),不存在沖突的風(fēng)險(xiǎn),而且轉(zhuǎn)換成字符串比 UUID 更加友好。
ULID特性
ulid() # 01ARZ3NDEKTSV4RRFFQ69G5FAV
與UUID的128位兼容性 每毫秒1.21e + 24個(gè)唯一ULID
按字典順序(也就是字母順序)排序!
規(guī)范地編碼為26個(gè)字符串,而不是UUID的36個(gè)字符
使用Crockford的base32獲得更好的效率和可讀性(每個(gè)字符5位)
不區(qū)分大小寫
沒有特殊字符(URL安全)
單調(diào)排序順序(正確檢測(cè)并處理相同的毫秒)
ULID規(guī)范
以下是在python(ulid-py)中實(shí)現(xiàn)的ULID的當(dāng)前規(guī)范。二進(jìn)制格式已實(shí)現(xiàn)
01AN4Z07BY 79KA1307SR9X4MV3
|----------| |----------------|
Timestamp Randomness
10chars 16chars
48bits 80bits
組成
時(shí)間戳
48位整數(shù) UNIX時(shí)間(以毫秒為單位) 直到公元10889年,空間都不會(huì)耗盡。
隨機(jī)性
80位隨機(jī)數(shù) 如果可能的話,采用加密技術(shù)保證隨機(jī)性
排序
最左邊的字符必須排在最前面,最右邊的字符必須排在最后(詞匯順序)。必須使用默認(rèn)的ASCII字符集。在同一毫秒內(nèi),不能保證排序順序
編碼方式
如圖所示,使用了Crockford的Base32。該字母表不包括字母I,L,O和U,以避免混淆和濫用。
0123456789ABCDEFGHJKMNPQRSTVWXYZ
二進(jìn)制布局和字節(jié)順序
組件被編碼為16個(gè)八位位組。每個(gè)組件都以最高有效字節(jié)在前(網(wǎng)絡(luò)字節(jié)順序)進(jìn)行編碼。
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 32_bit_uint_time_high |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 16_bit_uint_time_low | 16_bit_uint_random |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 32_bit_uint_random |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| 32_bit_uint_random |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
應(yīng)用場(chǎng)景
替換數(shù)據(jù)庫自增id,無需DB參與主鍵生成
分布式環(huán)境下,替換UUID,全局唯一且毫秒精度有序
比如要按日期對(duì)數(shù)據(jù)庫進(jìn)行分區(qū)分表,可以使用ULID中嵌入的時(shí)間戳來選擇正確的分區(qū)分表
如果毫秒精度是可以接受的(毫秒內(nèi)無序),可以按照ULID排序,而不是單獨(dú)的created_at字段
用法(python)
安裝
pip install ulid-py
創(chuàng)建一個(gè)全新的ULID。
時(shí)間戳記值(48位)來自 time.time(),精度為毫秒。
隨機(jī)值(80位)來自 os.urandom()。
>>> import ulid
>>> ulid.new()
<ULID('01BJQE4QTHMFP0S5J153XCFSP9')>
根據(jù)現(xiàn)有的128位值(例如UUID)創(chuàng)建新的ULID 。
支持ULID值類型有 int,bytes,str,和UUID。
>>> import ulid, uuid
>>> value = uuid.uuid4()
>>> value
UUID('0983d0a2-ff15-4d83-8f37-7dd945b5aa39')
>>> ulid.from_uuid(value)
<ULID('09GF8A5ZRN9P1RYDVXV52VBAHS')>
從現(xiàn)有時(shí)間戳值(例如datetime對(duì)象)創(chuàng)建新的ULID 。
支持時(shí)間戳值類型有int,float,str,bytes,bytearray,memoryview,datetime,Timestamp,和ULID
>>> import datetime, ulid
>>> ulid.from_timestamp(datetime.datetime(1999, 1, 1))
<ULID('00TM9HX0008S220A3PWSFVNFEH')>
根據(jù)現(xiàn)有的隨機(jī)數(shù)創(chuàng)建一個(gè)新的ULID。
支持隨機(jī)值類型有int,float,str,bytes,bytearray,memoryview,Randomness,和ULID。
>>> import os, ulid
>>> randomness = os.urandom(10)
>>> ulid.from_randomness(randomness)
>>> <ULID('01BJQHX2XEDK0VN0GMYWT9JN8S')>
一旦有了ULID對(duì)象,就有多種與之交互的方法。
timestamp()方法將為您提供ULID的前48位的時(shí)間戳快照,而randomness()方法將為您提供后80位的隨機(jī)數(shù)快照。
>>> import ulid
>>> u = ulid.new()
>>> u
<ULID('01BJQM7SC7D5VVTG3J68ABFQ3N')>
>>> u.timestamp()
<Timestamp('01BJQM7SC7')>
>>> u.randomness()
<Randomness('D5VVTG3J68ABFQ3N')>
更多詳細(xì)內(nèi)容,可查閱 Github:https://github.com/ahawker/ulid

Java 后端有哪些不用學(xué)的技術(shù)?勸退。。。

Java 中九種 Map 的遍歷方式,你一般用的是哪種呢?

MySQL模糊查詢?cè)僖灿貌恢?like+% 了!
- EOF -
關(guān)注公眾號(hào)【Java技術(shù)江湖】后回復(fù)“PDF”即可領(lǐng)取200+頁的《Java工程師面試指南》
強(qiáng)烈推薦,幾乎涵蓋所有Java工程師必知必會(huì)的知識(shí)點(diǎn),不管是復(fù)習(xí)還是面試,都很實(shí)用。

