面試官:如何設(shè)計(jì)群聊消息的已讀未讀功能
不點(diǎn)藍(lán)字關(guān)注,我們哪來故事?

正文如下
來源:www.toutiao.com/
i6686735232772604429
一朋友和我討論他前段時(shí)間面試某大公司的一題目 :
企業(yè)IM比如企業(yè)微信、釘釘里面的群消息的有個(gè)已讀未讀的功能,發(fā)送者剛發(fā)出消息時(shí),當(dāng)前群里其他群成員都是未讀狀態(tài),陸陸續(xù)續(xù)有人看了這個(gè)消息,這時(shí)候消息的詳情變成x人已讀,y人未讀。
如下圖所示,有具體的已讀未讀列表(萬惡的功能,看到同事or老板的消息不能假裝沒看到了),每條消息對(duì)應(yīng)一個(gè)唯一的messageid(uint64_t),每個(gè)用戶對(duì)應(yīng)一個(gè)唯一的userid(uint64_t),應(yīng)該如何保存這個(gè)消息對(duì)應(yīng)的已讀未讀詳情呢?

我第一時(shí)間給出一個(gè)很簡(jiǎn)單粗暴的方案:
對(duì)于每一個(gè)messageid,存當(dāng)前
readids + unreadids,當(dāng)群成員A已讀某一條消息時(shí),把A userid從unreadids移除寫到readids上就好了,客戶端更新到messageid對(duì)應(yīng)的詳情列表,就可以展示m人已讀,n人未讀
顯然這么簡(jiǎn)單粗暴的方案面試官是不會(huì)滿意的,追問有沒有更好的方案呢?
仔細(xì)分析,按照目前的設(shè)計(jì),每一條消息,已讀未讀詳情就要占用8B * 群成員數(shù)的內(nèi)存,如果一個(gè)活躍的200人大群,每發(fā)一條消息,已讀未讀就要1600B,如果平均每天消息量是1k,那每個(gè)這樣的群,每天就要1.6MB磁盤空間,對(duì)于客戶端來說,特別是手機(jī)端,占用磁盤空間是用戶不能接受的,又不能把工作消息刪了,對(duì)于服務(wù)器端來說,用戶群體如果特別大,那數(shù)據(jù)庫存儲(chǔ)這個(gè)成本也不小
其實(shí)未讀已讀就是一個(gè)0/1的標(biāo)記而已,可以維護(hù)一個(gè)bitmap來實(shí)現(xiàn)呢?具體應(yīng)該怎么做呢?
群元信息保存userid到自增mapid的映射
struct UserInfo
{
uint64_t userid;
uint32_t mapid;
};
struct GroupMetaInfo
{
vector <UserInfo> members;
string name;
uint32_t maxid;
// other info
};
這樣群成員每加入一個(gè)群里,就有mapid<->usreid的雙向映射了,假如群里有5個(gè)成員ABCDE, 那就對(duì)應(yīng)mapid 1-5,messageid對(duì)應(yīng)的消息詳情存儲(chǔ)就可以設(shè)計(jì)成
{ uint32_t maxid, uint8_t readbit[]}
如上面的案例就是{5, readbit[0] =bin(0000 0000)}; 就占用了5B(4+1),A發(fā)消息,D已讀消息時(shí),就更新成{5,readbit[0]= bin(0000 1000)},其余4人都已讀消息時(shí) 更新為{5, readbit[0]=bin(0001 1110)}
這是個(gè)粗略的方案,里面還有一些細(xì)節(jié)值得思考:
退出的成員呢?比如C退出群,發(fā)消息時(shí)maxid還是5,已讀+未讀總?cè)藬?shù)應(yīng)該是3(不包括發(fā)消息者本人),目前信息只有5個(gè) bit(0/1),識(shí)別不出來誰已經(jīng)退出群聊了退出群聊的成員如何處理?從GruopMetaInfo里面刪除么?退出群聊成員重新加入又如何分配id呢?
首先2這個(gè)點(diǎn),退出群聊的成員只能標(biāo)記刪除,不能物理刪除,不然客戶端展示已讀未讀詳情時(shí),通過mapid找不到對(duì)應(yīng)的userid,退出的成員又重新加入群聊這個(gè)就好辦了,把標(biāo)記刪除改成非標(biāo)記刪除,還是用舊的mapid
至于1呢?我目前想到比較好的方式就是再加多一個(gè)bitmap,記錄成員在消息發(fā)送時(shí)是否已經(jīng)退出群聊了,退出群聊就置為1, 所以最終方案就是
群信息增加userid,自增mapid雙向映射,退出群聊成員標(biāo)記刪除,messageid 已讀未讀詳情存儲(chǔ) {maxid, readbit[], quitbit[]}
新的方案帶來怎樣的收益呢?
增加自增mapid字段,一個(gè)群聊維護(hù)一份,成本幾乎可以忽略不計(jì) 每個(gè)成員已讀未讀由8B(64bit)優(yōu)化成2bit,減少62/64, 200人已讀未讀舊的方案1600B, 現(xiàn)在只需要 (200/8) * 2 + 4 = 54, 每條消息節(jié)約95%+
如果maxid如果到百萬甚至千萬級(jí)別,那豈不是災(zāi)難?一般實(shí)際場(chǎng)景,群聊是會(huì)限制人數(shù)的,就算不斷踢人加新人,那maxid最多也只能到企業(yè)人數(shù)。
如果maxid達(dá)到一個(gè)特別大數(shù)字,已讀未讀對(duì)應(yīng)的存儲(chǔ)可以增加多一個(gè)flag,如果bitmap存儲(chǔ)成本遠(yuǎn)超過最初的方案,可以用最初的方案來實(shí)現(xiàn),客戶端提前埋好兼容邏輯就可以了
往期推薦
END
若覺得文章對(duì)你有幫助,隨手轉(zhuǎn)發(fā)分享,也是我們繼續(xù)更新的動(dòng)力。
長(zhǎng)按二維碼,掃掃關(guān)注哦
?「C語言中文網(wǎng)」官方公眾號(hào),關(guān)注手機(jī)閱讀教程 ?

