為什么數(shù)據(jù)庫連接池不采用IO多路復(fù)用?

在網(wǎng)絡(luò)服務(wù)中,IO多路復(fù)用起的作用是「一次性把多個(gè)連接的事件通知業(yè)務(wù)代碼處理」。至于這些事件的處理方式,到底是業(yè)務(wù)代碼循環(huán)著處理、丟到隊(duì)列里,還是交給線程池處理,由業(yè)務(wù)代碼決定。
對于使用DB的程序來講,不管使用多路復(fù)用,還是連接池,都要維護(hù)一組網(wǎng)絡(luò)連接,支持并發(fā)的查詢。
答案是,可以用IO多路復(fù)用——但是「使用JDBC不行」。
JDBC是一個(gè)出現(xiàn)了近20年的標(biāo)準(zhǔn),它的設(shè)計(jì)核心是BIO(因?yàn)?99X年時(shí)還沒有別的IO可以用):調(diào)用者在通過JDBC時(shí)執(zhí)行比如query這樣的API,在沒有執(zhí)行完成之前,整個(gè)調(diào)用線程被卡住。而類似于Mysql Connector/J這樣的driver完備的實(shí)現(xiàn)了這套語義。
當(dāng)然如果DB Client的協(xié)議的連接處理和解析稍微改一下:
將IO模式調(diào)整為Non-Blocking,這樣就可以掛到IO多路復(fù)用的內(nèi)核上(select、epoll、kqueue……)
在Non-Blocking實(shí)現(xiàn)的基礎(chǔ)之上實(shí)現(xiàn)數(shù)據(jù)庫協(xié)議的編碼和解析
就可以實(shí)現(xiàn)用IO多路復(fù)用來訪問DB。
實(shí)際上很多其他語言/框架里都是這么干的。比如
Nodejs
see?https://github.com/sidorares/node-mysql2;
Vert.X 的 db 客戶端
對于數(shù)據(jù)庫開發(fā)者來說。這種用法在整體的用戶里占有量非常小,所以也許不值當(dāng)?shù)幕ù罅狻V恍枰褏f(xié)議寫清楚就可以做實(shí)現(xiàn)。
(比如https://dev.mysql.com/doc/internals/en/client-server-protocol.html)那么社區(qū)的有興趣的人自然就可以去做。
另外一個(gè)原因是體系的支持。簡單來講,如果沒有一個(gè)大的 Reactive 的運(yùn)行環(huán)境,IO 多路復(fù)用的使用會(huì)非常受限。
IO 多路復(fù)用之所以能成立,是需要「整個(gè)程序要有一個(gè)IO多路復(fù)用的驅(qū)動(dòng)代碼」——就是 select 那句調(diào)用——等待事件來臨,一個(gè) blocking 的 API。整個(gè)程序必須以這個(gè)驅(qū)動(dòng)代碼為核心。這樣就對整個(gè)代碼的結(jié)構(gòu)產(chǎn)生重大的影響。這種影響是沒法用簡單的接口抽象的。
Java Web 容器之所以可以使用 NIO 是因?yàn)?NIO 可以被封裝到容器內(nèi)部。Web 容器對外暴露的還是傳統(tǒng)的多線程形式的Java EE接口。
如果 DB 和 Web 容器同時(shí)使用 NIO,那么調(diào)用的DB連接庫與必須與容器有一個(gè)約定描述「DB的連接管理如何接入Web容器的NIO的驅(qū)動(dòng)代碼」。在 Java 這個(gè)大環(huán)境下,不同人,不同的容器寫的代碼不同;又或者,不使用任何常見的容器,而是自己用 NIO 去封裝一個(gè)。這樣是無法形成代碼上的約定的。那么多個(gè)獨(dú)立的組件就不能很好的共享 NIO 的驅(qū)動(dòng)代碼。
上面這個(gè)用法假設(shè)整個(gè)程序應(yīng)該共享一個(gè) NIO 驅(qū)動(dòng)代碼。
那么 Web 和 DB 可不可以各用各的呢?
也是可以的,但是為了保證這兩個(gè) NIO 驅(qū)動(dòng)代碼不會(huì)相互 block,最好要分開兩個(gè)線程。這樣一來就會(huì)打破一般 Web 服務(wù)一個(gè)請求處理用一個(gè)線程的一般做法,會(huì)讓程序邊的更復(fù)雜——你的業(yè)務(wù)代碼和DB查詢之間必須做跨線程數(shù)據(jù)交換。
相反,連接池的實(shí)現(xiàn)就相對獨(dú)立的多,也簡單的多。外界只要配好 DB URL,用戶名密碼和連接池的容量參數(shù),就可以做到自行管理連接。
DB 訪問一般采用連接池這種現(xiàn)象是生態(tài)造成的。歷史上的 BIO + 連接池的做法經(jīng)過多年的發(fā)展,已經(jīng)解決了主要的問題。在 Java 的大環(huán)境下,這個(gè)方案是非常靠譜的,成熟的。而基于 IO 多路復(fù)用的方式盡管在性能上可能有優(yōu)勢,但是其對整個(gè)程序的代碼結(jié)構(gòu)要求過多,過于復(fù)雜。當(dāng)然,如果有特定的需要,希望使用 IO 多路復(fù)用管理 DB 連接,是完全可行的。
