啥?進(jìn)程通信的共享內(nèi)存都不知道!
--------------當(dāng)日上午,大白正在找借口請假面試-----------
一個陽光明媚的中午,大白在領(lǐng)導(dǎo)辦公室
????? 大白:領(lǐng)導(dǎo)我這牙疼還是沒好,下午還得去找那個醫(yī)生開點藥,不行不行,太疼了....我現(xiàn)在就得去了。
????? 領(lǐng)導(dǎo):......
--------------------當(dāng)日下午,騰訊大樓--------------------
????? 面試官:大白,上一輪的面試官反映你水平不錯,我看你和上一輪的面試官聊了 進(jìn)程通信中的管道 ,那么我們今天要不接著上個話題聊一聊吧。你還用過其它方式進(jìn)行進(jìn)程通信嗎?
????? 大白:除了上次講的管道的方式外,我還經(jīng)常用 共享內(nèi)存 的方式進(jìn)行進(jìn)程通信。
????? 面試官:那我們今天就好好聊聊共享內(nèi)存這種進(jìn)程通信方式吧。
----------------------面試正式開始------------------------

????? 面試官:要不你先簡單說說什么是 共享內(nèi)存 吧!
????? 大白:我們知道各進(jìn)程之間是獨立存在,互不影響的。有沒有一種方式讓這些進(jìn)程之間產(chǎn)生聯(lián)系呢?當(dāng)然有!那就是共享內(nèi)存。共享內(nèi)存是進(jìn)程間通信中最簡單的方式之一。站在進(jìn)程的角度來說,共享內(nèi)存就是可以同時被多個進(jìn)程訪問的內(nèi)存。由于所有進(jìn)程共享同一塊內(nèi)存,因此這種通信方式效率非常高。
????? 面試官:要不你再給我講講,為什么進(jìn)程間的內(nèi)存不是共享的吧?
????? 大白:(內(nèi)心:啥?準(zhǔn)備了好幾天的進(jìn)程通信,你問出來個這?)我想想啊......其實這個問題也還比較容易想明白了。舉一個例子,假設(shè)有 2 個進(jìn)程同時想讓某一物理地址保存一個值,A 進(jìn)程想讓這個物理地址保存 1,B 進(jìn)程想讓這個物理地址保存 2。那么這個物理地址到底應(yīng)該保存哪個值?所以,為了將每個進(jìn)程隔離開,設(shè)計者就想到一個辦法,操作系統(tǒng)會給每個進(jìn)程分配一個虛擬地址。然后將不同進(jìn)程的虛擬地址和不同內(nèi)存的物理地址進(jìn)行映射。每次進(jìn)程想要寫入數(shù)據(jù),先訪問虛擬地址,然后內(nèi)存再將這個地址轉(zhuǎn)換成物理地址,這樣不同進(jìn)程運行的時候,寫入的是不同物理地址,就不會有沖突了。這就是進(jìn)程獨享內(nèi)存空間的原理。我下面給您畫個圖。實際中虛擬內(nèi)存和物理內(nèi)存都會被分成大小相等的頁,然后進(jìn)行映射。但是由于我們這次面試的重點不在此,圖就簡略一點,表明關(guān)系就好。

????? 面試官:你剛才提到了 虛擬地址 ?為什么要引入虛擬地址呢?運行過程中還得進(jìn)行虛擬地址和物理地址進(jìn)行轉(zhuǎn)換。我看看物理內(nèi)存有多大,直接把一段物理空間交給一個進(jìn)程不好嗎?然后這段空間不允許別的進(jìn)程進(jìn)行操作。這樣不更省事?
????? 大白:(內(nèi)心:這個面試官怕不是個哈皮吧...)嗯...是這樣的,原因主要有 3 個方面:
- 操作系統(tǒng)是不希望一個普通的進(jìn)程可以直接對物理地址寫數(shù)據(jù)的。如果一個普通的進(jìn)程可以隨意的向物理地址中寫數(shù)據(jù)。那么一個惡意進(jìn)程一旦知道別的進(jìn)程的物理地址,那不是很容易就把別的進(jìn)程的數(shù)據(jù)篡改了嘛。
- 每個進(jìn)程在創(chuàng)建之初,它所需要的內(nèi)存大小都是不確定的。如果按照您的說法直接給進(jìn)程分配固定的物理內(nèi)存,假如兩個進(jìn)程在創(chuàng)建之初都直接各自分配了 1G 的物理空間。但實際運行起來,A 進(jìn)程只用了 100M,而 B 進(jìn)程需要 1.9 G。那么給 A 進(jìn)程分配的空間就浪費了,而給 B 進(jìn)程分配的空間又不夠。都采用虛擬地址,表面看上去每個進(jìn)程都可以獨占內(nèi)存的所有空間。在進(jìn)程運行的途中再對虛擬地址和物理地址進(jìn)行轉(zhuǎn)換,可以有效的利用空間。甚至在內(nèi)存不足的情況下,還可以把進(jìn)程的內(nèi)存存到硬盤里,切換到該進(jìn)程時再從硬盤讀取。
- 虛擬內(nèi)存可以為每個進(jìn)程提供一個一致的地址空間,這樣程序員就不需要管理內(nèi)存了,這也降低了編程的復(fù)雜度。
????? 面試官:可以可以,沒難住你。那你現(xiàn)在講講進(jìn)程通信為什么又要共享內(nèi)存了吧?
????? 大白:因為有時候兩個進(jìn)程需要進(jìn)行大量的通信,并且傳遞的都是比較大的數(shù)據(jù)。那么采用管道或者消息隊列的方式就不方便了。這不如兩個進(jìn)程都拿出一塊虛擬地址,映射到相同的物理內(nèi)存中。這樣進(jìn)程間需要傳送的數(shù)據(jù)就不需要來回拷貝了,這邊一寫那邊立馬看到了。共享內(nèi)存理論上是最快的進(jìn)程通信方式,不過有個弊端就是不能跨物理機(jī)進(jìn)程通信,如果需要跨物理機(jī)進(jìn)行進(jìn)程通信,建議用套接字。

????? 面試官:共享內(nèi)存讓進(jìn)程間的通信更加簡單,效率也不錯。但是,這種方式也存在一個比較明顯的缺點—沒有提供同步的機(jī)制。你簡單說說該如何解決吧?
????? 大白:嗯嗯,確實!我們需要通過一些手段保證在數(shù)據(jù)被寫入之前不允許其他進(jìn)程從共享內(nèi)存中讀取。比較常見的解決辦是通過 信號量 來進(jìn)行同步。
????? 面試官:我之前就聽說你八股文背的賊溜,現(xiàn)在看來果然名不虛傳。我想看看你代碼能力,你給我用代碼實現(xiàn)一下共享內(nèi)存可以不?
????? 大白:沒問題呀!首先我給您講下思路吧!分四步就可以完成啦;
(1)既然需要用共享內(nèi)存,首先需要創(chuàng)建一個共享內(nèi)存或者得到一個共享內(nèi)存。這一步要用到一個函數(shù)就是 shmget。
int?shmget(key_t?key,size_t?size,?int?flag);
//key:用來定位共享內(nèi)存
//size:用來指定共享內(nèi)存的大小
//flag:用來表示創(chuàng)建共享內(nèi)存的方式,如果賦值是?IPC_CREAT?表示創(chuàng)建一個新的
//返回值:共享內(nèi)存標(biāo)識符
(2)通過第一步創(chuàng)建好了共享內(nèi)存,但是如果一個進(jìn)程想要訪問這段共享內(nèi)存,那么就需要將共享內(nèi)存加載到自己的虛擬地址空間中。而加載的這個過程就需要用到下面這個函數(shù)。
void?*shmat(int?shmid,?const?void?*shmaddr,?int?shmflag);
//shmid:傳入共享內(nèi)存標(biāo)識符
//shmaddr:指定共享內(nèi)存映射的地址
//shmflag:標(biāo)識內(nèi)存關(guān)聯(lián)后的讀寫權(quán)限
//返回值:返回共享內(nèi)存映射到進(jìn)程空間的起始地址。
(3)經(jīng)過前兩步,所有與共享內(nèi)存進(jìn)行關(guān)聯(lián)的進(jìn)程,就可以進(jìn)行通信了。這一步不需要什么特殊的函數(shù),直接往共享內(nèi)存中寫入,或者從中讀取就可以啦。
(4)如果內(nèi)存共享使用完畢,那么就需要解除綁點,然后再刪除共享內(nèi)存對象。這需要用到下面兩個函數(shù)。
int?shmdt(void?*addr);
//addr:共享內(nèi)存的起始地址
void?*shmctl(int?shm_id,?int?cmd,?struct?shmid_ds?*buf);
//shm_id:共享內(nèi)存標(biāo)識符
//cmd:對共享內(nèi)存的操作,如果用IPC_RMID表示要將共享內(nèi)存刪去。
//buf:共享內(nèi)存管理結(jié)構(gòu)體。
????? 面試官:好的,你的思路我明白啦,可以開始寫代碼啦。那個我怕你頭文件的引用記不清,我直接給你寫在下邊吧。你一會直接引用就好啦。
//shared_memory.h
#include?
#include?
#include?
#include????//剛才介紹的幾個函數(shù)都在這個庫中
#include?
#define?PATHNAME?"/home/dabai/server.c"?//路徑名,用它來獲取共享內(nèi)存標(biāo)識符的key
#define?PROJ_ID?0x6666?//整數(shù)標(biāo)識符
#define?SIZE?4096?//共享內(nèi)存的大小
????? 大白:感謝感謝,那我就直接寫代碼啦。
//server.c
#include?"shared_memory.h"
int?main()
{
?key_t?key?=?ftok(PATHNAME,?PROJ_ID);?//建立共享內(nèi)存需要一個區(qū)域標(biāo)識符來標(biāo)識共享內(nèi)存區(qū)域,ftok把已經(jīng)存在的路徑名和整數(shù)標(biāo)識符轉(zhuǎn)換成一個整數(shù) IPC 鍵值。
?//如果key創(chuàng)建失敗則返回值小于0,應(yīng)該有個打印錯誤并結(jié)束程序的操作,為了代碼簡潔我就不寫啦。
?int?shm?=?shmget(key,?SIZE,?IPC_CREAT?|?IPC_EXCL?|?0666);?//創(chuàng)建新的共享內(nèi)存,返回共享內(nèi)存標(biāo)識符
?//如果共享內(nèi)存創(chuàng)建失敗則返回值小于0,應(yīng)該有個打印錯誤并結(jié)束程序的操作,為了代碼簡潔我就不寫啦。
?printf("key:?%x\n",?key);
?printf("shm:?%d\n",?shm);
?char*?mem?=?shmat(shm,?NULL,?0);?//關(guān)聯(lián)共享內(nèi)存
????//這里還是應(yīng)該檢查下是否關(guān)聯(lián)成功為了代碼簡潔我就省略了
????int?i?=?0;
?while?(1){
??mem[i]?=?'a';????//進(jìn)程可以根據(jù)自己的需要在這里對共享內(nèi)存進(jìn)行寫入或讀出。
?????i++;
?}
?shmdt(mem);?//共享內(nèi)存去關(guān)聯(lián)
?shmctl(shm,?IPC_RMID,?NULL);?//釋放共享內(nèi)存
?return?0;
}
//這部分代碼參考了 https://blog.csdn.net/chenlong_cxy/article/details/121184624,這篇博客的代碼寫的比較完善,大家如果感興趣可以去學(xué)習(xí)下。
????? 面試官:我記得你剛才跟我說更推薦用套接字?
????? 大白:我沒說...是個幻覺。
????? 面試官:對了,信號量也沒細(xì)問。今天先放過你吧,我也該下班了,我給你通過面試了。不知道 leader 會給你加面不。套接字的問題等你入職后咱們聊一聊。
????? 大白:好嘞,感謝感謝。
參考資料:
- 極客時間《趣談 Linux 操作系統(tǒng)》
- https://blog.csdn.net/chenlong_cxy/article/details/121184624
- https://juejin.cn/post/6844903507594575886
- https://snailclimb.gitee.io/javaguide/#/?id=%E6%93%8D%E4%BD%9C%E7%B3%BB%E7%BB%9F
推薦閱讀:
