TCP數(shù)據(jù)粘包的處理
1. 背鍋俠 TCP
在前面介紹套接字通信的時(shí)候說到了 TCP 是傳輸層協(xié)議,它是一個(gè)面向連接的、安全的、流式傳輸協(xié)議。因?yàn)閿?shù)據(jù)的傳輸是基于流的所以發(fā)送端和接收端每次處理的數(shù)據(jù)的量,處理數(shù)據(jù)的頻率可以不是對(duì)等的,可以按照自身需求來進(jìn)行決策。
TCP 協(xié)議是優(yōu)勢(shì)非常明顯,但是有時(shí)也會(huì)給我們?cè)斐衫_,正所謂:成也蕭何敗蕭何。假設(shè)我們有如下需求:
客戶端和服務(wù)器之間要進(jìn)行基于 TCP 的套接字通信
通信過程中客戶端會(huì)每次會(huì)不定期給服務(wù)器發(fā)送一個(gè)不定長(zhǎng)度的有特定含義的字符串。 通信的服務(wù)器端每次都需要接收到客戶端這個(gè)不定長(zhǎng)度的字符串,并對(duì)其進(jìn)行解析。
根據(jù)上面的描述,服務(wù)器在接收數(shù)據(jù)的時(shí)候有如下幾種情況:
一次接收到了客戶端發(fā)送過來的一個(gè)完整的數(shù)據(jù)包 一次接收到了客戶端發(fā)送過來的 N 個(gè)數(shù)據(jù)包,由于每個(gè)包的長(zhǎng)度不定,無法將各個(gè)數(shù)據(jù)包拆開 一次接收到了一個(gè)或者 N 個(gè)數(shù)據(jù)包 + 下一個(gè)數(shù)據(jù)包的一部分,還是很悲劇,無法將數(shù)據(jù)包拆開 一次收到了半個(gè)數(shù)據(jù)包,下一次接收數(shù)據(jù)的時(shí)候收到了剩下的一部分 + 下個(gè)數(shù)據(jù)包的一部分,更悲劇,頭大了 另外,還有一些不可抗拒的因素:比如客戶端和服務(wù)器端的網(wǎng)速不一樣,發(fā)送和接收的數(shù)據(jù)量也會(huì)不一致
對(duì)于以上描述的現(xiàn)象很多時(shí)候我們將其稱之為 TCP的粘包問題,但是這種叫法不太對(duì)的,本身 TCP 就是面向連接的流式傳輸協(xié)議,特性如此,我們卻說是 TCP 這個(gè)協(xié)議出了問題,這只能說是使用者的無知。多個(gè)數(shù)據(jù)包粘連到一起無法拆分是我們的需求過于復(fù)雜造成的,是程序猿的問題而不是協(xié)議的問題,TCP 協(xié)議表示這鍋它不想背。
現(xiàn)在問題來了,服務(wù)器端如果想保證每次都能接收到客戶端發(fā)送過來的這個(gè)不定長(zhǎng)度的數(shù)據(jù)包,程序猿應(yīng)該如何解決這個(gè)問題呢?下面給大家提供幾種解決方案:
使用標(biāo)準(zhǔn)的應(yīng)用層協(xié)議(比如:http、https)來封裝要傳輸?shù)牟欢ㄩL(zhǎng)的數(shù)據(jù)包 在每條數(shù)據(jù)的尾部添加特殊字符,如果遇到特殊字符,代表當(dāng)條數(shù)據(jù)接收完畢了
有缺陷:效率低,需要一個(gè)字節(jié)一個(gè)字節(jié)接收,接收一個(gè)字節(jié)判斷一次,判斷是不是那個(gè)特殊字符串
在發(fā)送數(shù)據(jù)塊之前,在數(shù)據(jù)塊最前邊添加一個(gè)固定大小的數(shù)據(jù)頭,這時(shí)候數(shù)據(jù)由兩部分組成:數(shù)據(jù)頭 + 數(shù)據(jù)塊
數(shù)據(jù)頭:存儲(chǔ)當(dāng)前數(shù)據(jù)包的總字節(jié)數(shù),接收端先接收數(shù)據(jù)頭,然后在根據(jù)數(shù)據(jù)頭接收對(duì)應(yīng)大小的字節(jié) 數(shù)據(jù)塊:當(dāng)前數(shù)據(jù)包的內(nèi)容
2. 解決方案
如果使用 TCP 進(jìn)行套接字通信,如果發(fā)送的數(shù)據(jù)包粘連到一起導(dǎo)致接收端無法解析,我們通常使用添加包頭的方式輕松地解決掉這個(gè)問題。關(guān)于數(shù)據(jù)包的包頭大小可以根據(jù)自己的實(shí)際需求進(jìn)行設(shè)定,這里沒有啥特殊需求,因此規(guī)定包頭的固定大小為4個(gè)字節(jié),用于存儲(chǔ)當(dāng)前數(shù)據(jù)塊的總字節(jié)數(shù)。
2.1 發(fā)送端
對(duì)于發(fā)送端來說,數(shù)據(jù)的發(fā)送分為 4 步:
根據(jù)待發(fā)送的數(shù)據(jù)長(zhǎng)度 N 動(dòng)態(tài)申請(qǐng)一塊固定大小的內(nèi)存:N+4(4 是包頭占用的字節(jié)數(shù)) 將待發(fā)送數(shù)據(jù)的總長(zhǎng)度寫入申請(qǐng)的內(nèi)存的前四個(gè)字節(jié)中,此處需要將其轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)序(大端) 將待發(fā)送的數(shù)據(jù)拷貝到包頭后邊的地址空間中,將完整的數(shù)據(jù)包發(fā)送出去(字符串沒有字節(jié)序問題) 釋放申請(qǐng)的堆內(nèi)存。
由于發(fā)送端每次都需要將這個(gè)數(shù)據(jù)包完整的發(fā)送出去,因此可以設(shè)計(jì)一個(gè)發(fā)送函數(shù),如果當(dāng)前數(shù)據(jù)包中的數(shù)據(jù)沒有發(fā)送完就讓它一直發(fā)送,處理代碼如下:
/*
函數(shù)描述:?發(fā)送指定的字節(jié)數(shù)
函數(shù)參數(shù):
????-?fd:?通信的文件描述符(套接字)
????-?msg:?待發(fā)送的原始數(shù)據(jù)
????-?size:?待發(fā)送的原始數(shù)據(jù)的總字節(jié)數(shù)
函數(shù)返回值:?函數(shù)調(diào)用成功返回發(fā)送的字節(jié)數(shù),?發(fā)送失敗返回-1
*/
int?writen(int?fd,?const?char*?msg,?int?size)
{
????const?char*?buf?=?msg;
????int?count?=?size;
????while?(count?>?0)
????{
????????int?len?=?send(fd,?buf,?count,?0);
????????if?(len?==?-1)
????????{
????????????close(fd);
????????????return?-1;
????????}
????????else?if?(len?==?0)
????????{
????????????continue;
????????}
????????buf?+=?len;
????????count?-=?len;
????}
????return?size;
}
有了這個(gè)功能函數(shù)之后就可以發(fā)送帶有包頭的數(shù)據(jù)塊了,具體處理動(dòng)作如下:
/*
函數(shù)描述:?發(fā)送帶有數(shù)據(jù)頭的數(shù)據(jù)包
函數(shù)參數(shù):
????-?cfd:?通信的文件描述符(套接字)
????-?msg:?待發(fā)送的原始數(shù)據(jù)
????-?len:?待發(fā)送的原始數(shù)據(jù)的總字節(jié)數(shù)
函數(shù)返回值:?函數(shù)調(diào)用成功返回發(fā)送的字節(jié)數(shù),?發(fā)送失敗返回-1
*/
int?sendMsg(int?cfd,?char*?msg,?int?len)
{
???if(msg?==?NULL?||?len?<=?0?||?cfd?<=0)
???{
???????return?-1;
???}
???//?申請(qǐng)內(nèi)存空間:?數(shù)據(jù)長(zhǎng)度?+?包頭4字節(jié)(存儲(chǔ)數(shù)據(jù)長(zhǎng)度)
???char*?data?=?(char*)malloc(len+4);
???int?bigLen?=?htonl(len);
???memcpy(data,?&bigLen,?4);
???memcpy(data+4,?msg,?len);
???//?發(fā)送數(shù)據(jù)
???int?ret?=?writen(cfd,?data,?len+4);
???//?釋放內(nèi)存
???free(data);
???return?ret;
}
關(guān)于數(shù)據(jù)的發(fā)送最后再次強(qiáng)調(diào):字符串沒有字節(jié)序問題,但是數(shù)據(jù)頭不是字符串是整形,因此需要從主機(jī)字節(jié)序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)序再發(fā)送。
2.2 接收端
了解了套接字的發(fā)送端如何發(fā)送數(shù)據(jù),接收端的處理步驟也就清晰了,具體過程如下:
首先接收 4 字節(jié)數(shù)據(jù),并將其從網(wǎng)絡(luò)字節(jié)序轉(zhuǎn)換為主機(jī)字節(jié)序,這樣就得到了即將要接收的數(shù)據(jù)的總長(zhǎng)度 根據(jù)得到的長(zhǎng)度申請(qǐng)固定大小的堆內(nèi)存,用于存儲(chǔ)待接收的數(shù)據(jù) 根據(jù)得到的數(shù)據(jù)塊長(zhǎng)度接收固定數(shù)目的數(shù)據(jù)保存到申請(qǐng)的堆內(nèi)存中 處理接收的數(shù)據(jù) 釋放存儲(chǔ)數(shù)據(jù)的堆內(nèi)存
從數(shù)據(jù)包頭解析出要接收的數(shù)據(jù)長(zhǎng)度之后,還需要將這個(gè)數(shù)據(jù)塊完整的接收到本地才能進(jìn)行后續(xù)的數(shù)據(jù)處理,因此需要編寫一個(gè)接收數(shù)據(jù)的功能函數(shù),保證能夠得到一個(gè)完整的數(shù)據(jù)包數(shù)據(jù),處理函數(shù)實(shí)現(xiàn)如下:
/*
函數(shù)描述:?接收指定的字節(jié)數(shù)
函數(shù)參數(shù):
????-?fd:?通信的文件描述符(套接字)
????-?buf:?存儲(chǔ)待接收數(shù)據(jù)的內(nèi)存的起始地址
????-?size:?指定要接收的字節(jié)數(shù)
函數(shù)返回值:?函數(shù)調(diào)用成功返回發(fā)送的字節(jié)數(shù),?發(fā)送失敗返回-1
*/
int?readn(int?fd,?char*?buf,?int?size)
{
????char*?pt?=?buf;
????int?count?=?size;
????while?(count?>?0)
????{
????????int?len?=?recv(fd,?pt,?count,?0);
????????if?(len?==?-1)
????????{
????????????return?-1;
????????}
????????else?if?(len?==?0)
????????{
????????????return?size?-?count;
????????}
????????pt?+=?len;
????????count?-=?len;
????}
????return?size;
}
這個(gè)函數(shù)搞定之后,就可以輕松地接收帶包頭的數(shù)據(jù)塊了,接收函數(shù)實(shí)現(xiàn)如下:
/*
函數(shù)描述:?接收帶數(shù)據(jù)頭的數(shù)據(jù)包
函數(shù)參數(shù):
????-?cfd:?通信的文件描述符(套接字)
????-?msg:?一級(jí)指針的地址,函數(shù)內(nèi)部會(huì)給這個(gè)指針分配內(nèi)存,用于存儲(chǔ)待接收的數(shù)據(jù),這塊內(nèi)存需要使用者釋放
函數(shù)返回值:?函數(shù)調(diào)用成功返回接收的字節(jié)數(shù),?發(fā)送失敗返回-1
*/
int?recvMsg(int?cfd,?char**?msg)
{
????//?接收數(shù)據(jù)
????//?1.?讀數(shù)據(jù)頭
????int?len?=?0;
????readn(cfd,?(char*)&len,?4);
????len?=?ntohl(len);
????printf("數(shù)據(jù)塊大小:?%d\n",?len);
????//?根據(jù)讀出的長(zhǎng)度分配內(nèi)存,+1?->?這個(gè)字節(jié)存儲(chǔ)\0
????char?*buf?=?(char*)malloc(len+1);
????int?ret?=?readn(cfd,?buf,?len);
????if(ret?!=?len)
????{
????????close(cfd);
????????free(buf);
????????return?-1;
????}
????buf[len]?=?'\0';
????*msg?=?buf;
????return?ret;
}
這樣,在進(jìn)行套接字通信的時(shí)候通過調(diào)用封裝的 sendMsg() 和 recvMsg() 就可以發(fā)送和接收帶數(shù)據(jù)頭的數(shù)據(jù)包了,而且完美地解決了粘包的問題。
文章鏈接:https://subingwen.cn/linux/tcp-data-package/#2-2-%E6%8E%A5%E6%94%B6%E7%AB%AF
