只要涉及到分布式服務，就繞不開RPC調用。RPC是什么，我認為大部分同學都能說出個一二三。

那么RPC一次調用，到底經歷了哪些過程？

一直在說RPC耗時優(yōu)化，那到底時間耗在了哪里？

本篇帶大家一起來梳理清晰。再遇到面試官問RPC，直接滅丫

Part1前言扯一扯RPC的蛋

RPC ？（Remote Procedure Call）遠程過程調用，目的是讓調用遠程服務的體驗，就像調用本地方法一樣簡單。

已經有了HTTP，為啥還要實現個RPC？ 首先，兩者不在一個水平面，不好比較。http是一種傳輸協(xié)議，RPC由TCP傳輸協(xié)議和其他部分組成，算是一種架構；再者，效率和性能有所差異，Http相比tcp傳輸更耗性能；再再者，定位不同，Rpc一般用于實現內部網絡各服務間的高性能調用，Http一般用于跨環(huán)境的數據傳輸和接口調用。

RPC亙古不變的三個主題？ 客戶端、服務端、注冊中心。后續(xù)包括服務注冊、服務發(fā)現、路由尋址、序列化、IO模型等等事項，都是在圍繞三者之間的合作和交互來進行的。

常見RPC有哪些？

出鏡最多的要數dubbo，因為總被面試官問到；

性能優(yōu)良的grpc，google出品，可以在任何環(huán)境下運行；

美團的OCTO和pigeon，一個章魚水里游，一個鴿子天上飛；

京東之前的saf，是對dubbo的定制化開發(fā)，后面升級到了自研的jsf框架，其作者之一的章老板之前就已經是螞蟻的P8大佬了；

螞蟻自研的sofaRPC也有章老板的參與，由于設計初衷和螞蟻內部的使用規(guī)模，功能豐富度和服務穩(wěn)定性上，那是相當不錯，目前也已經開源。

Part2一次RPC調用的心路歷程

如上圖所示，一次rpc調用的過程，基本都囊括在內：

Stub 存根

處于真正調用之前。進行場景判斷、條件過濾等，以dubbo為例，可以用于壓測場景的數據mock等功能支持。

路由尋址和負載均衡

上面的圖其實有點不太準確，路由尋址和服務節(jié)點的負載均衡應該是一起完成的，在選定provider之后就是直連了。圖里只是為了對稱一些好看。

尋址： 以safa為例，支持直連和注冊中心尋址。實現方案是在地址維護器中按配置加載直連分組和集群分組，在客戶端指定路由策略時，進行分別獲取。

負載均衡： safa在負載算法上要支持的相對更全面一些：一致性hash、本機優(yōu)先、隨機負載、輪詢負載、加權一致性hash、加權輪詢。

序列化和反序列化

序列化方式有很多種，包括jdk原生，kryo、hessian、protoStuff,thrift，JSON等。

這里挑兩個經常使用，但是經常遇坑的來說下：

hessian： 相比于Java原生序列化，效率更高、數據更小，但是需要注意，hessian反序列化時，是將屬性都取出來放到map里，因此，如果父類和子類有name相同的屬性，子類的會被覆蓋，因此，使用hessian時，要注意父子類不能有相同的屬性名。

protoStuff： 相比Protobuf，stuff不需要寫.proto文件，效率上甚至比Protobuf更快。而快的原因之一，就是因為其序列化方式是按對象屬性的順序來執(zhí)行的，所以，如果順序變了，就會反序列化失敗。因此，在對使用了protoStuff序列化方式的對象新增字段時，最好是加到最后。

編碼解碼

序列化之后為啥還要進行編碼呢？

序列化其實是為了將待傳輸的對象轉化成標準二進制信息，為傳遞做準備，同時盡可能壓縮大小，方便傳輸。

而編碼，是為了通信高效，一般的，都會加上超時策略、請求ID、網絡協(xié)議等信息。

網絡傳輸

一般大部分的RPC都選netty作為通信框架，而在底層是TCP的傳輸協(xié)議，而在上層，還有一層通信協(xié)議：

Bolt，RPC私有協(xié)議，sofa所屬
Dubbo，RPC私有化協(xié)議
Hessian，RPC公有化協(xié)議
thrift，Facebook出品，
還有如RESTful等其他通信協(xié)議

通信協(xié)議的目的，是為了讓中間件開發(fā)者能將更多的精力放在產品功能特性實現上，而不是重復地一遍遍制造通信框架的輪子。

Part3RPC執(zhí)行耗時都耗在了哪里

從上圖分析中可以看出一次rpc調用的具體耗時節(jié)點。

對于客戶端來說，耗時主要由：建連時間 + 序列化時間 + 等待服務端處理時間 組成；

對于服務端來說，耗時主要由：線程池等待時間 + 服務處理時間 + 結果序列化時間 組成。

所以，對于我們一線開發(fā)，如果要對RPC耗時進行調優(yōu)，最需要關注的，有客戶端的路由尋址、序列化方式，有服務端的服務線程池等待、反序列化、服務端處理速率、結果序列化這幾塊。

‘建連’，一般因為我們采用長連接心跳檢測，是可以保證這個時間相對穩(wěn)定。

比如，借鑒sofa，用增量更新的直接分組，來加速路由尋址；采用速度更快的序列化策略；調整服務端線程池到合適的大小，即能滿足請求處理，又不至于增加過多的線程切換損耗；用異步調用的方式替代同步阻塞等等。

Part4總結

本文從RPC的一次調用觸發(fā)，結合一些開源的框架代碼，給大家梳理了RPC的調用過程和耗時分析。讓大家對RPC調用有一個更直觀的體會。特別是耗時分析這一部分，對我們一線研發(fā)的開發(fā)有些直接的指導意義。

希望大家能有所得，有任何問題，歡迎留言指正、探討~

詳解RPC的一次調用過程

Part1前言 扯一扯RPC的蛋