詳解 | 大型分布式電商系統架構

- 前言 -

- 大型分布式網站架構技術 -
1、大型網站的特點
用戶多,分布廣泛。 大流量,高并發(fā)。 海量數據,服務高可用。 安全環(huán)境惡劣,易受網絡攻擊。 功能多,變更快,頻繁發(fā)布。 從小到大,漸進發(fā)展。 以用戶為中心。 免費服務,付費體驗。
2、大型網站架構目標
高性能:提供快速的訪問體驗。 高可用:網站服務一直可以正常訪問。 可伸縮:通過硬件增加/減少,提高/降低處理能力。 安全性:提供網站安全訪問和數據加密、安全存儲等策略。 擴展性:方便地通過新增/移除方式,增加/減少新的功能/模塊。 敏捷性:隨需應變,快速響應。

3、大型網站架構模式

分層:一般可分為應用層、服務層、數據層、管理層與分析層。 分割:一般按照業(yè)務/模塊/功能特點進行劃分,比如應用層分為首頁、用戶中心。 分布式:將應用分開部署(比如多臺物理機),通過遠程調用協同工作。 集群:一個應用/模塊/功能部署多份(如:多臺物理機),通過負載均衡共同提供對外訪問。 緩存:將數據放在距離應用或用戶最近的位置,加快訪問速度。 異步:將同步的操作異步化。客戶端發(fā)出請求,不等待服務端響應,等服務端處理完畢后,使用通知或輪詢的方式告知請求方。一般指:請求——響應——通知模式。 冗余:增加副本,提高可用性、安全性與性能。 安全:對已知問題有有效的解決方案,對未知/潛在問題建立發(fā)現和防御機制。 自動化:將重復的、不需要人工參與的事情,通過工具的方式,使用機器完成。 敏捷性:積極接受需求變更,快速響應業(yè)務發(fā)展需求。
4、高性能架構
前端優(yōu)化:網站業(yè)務邏輯之前的部分; 瀏覽器優(yōu)化:減少HTTP請求數,使用瀏覽器緩存,啟用壓縮,CSS JS位置,JS異步,減少Cookie傳輸;CDN加速,反向代理; 應用層優(yōu)化:處理網站業(yè)務的服務器。使用緩存,異步,集群 代碼優(yōu)化:合理的架構,多線程,資源復用(對象池,線程池等),良好的數據結構,JVM調優(yōu),單例,Cache等; 存儲優(yōu)化:緩存、固態(tài)硬盤、光纖傳輸、優(yōu)化讀寫、磁盤冗余、分布式存儲(HDFS)、NoSQL等。
5、高可用架構
應用層:一般設計為無狀態(tài)的,對于每次請求,使用哪一臺服務器處理是沒有影響的。一般使用負載均衡技術(需要解決Session同步問題)實現高可用。 服務層:負載均衡,分級管理,快速失敗(超時設置),異步調用,服務降級,冪等設計等。 數據層:冗余備份(冷,熱備[同步,異步],溫備),失效轉移(確認,轉移,恢復)。數據高可用方面著名的理論基礎是CAP理論(持久性,可用性,數據一致性[強一致,用戶一致,最終一致])
6、可伸縮架構
應用層:對應用進行垂直或水平切分。然后針對單一功能進行負載均衡(DNS、HTTP[反向代理]、IP、鏈路層)。 服務層:與應用層類似; 數據層:分庫、分表、NoSQL等;常用算法Hash,一致性Hash。
7、可擴展架構
模塊化,組件化:高內聚,低耦合,提高復用性,擴展性。 穩(wěn)定接口:定義穩(wěn)定的接口,在接口不變的情況下,內部結構可以“隨意”變化。 設計模式:應用面向對象思想,原則,使用設計模式,進行代碼層面的設計。 消息隊列:模塊化的系統,通過消息隊列進行交互,使模塊之間的依賴解耦。 分布式服務:公用模塊服務化,提供其他系統使用,提高可重用性,擴展性。
8、安全架構
基礎設施安全:硬件采購,操作系統,網絡環(huán)境方面的安全。一般采用正規(guī)渠道購買高質量的產品,選擇安全的操作系統,及時修補漏洞,安裝殺毒軟件防火墻。防范病毒,后門。設置防火墻策略,建立DDOS防御系統,使用攻擊檢測系統,進行子網隔離等手段。 應用系統安全:在程序開發(fā)時,對已知常用問題,使用正確的方式,在代碼層面解決掉。防止跨站腳本攻擊(XSS),注入攻擊,跨站請求偽造(CSRF),錯誤信息,HTML注釋,文件上傳,路徑遍歷等。還可以使用Web應用防火墻(比如:ModSecurity),進行安全漏洞掃描等措施,加強應用級別的安全。 數據保密安全:存儲安全(存儲在可靠的設備,實時,定時備份),保存安全(重要的信息加密保存,選擇合適的人員復雜保存和檢測等),傳輸安全(防止數據竊取和數據篡改)。
9、敏捷性
10、大型架構舉例

客戶層:支持PC瀏覽器和手機APP。差別是手機APP可以直接通過IP訪問,反向代理服務器。 前端層:使用DNS負載均衡,CDN本地加速以及反向代理服務。 應用層:網站應用集群;按照業(yè)務進行垂直拆分,比如商品應用,會員中心等。 服務層:提供公用服務,比如用戶服務,訂單服務,支付服務等。 數據層:支持關系型數據庫集群(支持讀寫分離),NOSQL集群,分布式文件系統集群;以及分布式Cache。 大數據存儲層:支持應用層和服務層的日志數據收集,關系數據庫和NOSQL數據庫的結構化和半結構化數據收集。 大數據處理層:通過Mapreduce進行離線數據分析或Storm實時數據分析,并將處理后的數據存入關系型數據庫。(實際使用中,離線數據和實時數據會按照業(yè)務要求進行分類處理,并存入不同的數據庫中,供應用層或服務層使用)。

- 大型電商網站系統架構演變過程 -
1、最開始的網站架構

2、應用、數據、文件分離

3、利用緩存改善網站性能

4、使用集群改善應用服務器性能

5、數據庫讀寫分離和分庫分表

6、使用CDN和反向代理提高網站性能

7、使用分布式文件系統

8、使用NoSQL和搜索引擎

9、將應用服務器進行業(yè)務拆分

10、搭建分布式服務


- 一張圖說明電商架構 -


- 大型電商網站架構案例 -
分布式大型網站,目前看主要有幾類:
大型門戶,比如網易,新浪等; SNS網站,比如校內,開心網等; 電商網站,比如阿里巴巴,京東商城,國美在線,汽車之家等。
客戶需求:
建立一個全品類的電子商務網站(B2C),用戶可以在線購買商品,可以在線支付,也可以貨到付款; 用戶購買時可以在線與客服溝通; 用戶收到商品后,可以給商品打分,評價; 目前有成熟的進銷存系統;需要與網站對接; 希望能夠支持3~5年,業(yè)務的發(fā)展; 預計3~5年用戶數達到1000萬; 定期舉辦雙11、雙12、三八男人節(jié)等活動; 其他的功能參考京東或國美在線等網站。
需求功能矩陣
需求管理傳統的做法,會使用用例圖或模塊圖(需求列表)進行需求的描述。這樣做常常忽視掉一個很重要的需求(非功能需求),因此推薦大家使用需求功能矩陣,進行需求描述。
本電商網站的需求矩陣如下:

一般網站,剛開始的做法,是三臺服務器,一臺部署應用,一臺部署數據庫,一臺部署NFS文件系統。
這是前幾年比較傳統的做法,之前見到一個網站10萬多會員,垂直服裝設計門戶,N多圖片。使用了一臺服務器部署了應用,數據庫以及圖片存儲。出現了很多性能問題。
如下圖:
使用集群對應用服務器進行冗余,實現高可用;(負載均衡設備可與應用一塊部署) 使用數據庫主備模式,實現數據備份和高可用;
預估步驟:
注冊用戶數-日均UV量-每日的PV量-每天的并發(fā)量; 峰值預估:平常量的2~3倍; 根據并發(fā)量(并發(fā),事務數),存儲容量計算系統容量。
每天的UV為200萬(二八原則); 每日每天點擊瀏覽30次; PV量:200*30=6000萬; 集中訪問量:24*0.2=4.8小時會有6000萬*0.8=4800萬(二八原則); 每分并發(fā)量:4.8*60=288分鐘,每分鐘訪問4800/288=16.7萬(約等于); 每秒并發(fā)量:16.7萬/60=2780(約等于); 假設:高峰期為平常值的三倍,則每秒的并發(fā)數可以達到8340次。 1毫秒=1.3次訪問;
服務器預估:(以tomcat服務器舉例)
按一臺web服務器,支持每秒300個并發(fā)計算。平常需要10臺服務器(約等于);[tomcat默認配置是150],高峰期需要30臺服務器;
容量預估:70/90原則
系統CPU一般維持在70%左右的水平,高峰期達到90%的水平,是不浪費資源,并比較穩(wěn)定的。內存,IO類似。
以上預估僅供參考,因為服務器配置,業(yè)務邏輯復雜度等都有影響。在此CPU,硬盤,網絡等不再進行評估。
5、網站架構分析
根據以上預估,有幾個問題:
需要部署大量的服務器,高峰期計算,可能要部署30臺Web服務器。并且這三十臺服務器,只有秒殺,活動時才會用到,存在大量的浪費。 所有的應用部署在同一臺服務器,應用之間耦合嚴重。需要進行垂直切分和水平切分。 大量應用存在冗余代碼。 服務器Session同步耗費大量內存和網絡帶寬。 數據需要頻繁訪問數據庫,數據庫訪問壓力巨大。
業(yè)務拆分 應用集群部署(分布式部署,集群部署和負載均衡) 多級緩存 單點登錄(分布式Session) 數據庫集群(讀寫分離,分庫分表) 服務化 消息隊列 其他技術

- 網站架構優(yōu)化 -
根據業(yè)務屬性進行垂直切分,劃分為產品子系統,購物子系統,支付子系統,評論子系統,客服子系統,接口子系統(對接如進銷存,短信等外部系統)。
根據業(yè)務子系統進行等級定義,可分為核心系統和非核心系統。核心系統:產品子系統,購物子系統,支付子系統;非核心:評論子系統,客服子系統,接口子系統。
業(yè)務拆分作用:提升為子系統可由專門的團隊和部門負責,專業(yè)的人做專業(yè)的事,解決模塊之間耦合以及擴展性問題;每個子系統單獨部署,避免集中部署導致一個應用掛了,全部應用不可用的問題。 等級定義作用:用于流量突發(fā)時,對關鍵應用進行保護,實現優(yōu)雅降級;保護關鍵應用不受到影響。
分布式部署:將業(yè)務拆分后的應用單獨部署,應用直接通過RPC進行遠程通信; 集群部署:電商網站的高可用要求,每個應用至少部署兩臺服務器進行集群部署; 負載均衡:是高可用系統必須的,一般應用通過負載均衡實現高可用,分布式服務通過內置的負載均衡實現高可用,關系型數據庫通過主備方式實現高可用。
緩存按照存放的位置一般可分為兩類本地緩存和分布式緩存。本案例采用二級緩存的方式,進行緩存的設計。一級緩存為本地緩存,二級緩存為分布式緩存。(還有頁面緩存,片段緩存等,那是更細粒度的劃分)
一級緩存,緩存數據字典,和常用熱點數據等基本不可變/有規(guī)則變化的信息,二級緩存緩存需要的所有緩存。當一級緩存過期或不可用時,訪問二級緩存的數據。如果二級緩存也沒有,則訪問數據庫。
緩存的比例,一般1:4,即可考慮使用緩存。(理論上是1:2即可)。
緩存自動過期; 緩存觸發(fā)過期。
系統分割為多個子系統,獨立部署后,不可避免的會遇到會話管理的問題。一般可采用Session同步,Cookies,分布式Session方式。電商網站一般采用分布式Session實現。
再進一步可以根據分布式Session,建立完善的單點登錄或賬戶管理系統。
用戶第一次登錄時,將會話信息(用戶Id和用戶信息),比如以用戶Id為Key,寫入分布式Session; 用戶再次登錄時,獲取分布式Session,是否有會話信息,如果沒有則調到登錄頁; 一般采用Cache中間件實現,建議使用Redis,因此它有持久化功能,方便分布式Session宕機后,可以從持久化存儲中加載會話信息; 存入會話時,可以設置會話保持的時間,比如15分鐘,超過后自動超時。
5、數據庫集群(讀寫分離,分庫分表)
大型網站需要存儲海量的數據,為達到海量數據存儲,高可用,高性能一般采用冗余的方式進行系統設計。一般有兩種方式讀寫分離和分庫分表。
讀寫分離:一般解決讀比例遠大于寫比例的場景,可采用一主一備,一主多備或多主多備方式。
本案例在業(yè)務拆分的基礎上,結合分庫分表和讀寫分離。如下圖:

業(yè)務拆分后:每個子系統需要單獨的庫; 如果單獨的庫太大,可以根據業(yè)務特性,進行再次分庫,比如商品分類庫,產品庫; 分庫后,如果表中有數據量很大的,則進行分表,一般可以按照Id,時間等進行分表;(高級的用法是一致性Hash) 在分庫、分表的基礎上,進行讀寫分離。
分庫分表后序列的問題,JOIN,事務的問題,會在分庫分表主題分享中,介紹。
6、服務化
將多個子系統公用的功能/模塊,進行抽取,作為公用服務使用。比如本案例的會員子系統就可以抽取為公用的服務。
消息隊列可以解決子系統/模塊之間的耦合,實現異步,高可用,高性能的系統。是分布式系統的標準配置。本案例中,消息隊列主要應用在購物,配送環(huán)節(jié)。
用戶下單后,寫入消息隊列,后直接返回客戶端; 庫存子系統:讀取消息隊列信息,完成減庫存; 配送子系統:讀取消息隊列信息,進行配送。
目前使用較多的MQ有Active MQ、Rabbit MQ、Zero MQ、MS MQ等,需要根據具體的業(yè)務場景進行選擇。建議可以研究下Rabbit MQ。
8、其他架構(技術)
除了以上介紹的業(yè)務拆分,應用集群,多級緩存,單點登錄,數據庫集群,服務化,消息隊列外。還有CDN,反向代理,分布式文件系統,大數據處理等系統。
此處不詳細介紹,大家可以問度娘/Google,有機會的話也可以分享給大家。

- 架構匯總 -

作者:爛豬皮,十余年工作經驗,曾在 Google 等外企工作過幾年,精通 Java、分布式架構、微服務架構以及數據庫,最近正在研究大數據以及區(qū)塊鏈,希望能突破到更高的境界。
來源:
https://my.oschina.net/editorial-story/blog/1808757

評論
圖片
表情
