肝了一個月的學(xué)習(xí)路線
自學(xué)/學(xué)習(xí)路線這樣的一期我想寫很久了,因為一直想寫的全一點硬核一點所以拖到了現(xiàn)在,我相信這一期對不管是還在學(xué)校還是已經(jīng)工作的同學(xué)都有所幫助,不管是前端還是后端我都墻裂建議大家看完,因為這樣會讓你對你所工作的互聯(lián)網(wǎng)領(lǐng)域相關(guān)技術(shù)棧有個初步的了解。
你們也知道我是個創(chuàng)作鬼才,常規(guī)的切入點也不是我的風(fēng)格,我畢業(yè)后主要接觸的都是電商領(lǐng)域,所以這一期我把目前所了解的技術(shù)棧加上之前電商系統(tǒng)的經(jīng)驗臆想了一個完整的電商系統(tǒng),大家會看到很多熟悉的技術(shù)棧我相信也會看到自己未接觸過的技術(shù)棧,我也會對每個技術(shù)棧的主要技術(shù)點提一下,至于細節(jié)就只能大家在我歷史和未來的文章去看了。

這期可謂是嘔心瀝血之作,不要白嫖喲。
正文
我先介紹一下前端
前端
我讀者群體是以后端為主的,如果有大學(xué)還沒開始學(xué)習(xí)的小伙伴,這個時候我想已經(jīng)是滿屏幕的問號了,為啥我們后端程序員還要去學(xué)習(xí)前端呢?我只能告訴你,傻瓜,膚淺。
如果是已經(jīng)大學(xué)畢業(yè)的程序員我相信每一個后端程序員都會簡單的前端,甚至很多后端對目前前端最新技術(shù)也都是了解的,我們可不能閉門造車,誰告訴你后端就不學(xué)點前端了?而且你了解前端在之后工作聯(lián)調(diào)過程中或許會有更好的思路對你的工作是有所幫助的。
我們上網(wǎng)最先接觸到的肯定不是后端的一系列東西,而是移動端和前端網(wǎng)頁,各種花里胡哨的樣式不是我們要去了解的,但是網(wǎng)頁的基本語言以及布局從0到1這個過程是我們應(yīng)該去了解的,大家看到的花里胡哨的網(wǎng)頁布局、鏈接、文字、圖片、事件等,都是一個個的標(biāo)簽、class樣式以及js事件而已。

技術(shù)背后的思想其實是互通的,所以作為后端以前端作為我們程序員學(xué)習(xí)的切入點是完全OK的(只是針對還未入門萌新猿),我相信在各位的大學(xué)前端基礎(chǔ)課程也都是有安排的,而且不管是上學(xué)還是以后畢業(yè)我相信各位以后一定會接觸些許前端的。
在大學(xué)一般都是用項目去鍛煉技術(shù)的,那在項目里面很可能就是你一個人從前端到后端都是自己寫的,我在大學(xué)就是這樣的,現(xiàn)在工作了我們很多內(nèi)容系統(tǒng)簡單的前端也都是我們自己去開發(fā)的,因為為了簡單的頁面和邏輯去浪費前端的資源是沒有很大必要的。
在這里我列舉了我目前覺得比較簡單和我們后端可以了解的技術(shù)棧,都是比較基礎(chǔ)和我覺得比較必須的。
HTML、CSS、JS、Ajax我覺得是必須掌握的點,看著簡單其實深究或者去操作的話還是有很多東西的,其他作為擴展有興趣可以了解,反正入門簡單,只是精通很難很難。
在這一層不光有這些還有Http協(xié)議和Servlet,request、response、cookie、session這些也會伴隨你整個技術(shù)生涯,理解他們對后面的你肯定有不少好處。
擴展:前端技術(shù)我覺得VUE、React大家都可以嘗試去用用,他們目前支持很多即插即用的插件會幫助你更便捷的開發(fā)出漂亮的網(wǎng)頁。

Tip:我這里最后刪除了JSP相關(guān)的技術(shù),我個人覺得沒必要學(xué)了,很多公司除了老項目之外,新項目都不會使用那些技術(shù)了。
前端在我看來比后端難,技術(shù)迭代比較快,知識好像也沒特定的體系,所以面試大廠的前端很多朋友都說難,不是技術(shù)多難,而是知識多且復(fù)雜,找不到一個完整的體系,相比之下后端明朗很多,我后面就開始繼續(xù)往下講了。
網(wǎng)關(guān)層:
互聯(lián)網(wǎng)發(fā)展到現(xiàn)在,涌現(xiàn)了很多互聯(lián)網(wǎng)公司,技術(shù)更新迭代了很多個版本,從早期的單機時代,到現(xiàn)在超大規(guī)模的互聯(lián)網(wǎng)時代,幾億人參與的春運,幾千億成交規(guī)模的雙十一,無數(shù)互聯(lián)網(wǎng)前輩的造就了現(xiàn)在互聯(lián)網(wǎng)的輝煌。
微服務(wù),分布式,負載均衡、云原生等我們經(jīng)常提到的這些名詞都是這些技術(shù)在場景背后支撐。
單機頂不住,我們就多找點服務(wù)器,但是怎么將流量均勻的打到這些服務(wù)器上呢?
負載均衡,LVS
我們機器都是IP訪問的,但是我們上網(wǎng)都是訪問域名就好了,那怎么通過我們申請的域名去請求到服務(wù)器呢?
DNS
大家刷的抖音,B站,快手等等視頻服務(wù)商,是怎么保證同時為全國的用戶提供快速的體驗?
CDN
我們這么多系統(tǒng)和服務(wù),還有這么多中間件的調(diào)度怎么去管理調(diào)度等等?
zk
這么多的服務(wù)器,怎么對外統(tǒng)一訪問呢,就可能需要知道反向代理的服務(wù)器。
Nginx

這一層做了反向負載、服務(wù)路由、服務(wù)治理、流量管理、安全隔離、服務(wù)容錯等等都做了,大家公司的內(nèi)外網(wǎng)隔離也是這一層做的。
我之前還接觸過一些比較有意思的項目,所有對外的接口都是加密的,幾十個服務(wù)會經(jīng)過網(wǎng)關(guān)解密,找到真的路由再去請求。

這一層的知識點其實也不少,你往后面學(xué)會發(fā)現(xiàn)分布式事務(wù),分布式鎖,還有很多中間件都離不開這一層的Zookeeper,接下來就是整個學(xué)習(xí)體系最復(fù)雜的部分了,服務(wù)端。
服務(wù)層:
這一層有點東西了,算是整個框架的核心,如果你跟敖丙一樣以后都是從事后端開發(fā)的話,我們基本上整個技術(shù)生涯,大部分時間都在跟這一層的技術(shù)棧打交道了,各種琳瑯滿目的中間件,計算機基礎(chǔ)知識,Linux操作,算法數(shù)據(jù)結(jié)構(gòu),架構(gòu)框架,研發(fā)工具等等。
我想在看這個文章的各位,計算機基礎(chǔ)肯定都是學(xué)過的吧,如果大學(xué)的時候沒好好學(xué),我覺得還是有必要再看看的。
為什么我們網(wǎng)頁能保證安全可靠的傳輸,你可能會了解到HTTP,HTTPS,TCP協(xié)議,什么三次握手,四次揮手,中間人攻擊等。
還有進程、線程、協(xié)程,內(nèi)存屏障,指令亂序,分支預(yù)測,CPU親和性等等,在之后的編程生涯,如果你能掌握這些東西,會讓你在遇到很多問題的時候瞬間get到點,而不是像個無頭蒼蠅一樣亂撞(然而敖丙還做得不夠,所以最近也是在惡補操作系統(tǒng)和網(wǎng)路相關(guān)的知識)。
了解這些計算機知識后,你就需要接觸編程語言了,大學(xué)的C語言基礎(chǔ)會讓你學(xué)什么語言入門都會快點,嵌入式實習(xí)結(jié)束后我選擇了面向?qū)ο蟮?strong style="color: rgb(119, 48, 152);">JAVA,但是也不知道為啥現(xiàn)在還沒對象。
JAVA的基礎(chǔ)也一樣重要,面向?qū)ο?/strong>(包括類、對象、方法、繼承、封裝、抽象、 多態(tài)、消息解析等),常見API,數(shù)據(jù)結(jié)構(gòu),集合框架,設(shè)計模式(包括創(chuàng)建型、結(jié)構(gòu)型、行為型),多線程和并發(fā),I/O流,Stream,網(wǎng)絡(luò)編程你都需要了解。
代碼會寫了,你就要開始學(xué)習(xí)一些能幫助你把系統(tǒng)變得更加規(guī)范的框架,SSM可以會讓你的開發(fā)更加便捷,結(jié)構(gòu)層次更加分明。
寫代碼的時候你會發(fā)現(xiàn)你大學(xué)用的Eclipse在公司看不到了,你跟大家一樣去用了IDEA,第一天這是什么玩意,一周后,真香,但是這玩意收費有點貴,那免費的VSCode真的就是不錯的選擇了。
代碼寫的時候你會接觸代碼的倉庫管理工具maven、Gradle,提交代碼的時候會去學(xué)習(xí)項目版本管理工具Git。
代碼提交之后,發(fā)布之后你會發(fā)現(xiàn)很多東西需要自己去服務(wù)器親自排查,那Linux的知識點就可以在里面靈活運用了,通過跳板機訪問服務(wù)器查看進程,查看文件,各種Vim操作指令等等。
當(dāng)你自己研發(fā)系統(tǒng)發(fā)布時你發(fā)現(xiàn)很多命令其實可以寫成一個腳本一鍵執(zhí)行就好了,那Shell會讓你事半功倍的。
系統(tǒng)層面的優(yōu)化很多時候會很有限,你可能會嘗試從算法,或者優(yōu)化數(shù)據(jù)結(jié)構(gòu)去優(yōu)化,你看到了HashMap的源碼,想去了解紅黑樹,然后在算法網(wǎng)上看到了二叉樹搜索樹和各種常見的算法問題,刷多了,你也能總結(jié)出精華所在,什么貪心,分治,動態(tài)規(guī)劃等。
這么多個服務(wù),你發(fā)現(xiàn)HTTP請求已經(jīng)開始有點不滿足你的需求了,你想開發(fā)更便捷,像訪問本地服務(wù)一樣訪問遠程服務(wù),所以我們?nèi)チ私饬?strong style="color: rgb(119, 48, 152);">Dubbo,Spring cloud等。
了解Dubbo的過程中,你發(fā)現(xiàn)了RPC的精華所在,所以你去接觸到了高性能的NIO框架,Netty。
代碼寫好了,服務(wù)也能通信了,但是你發(fā)現(xiàn)你的代碼鏈路好長,都耦合在一起了,所以你接觸了消息隊列,這種異步的處理方式,真香。
他還可以幫你在突發(fā)流量的時候用隊列做緩沖,但是你發(fā)現(xiàn)分布式的情況,事務(wù)就不好管理了,你就了解到了分布式事務(wù),什么兩段式,三段式,TCC,XA,阿里云的全局事務(wù)服務(wù)GTS等等。
業(yè)務(wù)場景使用的多的時候你會想去了解RocketMQ,他也自帶了分布式事務(wù)的解決方案,但是他并不適合超大數(shù)據(jù)量的場景,這個時候Kafka就會進入你的視線中。

我上面提到過zk,像Dubbo、Kafka等中間件都是用它做注冊中心的(后續(xù)kafka會把zk去掉)很多技術(shù)棧最后都組成了一個知識體系,你先了解了體系中的每一員,你才能把它們聯(lián)系起來。

服務(wù)的交互都從進程內(nèi)通信變成了遠程通信,所以性能必然會受到一些影響。
此外由于很多不確定性的因素,例如網(wǎng)絡(luò)擁塞、Server 端服務(wù)器宕機、挖掘機鏟斷機房光纖等等,需要許多額外的功能和措施才能保證微服務(wù)流暢穩(wěn)定的工作。
Spring Cloud 中就有 Hystrix 熔斷器、Ribbon客戶端負載均衡器、Eureka注冊中心等等都是用來解決這些問題的微服務(wù)組件。
你感覺學(xué)習(xí)得差不多了,你發(fā)現(xiàn)各大論壇博客出現(xiàn)了一些前沿技術(shù),比如容器化、云原生,你可能就會去了解像**Docker,Kubernetes(K8s)**等技術(shù),你會發(fā)現(xiàn)他們給企業(yè)級應(yīng)用提供了怎樣的便捷。
微服務(wù)之所以能夠快速發(fā)展,很重要的一個原因就是:容器化技術(shù)的發(fā)展和容器管理系統(tǒng)的成熟。

這一層的東西呢其實遠遠不止這些的,我不過多贅述,寫多了像個勸退師一樣,但是大家也不用慌,大部分的技術(shù)都是慢慢接觸了,工作中慢慢去了解,去深入的。
這里呢還是想說我經(jīng)常提到的那句話,你知道的越多,你不知道的越多,所有領(lǐng)域都是這樣,一旦你深入了解了這個技術(shù)細節(jié),衍生出來的新知識點和他的弊端會讓你發(fā)現(xiàn)自己的無知,但學(xué)到自己不會的不斷去進步會讓你在學(xué)習(xí)的道路上走更遠的。
好啦我們繼續(xù)沿著圖往下看,那再往下是啥呢?
數(shù)據(jù)層:
數(shù)據(jù)庫可能是整個系統(tǒng)中最值錢的部分了,今年呢也發(fā)生了微盟程序員刪庫跑路的操作,刪庫跑路其實是我們在網(wǎng)上最常用的笑話,但是這個笑話背后我們應(yīng)該得到的思考就是,數(shù)據(jù)是整個企業(yè)最重要最核心的東西,我現(xiàn)在在公司的大數(shù)據(jù)團隊對此深有體會。
如果大家對大數(shù)據(jù)感興趣我想我后面也可以找機會單獨出一期大數(shù)據(jù)技術(shù)棧相關(guān)的專題。

數(shù)據(jù)庫基本的事務(wù)隔離級別,索引,SQL,主被同步,讀寫分離等都可能是你學(xué)的時候要了解到的。
不要把雞蛋放一個籃子的道理大家應(yīng)該都知道,那分庫的意義就很明顯了,然后你會發(fā)現(xiàn)時間久了表的數(shù)據(jù)大了,就會想到去接觸分表,什么TDDL、Sharding-JDBC、DRDS這些插件都會接觸到。
你發(fā)現(xiàn)流量大的時候,或者熱點數(shù)據(jù)打到數(shù)據(jù)庫還是有點頂不住,壓力太大了,那非關(guān)系型數(shù)據(jù)庫就進場了,Redis當(dāng)然是首選,但是memcache也有各自的應(yīng)用場景。
Redis使用后,真香,真快,但是你會開始擔(dān)心最開始提到的安全問題,這玩意快是因為在內(nèi)存中操作,那斷點了數(shù)據(jù)丟了怎么辦?你就開始閱讀官方文檔,了解RDB,AOF這些持久化機制,線上用的時候還會遇到緩存雪崩擊穿、穿透等等問題。
單機不滿足你就用了,他的集群模式,用了集群可能也擔(dān)心集群的健康狀態(tài),所以就得去了解哨兵,他的主從同步,時間久了Key多了,就得了解內(nèi)存淘汰機制......
老板讓你最最小的代價去設(shè)計每日簽到和UV、PV統(tǒng)計你就會接觸到:位圖和HyperLogLog,高速的過濾你就會考慮到:布隆過濾器 (Bloom Filter) ,附近的人就會使用到:GeoHash 他的大容量存儲有問題,你可能需要去了解Pika....


其實遠遠沒完,每個的點我都點到為止,但是其實要深究每個點都要學(xué)很久,我們接著往下看。
實時/離線數(shù)倉/大數(shù)據(jù)
等你把幾種關(guān)系型非關(guān)系型數(shù)據(jù)庫的知識點,整理清楚后,你會發(fā)現(xiàn)數(shù)據(jù)還是大啊,而且數(shù)據(jù)的場景越來越多多樣化了,那大數(shù)據(jù)的各種中間件你就得了解了。
你會發(fā)現(xiàn)很多場景,不需要實時的數(shù)據(jù),比如你查你的支付寶去年的,上個月的賬單,這些都是不會變化的數(shù)據(jù),沒必要實時,那你可能會接觸像ODPS這樣的中間件去做數(shù)據(jù)的離線分析。
然后你可能會接觸Hadoop系列相關(guān)的東西,比如于Hadoop(HDFS)的一個數(shù)據(jù)倉庫工具Hive,是建立在 ?Hadoop 文件系統(tǒng)之上的分布式面向列的數(shù)據(jù)庫HBase 。
寫多的場景,適合做一些簡單查詢,用他們又有點大材小用,那Cassandra就再合適不過了。
離線的數(shù)據(jù)分析沒辦法滿足一些實時的常見,類似風(fēng)控,那Flink你也得略知一二,他的窗口思想還是很有意思。
數(shù)據(jù)接觸完了,計算引擎Spark你是不是也不能放過......

算法/機器學(xué)習(xí)/人工智能:
數(shù)據(jù)是整個電商系統(tǒng)乃至于我們整個互聯(lián)網(wǎng)最值錢的部分不是隨便說說的,但是如何發(fā)揮他們的價值,數(shù)據(jù)放在數(shù)據(jù)庫是無法發(fā)揮他應(yīng)有的價值的,算法在最近10年越來越受到大家的重視,機器學(xué)習(xí)、深度學(xué)習(xí)、人工智能、自動駕駛等領(lǐng)域也頻頻爆出天價offer的新聞,所以算法我覺得也有機會也是可以了解一下的。
不知道大家用搜索引擎或者購物網(wǎng)站使用過以圖搜圖功能沒,這就是算法的圖像搜索功能,我們在搜索欄輸入對應(yīng)關(guān)鍵詞之后算法同學(xué)會通過自然語言處理,然后再落到推薦系統(tǒng)給出最好的搜索結(jié)果,以及大家看到的熱搜,默認搜索的推薦都是通過算法算出針對你個人最優(yōu)的推薦,你最最感興趣的推薦。
就比如我最近在B站看了《龍王贅婿》相關(guān)的視頻,我的默認搜索推薦就出現(xiàn)了《畫網(wǎng)贅婿》的默認搜索推薦,這就是根據(jù)近期熱點和你個人喜好算出來的,大家可以進去刷新試試。

國內(nèi)人口基數(shù)這么大,那相對來說垃圾內(nèi)容應(yīng)該更多才對,但是大家?guī)缀蹩梢砸恢睘g覽到綠色健康的網(wǎng)絡(luò)環(huán)境,這得益于風(fēng)控,算法同學(xué)也會用風(fēng)控去對涉黃,涉政等內(nèi)容做一個甄別。
你要知道你的每一個行為在進入app開始就會被分析,最后給你打上一個個的標(biāo)簽,算法算出你最喜歡的內(nèi)容投喂給你,你沒發(fā)現(xiàn)抖音你越看內(nèi)容越和你的胃口么?淘寶你越逛推薦的商品你越想買么?
這都得益于大數(shù)據(jù)和算法的結(jié)合,不斷完善不同的訓(xùn)練模型,投喂給用戶他最喜歡的內(nèi)容,很多訓(xùn)練模型甚至以小時維度的更新頻率在更新。
用戶數(shù)據(jù)對內(nèi)對外還有差別,因為很多平臺是不會給你完整的數(shù)據(jù)的,但是算法同學(xué)會盡可能的捕捉用戶的每一個潛在特性,然后去給你投喂最適合你的廣告。
看到這里大家可能會擔(dān)心自己的數(shù)據(jù)安全了,其實每個公司都會有自己最基本的職業(yè)操守,正常公司都是不會去出賣自己用戶的任何數(shù)據(jù)的,但是市面上也存在銷售用戶數(shù)據(jù)的黑色產(chǎn)業(yè)。
生在這個大數(shù)據(jù)的年代是一件好事,技術(shù)是兩面性也是我一直強調(diào)的,這樣的技術(shù)會讓你的所有信息透明,這個時候我們就要盡可能的注重保護我們自己的數(shù)據(jù)隱私安全,不要貪圖小便宜去到處填寫自己的真實信息,手機號,身份證號碼等,你永遠都不知道你數(shù)據(jù)的價值,以及他們可能把你的數(shù)據(jù)用在什么地方。
算法這里我提到過搜索引擎,我打算單獨講一下,因為在技術(shù)側(cè)還算有可圈可點之處。
搜索引擎:
傳統(tǒng)關(guān)系型數(shù)據(jù)庫和NoSQL非關(guān)系型數(shù)據(jù)都沒辦法解決一些問題,比如我們在百度,淘寶搜索東西的時候,往往都是幾個關(guān)鍵字在一起一起搜索東西的,在數(shù)據(jù)庫除非把幾次的結(jié)果做交集,不然很難去實現(xiàn)。
那全文檢索引擎就誕生了,解決了搜索的問題,你得思考怎么把數(shù)據(jù)庫的東西實時同步到ES中去,那你可能會思考到logstash去定時跑腳本同步,又或者去接觸偽裝成一臺MySQL從服務(wù)的Canal,他會去訂閱MySQL主服務(wù)的binlog,然后自己解析了去操作Es中的數(shù)據(jù)。
這些都搞定了,那可視化的后臺查詢又怎么解決呢?Kibana,他他是一個可視化的平臺,甚至對Es集群的健康管理都做了可視化,很多公司的日志查詢系統(tǒng)都是用它做的。

學(xué)習(xí)路線
以上就是整個系統(tǒng)所有的技術(shù)棧了,這個時候大家再看一下我開頭的電商項目圖大家是不是會覺得更有感覺了?是不是發(fā)現(xiàn)好像是那么回事,也大概知道了很多技術(shù)棧在一個系統(tǒng)里面的地位了?

技術(shù)路線路線圖呢就用我之前的圖其實就夠了,不一定要嚴格按照這個去學(xué)習(xí),只是給大家一個參考。

我提到的技術(shù)棧你想全部了解,我覺得初步了解可能幾個月就夠了,這里的了解僅限于你知道它,知道他是干嘛的,知道怎么去使用它,并不是說深入了解他的底層原理,了解他的常見問題,熟悉問題的解決方案等等。
你想做到后者,基本上只能靠時間上的日積月累,或者不斷的去嘗試積累經(jīng)驗,也沒什么速成的東西,欲速則不達大家也是知道的。
技術(shù)這條路,說實話很枯燥,很辛苦,但是待遇也會高于其他一些基礎(chǔ)崗位。
說實話我大學(xué)學(xué)這個就是為了興趣,我從小對電子,對計算機都比較熱愛,但是現(xiàn)在打磨得,現(xiàn)在就是為了錢吧,是不是很現(xiàn)實?若家境殷實,誰愿顛沛流離。
但是至少因為從事了軟件開發(fā),改變了家庭的窘境,自己日子也向小康一步步邁過去,不經(jīng)一番寒徹骨,怎得梅花撲鼻香?
