四虎成人精品永久免费AV九九,久久娱乐看片,凹凸福利视频,日韩肏屄网,天天操夜夜拍免费视频,大雞巴乱人妻1～14,99精品国产综合久久久久久欧美 ,大鸡吧视频在线免费观看

前言

在微服務(wù)架構(gòu)中，一次請(qǐng)求往往涉及到多個(gè)模塊，多個(gè)中間件，多臺(tái)機(jī)器的相互協(xié)作才能完成。這一系列調(diào)用請(qǐng)求中，有些是串行的，有些是并行的，那么如何確定這個(gè)請(qǐng)求背后調(diào)用了哪些應(yīng)用，哪些模塊，哪些節(jié)點(diǎn)及調(diào)用的先后順序？如何定位每個(gè)模塊的性能問題？本文將為你揭曉答案。

本文將會(huì)從以下幾個(gè)方面來闡述

分布式追蹤系統(tǒng)原理及作用
SkyWalking的原理及架構(gòu)設(shè)計(jì)
我司在分布式調(diào)用鏈上的實(shí)踐

?

分布式追蹤系統(tǒng)的原理及作用

如何衡量一個(gè)接口的性能好壞，一般我們至少會(huì)關(guān)注以下三個(gè)指標(biāo)

接口的 RT 你怎么知道?
是否有異常響應(yīng)?
主要慢在哪里?

單體架構(gòu)

在初期，公司剛起步的時(shí)候，可能多會(huì)采用如下單體架構(gòu)，對(duì)于單體架構(gòu)我們?cè)撚檬裁捶绞絹碛?jì)算以上三個(gè)指標(biāo)呢?

最容易想到的顯然是用 AOP

使用 AOP 在調(diào)用具體的業(yè)務(wù)邏輯前后分別打印一下時(shí)間即可計(jì)算出整體的調(diào)用時(shí)間，使用 AOP 來 catch 住異常也可知道是哪里的調(diào)用導(dǎo)致的異常。

微服務(wù)架構(gòu)

在單體架構(gòu)中由于所有的服務(wù)，組件都在一臺(tái)機(jī)器上，所以相對(duì)來說這些監(jiān)控指標(biāo)比較容易實(shí)現(xiàn)，不過隨著業(yè)務(wù)的快速發(fā)展，單體架構(gòu)必然會(huì)朝微服務(wù)架構(gòu)發(fā)展，如下

如果有用戶反饋某個(gè)頁面很慢，我們知道這個(gè)頁面的請(qǐng)求調(diào)用鏈?zhǔn)?A -----> ?C -----> ?B -----> ?D，此時(shí)如何定位可能是哪個(gè)模塊引起的問題。每個(gè)服務(wù) Service A,B,C,D 都有好幾臺(tái)機(jī)器。怎么知道某個(gè)請(qǐng)求調(diào)用了服務(wù)的具體哪臺(tái)機(jī)器呢？

可以明顯看到，由于無法準(zhǔn)確定位每個(gè)請(qǐng)求經(jīng)過的確切路徑，在微服務(wù)這種架構(gòu)下有以下幾個(gè)痛點(diǎn)

排查問題難度大，周期長(zhǎng)
特定場(chǎng)景難復(fù)現(xiàn)
系統(tǒng)性能瓶頸分析較難

分布式調(diào)用鏈就是為了解決以上幾個(gè)問題而生，它主要的作用如下

自動(dòng)采取數(shù)據(jù) ?
分析數(shù)據(jù)產(chǎn)生完整調(diào)用鏈：有了請(qǐng)求的完整調(diào)用鏈，問題有很大概率可復(fù)現(xiàn)
數(shù)據(jù)可視化：每個(gè)組件的性能可視化，能幫助我們很好地定位系統(tǒng)的瓶頸，及時(shí)找出問題所在

通過分布式追蹤系統(tǒng)能很好地定位如下請(qǐng)求的每條具體請(qǐng)求鏈路，從而輕易地實(shí)現(xiàn)請(qǐng)求鏈路追蹤，每個(gè)模塊的性能瓶頸定位與分析。

分布式調(diào)用鏈標(biāo)準(zhǔn) - OpenTracing

知道了分布式調(diào)用鏈的作用，那我們來看下如何實(shí)現(xiàn)分布式調(diào)用鏈的實(shí)現(xiàn)及原理，首先為了解決不同的分布式追蹤系統(tǒng) API 不兼容的問題，誕生了 OpenTracing 規(guī)范，OpenTracing 是一個(gè)輕量級(jí)的標(biāo)準(zhǔn)化層，它位于應(yīng)用程序/類庫(kù)和追蹤或日志分析程序之間。

說到這大家是否想過 Java 中類似的實(shí)現(xiàn)？還記得 JDBC 吧，通過提供一套標(biāo)準(zhǔn)的接口讓各個(gè)廠商去實(shí)現(xiàn)，程序員即可面對(duì)接口編程，不用關(guān)心具體的實(shí)現(xiàn)。這里的接口其實(shí)就是標(biāo)準(zhǔn)，所以制定一套標(biāo)準(zhǔn)非常重要，可以實(shí)現(xiàn)組件的可插拔。

接下來我們來看 OpenTracing 的數(shù)據(jù)模型，主要有以下三個(gè)

Trace：一個(gè)完整請(qǐng)求鏈路
Span：一次調(diào)用過程(需要有開始時(shí)間和結(jié)束時(shí)間)
SpanContext：Trace 的全局上下文信息, 如里面有traceId

理解這三個(gè)概念非常重要，為了讓大家更好地理解這三個(gè)概念，我特意畫了一張圖

如圖示，一次下單的完整請(qǐng)求完整就是一個(gè) Trace, 顯然對(duì)于這個(gè)請(qǐng)求來說，必須要有一個(gè)全局標(biāo)識(shí)來標(biāo)識(shí)這一個(gè)請(qǐng)求，每一次調(diào)用就稱為一個(gè) Span，每一次調(diào)用都要帶上全局的 TraceId, 這樣才可把全局 TraceId 與每個(gè)調(diào)用關(guān)聯(lián)起來，這個(gè) TraceId 就是通過 SpanContext 傳輸?shù)模热灰獋鬏旓@然都要遵循協(xié)議來調(diào)用。如圖示，我們把傳輸協(xié)議比作車，把 SpanContext 比作貨，把 Span 比作路應(yīng)該會(huì)更好理解一些。

理解了這三個(gè)概念，接下來我看看分布式追蹤系統(tǒng)如何采集統(tǒng)一圖中的微服務(wù)調(diào)用鏈

我們可以看到底層有一個(gè) Collector 一直在默默無聞地收集數(shù)據(jù)，那么每一次調(diào)用 Collector 會(huì)收集哪些信息呢。

全局 trace_id：這是顯然的，這樣才能把每一個(gè)子調(diào)用與最初的請(qǐng)求關(guān)聯(lián)起來
span_id: 圖中的 0，1，1.1，2,這樣就能標(biāo)識(shí)是哪一個(gè)調(diào)用
parent_span_id：比如 b 調(diào)用 d 的 ?span_id 是 1.1，那么它的 parent_span_id 即為 a 調(diào)用 b 的 span_id 即 1，這樣才能把兩個(gè)緊鄰的調(diào)用關(guān)聯(lián)起來。

有了這些信息，Collector 收集的每次調(diào)用的信息如下

根據(jù)這些圖表信息顯然可以據(jù)此來畫出調(diào)用鏈的可視化視圖如下

于是一個(gè)完整的分布式追蹤系統(tǒng)就實(shí)現(xiàn)了。

以上實(shí)現(xiàn)看起來確實(shí)簡(jiǎn)單，但有以下幾個(gè)問題需要我們仔細(xì)思考一下

怎么自動(dòng)采集 span 數(shù)據(jù)：自動(dòng)采集，對(duì)業(yè)務(wù)代碼無侵入
如何跨進(jìn)程傳遞 context
traceId 如何保證全局唯一
請(qǐng)求量這么多采集會(huì)不會(huì)影響性能

接下我來看看 SkyWalking 是如何解決以上四個(gè)問題的

?

SkyWalking的原理及架構(gòu)設(shè)計(jì)

怎么自動(dòng)采集 span 數(shù)據(jù)

SkyWalking 采用了插件化 + javaagent 的形式來實(shí)現(xiàn)了 span 數(shù)據(jù)的自動(dòng)采集，這樣可以做到對(duì)代碼的 無侵入性，插件化意味著可插拔，擴(kuò)展性好（后文會(huì)介紹如何定義自己的插件）

如何跨進(jìn)程傳遞 context

我們知道數(shù)據(jù)一般分為 header 和 body, 就像 http 有 header 和 body, RocketMQ 也有 MessageHeader，Message Body, body 一般放著業(yè)務(wù)數(shù)據(jù)，所以不宜在 body 中傳遞 context，應(yīng)該在 header 中傳遞 context，如圖示

小提示：這里的傳遞 context 流程均是在 dubbo plugin 處理的，業(yè)務(wù)無感知，這個(gè) plugin 是怎么實(shí)現(xiàn)的呢，下文會(huì)分析

traceId 如何保證全局唯一

要保證全局唯一，我們可以采用分布式或者本地生成的 ID，使用分布式話需要有一個(gè)發(fā)號(hào)器，每次請(qǐng)求都要先請(qǐng)求一下發(fā)號(hào)器，會(huì)有一次網(wǎng)絡(luò)調(diào)用的開銷，所以 SkyWalking 最終采用了本地生成 ID 的方式，它采用了大名鼎鼎的 snowflow 算法，性能很高。

不過 snowflake 算法有一個(gè)眾所周知的問題：時(shí)間回?fù)?/strong>，這個(gè)問題可能會(huì)導(dǎo)致生成的 id 重復(fù)。那么 SkyWalking 是如何解決時(shí)間回?fù)軉栴}的呢。

這里要說一下系統(tǒng)設(shè)計(jì)上的方案取舍問題了，首先如果針對(duì)產(chǎn)生的這個(gè)隨機(jī)數(shù)作唯一性校驗(yàn)無疑會(huì)多一層調(diào)用，會(huì)有一定的性能損耗，但其實(shí)時(shí)間回?fù)馨l(fā)生的概率很小（發(fā)生之后由于機(jī)器時(shí)間紊亂，業(yè)務(wù)會(huì)受到很大影響，所以機(jī)器時(shí)間的調(diào)整必然要慎之又慎），再加上生成的隨機(jī)數(shù)重合的概率也很小，綜合考慮這里確實(shí)沒有必要再加一層全局惟一性校驗(yàn)。對(duì)于技術(shù)方案的選型，一定要避免過度設(shè)計(jì)，過猶不及。

請(qǐng)求量這么多，全部采集會(huì)不會(huì)影響性能?

如果對(duì)每個(gè)請(qǐng)求調(diào)用都采集，那毫無疑問數(shù)據(jù)量會(huì)非常大，但反過來想一下，是否真的有必要對(duì)每個(gè)請(qǐng)求都采集呢，其實(shí)沒有必要，我們可以設(shè)置采樣頻率，只采樣部分?jǐn)?shù)據(jù)，SkyWalking 默認(rèn)設(shè)置了 3 秒采樣 3 次，其余請(qǐng)求不采樣,如圖示

這樣的話就會(huì)導(dǎo)致某些調(diào)用在服務(wù) A 上被采樣了，在服務(wù) B，C 上不被采樣，也就沒法分析調(diào)用鏈的性能，那么 SkyWalking 是如何解決的呢。

它是這樣解決的：如果上游有攜帶 Context 過來（說明上游采樣了），則下游強(qiáng)制采集數(shù)據(jù)。這樣可以保證鏈路完整。

SkyWalking 的基礎(chǔ)架構(gòu)

SkyWalking 的基礎(chǔ)如下架構(gòu)，可以說幾乎所有的的分布式調(diào)用都是由以下幾個(gè)組件組成的

SkyWalking 的性能如何

接下來大家肯定比較關(guān)心 SkyWalking 的性能，那我們來看下官方的測(cè)評(píng)數(shù)據(jù)

圖中藍(lán)色代表未使用 SkyWalking 的表現(xiàn)，橙色代表使用了 SkyWalking 的表現(xiàn)，以上是在 TPS 為 5000 的情況下測(cè)出的數(shù)據(jù)，可以看出，不論是 CPU，內(nèi)存，還是響應(yīng)時(shí)間，使用 SkyWalking 帶來的性能損耗幾乎可以忽略不計(jì)。

接下來我們?cè)賮砜?SkyWalking 與另一款業(yè)界比較知名的分布式追蹤工具 Zipkin, Pinpoint 的對(duì)比（在采樣率為 1 秒 1 個(gè)，線程數(shù) 500，請(qǐng)求總數(shù)為 5000 的情況下做的對(duì)比）,可以看到在關(guān)鍵的響應(yīng)時(shí)間上， Zipkin（117ms）,PinPoint（201ms）遠(yuǎn)遜色于 SkyWalking（22ms）!

從性能損耗這個(gè)指標(biāo)上看，SkyWalking 完勝！

再看下另一個(gè)指標(biāo)：對(duì)代碼的侵入性如何，ZipKin 是需要在應(yīng)用程序中埋點(diǎn)的，對(duì)代碼的侵入強(qiáng)，而 SkyWalking 采用 javaagent + 插件化這種修改字節(jié)碼的方式可以做到對(duì)代碼無任何侵入，除了性能和對(duì)代碼的侵入性上 SkyWaking 表現(xiàn)不錯(cuò)外，它還有以下優(yōu)勢(shì)幾個(gè)優(yōu)勢(shì)

對(duì)多語言的支持，組件豐富：目前其支持 Java, .Net Core, PHP, NodeJS, Golang, LUA 語言，組件上也支持dubbo, mysql 等常見組件，大部分能滿足我們的需求。
擴(kuò)展性：對(duì)于不滿足的插件，我們按照 SkyWalking 的規(guī)則手動(dòng)寫一個(gè)即可，新實(shí)現(xiàn)的插件對(duì)代碼無入侵。

?

我司在分布式調(diào)用鏈上的實(shí)踐

SkyWalking 在我司的應(yīng)用架構(gòu)

由上文可知 SkyWalking 有很多優(yōu)點(diǎn)，那么是不是我們用了它的全部組件了呢，其實(shí)不然，來看下其在我司的應(yīng)用架構(gòu)

從圖中可以看出我們只采用了 SkyWalking 的 agent 來進(jìn)行采樣，放棄了另外的「數(shù)據(jù)上報(bào)及分析」，「數(shù)據(jù)存儲(chǔ)」，「數(shù)據(jù)可視化」三大組件，那為啥不直接采用 SkyWalking 的整套解決方案呢，因?yàn)樵诮尤?SkyWalking 之前我們的 Marvin 監(jiān)控生態(tài)體系已經(jīng)相對(duì)比較完善了，如果把其整個(gè)替換成 ?SkyWalking，一來沒有必要，Marvin 在大多數(shù)場(chǎng)景下都能滿足我們的需求，二來系統(tǒng)替換成本高，三來如果重新接入用戶學(xué)習(xí)成本很高。

這也給我們一個(gè)啟示：任何產(chǎn)品搶占先機(jī)很重要，后續(xù)產(chǎn)品的替換成本會(huì)很高，搶占先機(jī)，也就是搶占了用戶的心智，這就像微信雖然 UI，功能上制作精良，但在國(guó)外照樣干不過 Whatsapp 一樣，因?yàn)橄葯C(jī)已經(jīng)沒了。

從另一方面來看，對(duì)架構(gòu)來說，沒有最好的，最有最合適的，結(jié)合當(dāng)前業(yè)務(wù)場(chǎng)景去平衡折中才是架構(gòu)設(shè)計(jì)的本質(zhì)

我司對(duì) SkyWalking 作了哪些改造和實(shí)踐

我司主要作了以下改造和實(shí)踐

預(yù)發(fā)環(huán)境由于調(diào)試需要強(qiáng)制采樣
實(shí)現(xiàn)更細(xì)粒度的采樣?
日志中嵌入traceId
自研實(shí)現(xiàn)了 SkyWalking 插件

預(yù)發(fā)環(huán)境由于調(diào)試需要強(qiáng)制采樣

從上文分析可知 Collector 是在后臺(tái)定時(shí)采樣的，這不挺好的嗎，為啥要實(shí)現(xiàn)強(qiáng)制采樣呢。還是為了排查定位問題，有時(shí)線上出現(xiàn)問題，我們希望在預(yù)發(fā)上能重現(xiàn)，希望能看到這個(gè)請(qǐng)求的完整調(diào)用鏈，所以在預(yù)發(fā)上實(shí)現(xiàn)強(qiáng)制采樣很有必要。所以我們對(duì) Skywalking 的 dubbo 插件進(jìn)行了改造，實(shí)現(xiàn)強(qiáng)制采樣

我們?cè)谡?qǐng)求的 Cookie 上帶上一個(gè)類似 force_flag = true 這樣的鍵值對(duì)來表示我們希望強(qiáng)制采樣，在網(wǎng)關(guān)收到這個(gè) Cookie 后，就會(huì)在 dubbo 的 attachment 里帶上force_flag = true 這個(gè)鍵值對(duì)，然后 skywalking 的 dubbo 插件就可以據(jù)此來判斷是否是強(qiáng)制采樣了，如果有這個(gè)值即強(qiáng)制采樣，如果沒有這個(gè)值，則走正常的定時(shí)采樣。

實(shí)現(xiàn)更細(xì)粒度的采樣?

哈叫更細(xì)粒度的采樣。先來看下 skywalking 默認(rèn)的采樣方式，即統(tǒng)一采樣

日志中如何嵌入traceId?

輸出日志中嵌入 traceId 便于我們排查問題，所以打出出 traceId 非常有必要，該怎么在日志中嵌入 traceId 呢？我們用的是 log4j，這里就要了解一下 log4j 的插件機(jī)制了，log4j 允許我們自定義插件來輸出日志的格式，首先我們需要定義日志的格式，在自定義的日志格式中嵌入 %traceId, 作為占位符，如下

然后我們?cè)賹?shí)現(xiàn)一個(gè) log4j 的插件，如下

我司自研了哪些 skywalking 插件

SkyWalking 實(shí)現(xiàn)了很多插件，不過未提供 memcached 和 druid 的插件，所以我們根據(jù)其規(guī)范自研了這兩者的插件

插件如何實(shí)現(xiàn)呢，可以看到它主要由三個(gè)部分組成

插件定義類: 指定插件的定義類，最終會(huì)根據(jù)這里的定義類打包生成 plugin
Instrumentation: 指定切面，切點(diǎn)，要對(duì)哪個(gè)類的哪個(gè)方法進(jìn)行增強(qiáng)
Interceptor,指定步驟 2 中要在方法的前置，后置還是異常中寫增強(qiáng)邏輯

可能大家看了還是不懂，那我們以 dubbo plugin 來簡(jiǎn)單講解一下，我們知道在 dubbo 服務(wù)中，每個(gè)請(qǐng)求從 netty 接收到消息，遞交給業(yè)務(wù)線程池處理開始，到真正調(diào)用到業(yè)務(wù)方法結(jié)束，中間經(jīng)過了十幾個(gè) Filter 的處理

所以顯然我們需要在插件中指定我們要增強(qiáng)的類（MonitorFilter）,對(duì)其方法（invoke）做增強(qiáng)，要對(duì)這個(gè)方法做哪些增強(qiáng)呢，這就是攔截器（Inteceptor）要做的事，來看看 Dubbo 插件中的 instrumentation（DubboInstrumentation）

我們?cè)倏纯聪麓a中描寫的攔截器（Inteceptor）干了什么事，以下列出關(guān)鍵步驟

首先 beforeMethod 代表在執(zhí)行 MonitorFilter 的 invoke 方法前會(huì)調(diào)用這里的方法，與之對(duì)應(yīng)的是 afterMethod，代表在執(zhí)行 invoke 方法后作增強(qiáng)邏輯。

其次我們從第 2，3點(diǎn)可以看到，不管是 consumer 還是 provider, 都對(duì)其全局 ID 作了相應(yīng)處理，這樣確保到達(dá)真正的業(yè)務(wù)層的時(shí)候保證有了此全局 traceid，定義好 Instrumentation 和 Interceptor 后，最后一步就是在 skywalking.def 里指定定義的類


// skywalking-plugin.def 文件dubbo=org.apache.skywalking.apm.plugin.asf.dubbo.DubboInstrumentation

這樣打包出來的插件就會(huì)對(duì) MonitorFilter 的 ?invoke 方法進(jìn)行增強(qiáng)，在 invoke 方法執(zhí)行前對(duì)期 attachment 作注入全局 traceId 等操作，這一切都是靜默的，對(duì)代碼無侵入的。

?

總結(jié)

本文由淺入深地介紹了分布式追蹤系統(tǒng)的原理，相信大家對(duì)其作用及工作機(jī)制有了比較深的理解，特別需要注意的是，引入某項(xiàng)技巧，一定要結(jié)合現(xiàn)有的技術(shù)架構(gòu)作出最合理的選擇，就像 SkyWalking 有四個(gè)模塊，我司只采用其 agent 采樣功能一樣，沒有最好的技術(shù)，只有最合適的技術(shù)，通過此文，相信大家應(yīng)該對(duì) SkyWalking 的實(shí)現(xiàn)機(jī)制有了比較清晰的認(rèn)識(shí)，文中只是介紹了一下 SkyWalking 的插件實(shí)現(xiàn)方式，不過其畢竟是工業(yè)級(jí)軟件，要了解其博大精深，還要多讀源碼哦。

有道無術(shù)，術(shù)可成；有術(shù)無道，止于術(shù)

歡迎大家關(guān)注Java之道公眾號(hào)

好文章，我在看??

40張圖看懂分布式追蹤系統(tǒng)原理及實(shí)踐

前言

?