<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          多線程使用不當(dāng)導(dǎo)致的 OOM

          共 10487字,需瀏覽 21分鐘

           ·

          2022-07-09 06:53

          程序員的成長(zhǎng)之路
          互聯(lián)網(wǎng)/程序員/技術(shù)/資料共享 
          關(guān)注


          閱讀本文大概需要 7 分鐘。

          來自:juejin.cn/post/7064376361334358046

          事故描述

          從 6 點(diǎn) 32 分開始少量用戶訪問 App 時(shí)會(huì)出現(xiàn)首頁訪問異常,到 7 點(diǎn) 20 分首頁服務(wù)大規(guī)模不可用,7 點(diǎn) 36 分問題解決。

          整體經(jīng)過

          6:58  發(fā)現(xiàn)報(bào)警,同時(shí)發(fā)現(xiàn)群里反饋首頁出現(xiàn)網(wǎng)絡(luò)繁忙,考慮到前幾日晚上門店列表服務(wù)上線發(fā)布過,所以考慮回滾代碼緊急處理問題。
          7:07 開始先后聯(lián)系 XXX 查看解決問題。
          7:36  代碼回滾完,服務(wù)恢復(fù)正常。

          事故根本原因

          事故代碼模擬:

          public static void test() throws InterruptedException, ExecutionException {

              Executor executor = Executors.newFixedThreadPool(3);
              CompletionService<String> service = new ExecutorCompletionService<>(executor);
                  service.submit(new Callable<String>() {
                      @Override
                      public String call() throws Exception {
                          return "HelloWorld--" + Thread.currentThread().getName();
                      }
                  });
          }
          根源就在于 ExecutorCompletionService 結(jié)果沒調(diào)用take、poll方法。
          正確的寫法如下所示:
          public static void test() throws InterruptedException, ExecutionException {
              Executor executor = Executors.newFixedThreadPool(3);
              CompletionService<String> service = new ExecutorCompletionService<>(executor);
              service.submit(new Callable<String>() {
                  @Override
                  public String call() throws Exception {
                      return "HelloWorld--" + Thread.currentThread().getName();
                  }
              });
              service.take().get();
          }
          一行代碼引發(fā)的血案,而且不容易被發(fā)現(xiàn)。因?yàn)?OOM 是一個(gè)內(nèi)存緩慢增長(zhǎng)的過程,稍微粗心大意就會(huì)忽略。如果是這個(gè)代碼塊的調(diào)用量少的話,很可能幾天甚至幾個(gè)月后暴雷。
          操作人回滾或者重啟服務(wù)器確實(shí)是最快的方式。但是如果不是事后快速分析出 OOM 的代碼,而且不巧回滾的版本也是帶 OOM 代碼的,就比較悲催了。如剛才所說,流量小了、回滾或者重啟都可以釋放內(nèi)存;但是流量大的情況下,除非回滾到正常的版本,否則 GG。

          探尋問題根源

          為了更好的理解 ExecutorCompletionService 的 “套路”,我們用 ExecutorService 來作為對(duì)比,可以讓我們更好地清楚什么場(chǎng)景下用 ExecutorCompletionService
          先看 ExecutorService 代碼(建議下載后自己跑一跑)
          public static void test1() throws Exception{
              ExecutorService executorService = Executors.newCachedThreadPool();
              ArrayList<Future<String>> futureArrayList = new ArrayList<>();
              System.out.println("公司讓你通知大家聚餐 你開車去接人");
              Future<String> future10 = executorService.submit(() -> {
                  System.out.println("總裁:我在家上大號(hào) 我最近拉肚子比較慢 要蹲1個(gè)小時(shí)才能出來 你等會(huì)來接我吧");
                  TimeUnit.SECONDS.sleep(10);
                  System.out.println("總裁:1小時(shí)了 我上完大號(hào)了。你來接吧");
                  return "總裁上完大號(hào)了";
              });
              futureArrayList.add(future10);
              Future<String> future3 = executorService.submit(() -> {
                  System.out.println("研發(fā):我在家上大號(hào) 我比較快 要蹲3分鐘就可以出來 你等會(huì)來接我吧");
                  TimeUnit.SECONDS.sleep(3);
                  System.out.println("研發(fā):3分鐘 我上完大號(hào)了。你來接吧");
                  return "研發(fā)上完大號(hào)了";
              });
              futureArrayList.add(future3);
              Future<String> future6 = executorService.submit(() -> {
                  System.out.println("中層管理:我在家上大號(hào)  要蹲10分鐘就可以出來 你等會(huì)來接我吧");
                  TimeUnit.SECONDS.sleep(6);
                  System.out.println("中層管理:10分鐘 我上完大號(hào)了。你來接吧");
                  return "中層管理上完大號(hào)了";
              });
              futureArrayList.add(future6);
              TimeUnit.SECONDS.sleep(1);
              System.out.println("都通知完了,等著接吧。");
              try {
                  for (Future<String> future : futureArrayList) {
                      String returnStr = future.get();
                      System.out.println(returnStr + ",你去接他");
                  }
                  Thread.currentThread().join();
              } catch (Exception e) {
                  e.printStackTrace();
              }
          }
          三個(gè)任務(wù),每個(gè)任務(wù)執(zhí)行時(shí)間分別是 10s、3s、6s 。通過 JDK 線程池的 submit 提交這三個(gè) Callable 類型的任務(wù)。
          • 第一步:主線程把三個(gè)任務(wù)提交到線程池里面去,把對(duì)應(yīng)返回的 Future 放到 List 里面存起來,然后執(zhí)行“都通知完了,等著接吧。”這行輸出語句;

          • 第二步:在循環(huán)里面執(zhí)行 future.get() 操作,阻塞等待。

          最后結(jié)果如下:
          先通知到總裁,也是先接總裁 足足等了 1 個(gè)小時(shí),接到總裁后再去接研發(fā)和中層管理,盡管他們?cè)缇屯晔聝毫耍驳玫瓤偛蒙贤陰鶁~
          耗時(shí)最久的-10s 異步任務(wù)最先進(jìn)入 list 執(zhí)行。所以在循環(huán)過程中獲取這個(gè) 10 s的任務(wù)結(jié)果的時(shí)候,get 操作會(huì)一直阻塞,直到 10s 異步任務(wù)執(zhí)行完畢。即使 3s、5s 的任務(wù)早就執(zhí)行完了也得阻塞,等待 10s 任務(wù)執(zhí)行完。
          看到這里,尤其是做網(wǎng)關(guān)業(yè)務(wù)的同學(xué)可能會(huì)產(chǎn)生共鳴。一般來說,網(wǎng)關(guān) RPC 會(huì)調(diào)用下游 N 多個(gè)接口,如下圖:
          如果都按照 ExecutorService 這種方式,并且恰巧前幾個(gè)任務(wù)調(diào)用的接口耗時(shí)比較久,同時(shí)阻塞等待,那就比較悲催了。所以 ExecutorCompletionService 應(yīng)景而出。它作為任務(wù)線程的合理管控者,“任務(wù)規(guī)劃師”的稱號(hào)名副其實(shí)。
          相同場(chǎng)景 ExecutorCompletionService 代碼:
          public static void test2() throws Exception {
              ExecutorService executorService = Executors.newCachedThreadPool();
              ExecutorCompletionService<String> completionService = new ExecutorCompletionService<>(executorService);
              System.out.println("公司讓你通知大家聚餐 你開車去接人");
              completionService.submit(() -> {
                  System.out.println("總裁:我在家上大號(hào) 我最近拉肚子比較慢 要蹲1個(gè)小時(shí)才能出來 你等會(huì)來接我吧");
                  TimeUnit.SECONDS.sleep(10);
                  System.out.println("總裁:1小時(shí)了 我上完大號(hào)了。你來接吧");
                  return "總裁上完大號(hào)了";
              });
              completionService.submit(() -> {
                  System.out.println("研發(fā):我在家上大號(hào) 我比較快 要蹲3分鐘就可以出來 你等會(huì)來接我吧");
                  TimeUnit.SECONDS.sleep(3);
                  System.out.println("研發(fā):3分鐘 我上完大號(hào)了。你來接吧");
                  return "研發(fā)上完大號(hào)了";
              });
              completionService.submit(() -> {
                  System.out.println("中層管理:我在家上大號(hào)  要蹲10分鐘就可以出來 你等會(huì)來接我吧");
                  TimeUnit.SECONDS.sleep(6);
                  System.out.println("中層管理:10分鐘 我上完大號(hào)了。你來接吧");
                  return "中層管理上完大號(hào)了";
              });
              TimeUnit.SECONDS.sleep(1);
              System.out.println("都通知完了,等著接吧。");
              //提交了3個(gè)異步任務(wù))
              for (int i = 0; i < 3; i++) {
                  String returnStr = completionService.take().get();
                  System.out.println(returnStr + ",你去接他");
              }
              Thread.currentThread().join();
          }
          跑完結(jié)果如下:
          這次就相對(duì)高效了一些。雖然先通知的總裁,但是根據(jù)大家上大號(hào)的速度,誰先拉完先去接誰,不用等待上大號(hào)最久的總裁了(現(xiàn)實(shí)生活里建議采用第一種,不等總裁的后果 emmm 哈哈哈)。
          放在一起對(duì)比下輸出結(jié)果:
          兩段代碼的差異非常小 獲取結(jié)果的時(shí)候 ExecutorCompletionService 使用了:
          completionService.take().get();
          為什么要用 take() 然后再 get() 呢?
          我們看看源碼:
          CompletionService 接口以及接口的實(shí)現(xiàn)類
          1、ExecutorCompletionService 是 CompletionService 接口的實(shí)現(xiàn)類
          2、接著跟一下 ExecutorCompletionService 的構(gòu)造方法。
          可以看到入?yún)⑿枰獋饕粋€(gè)線程池對(duì)象,默認(rèn)使用的隊(duì)列是 LinkedBlockingQueue,不過還有另外一個(gè)構(gòu)造方法可以指定隊(duì)列類型,如下兩張圖,有兩個(gè)構(gòu)造方法。默認(rèn) LinkedBlockingQueue 的構(gòu)造方法。
          可選隊(duì)列類型的構(gòu)造方法:
          3、Submit 任務(wù)提交的兩種方式,都是有返回值的,我們例子中用到的就是第一種 Callable 類型的方法。
          4、對(duì)比ExecutorService 和 ExecutorCompletionService 的 submit 方法可以看出區(qū)別。
          5、差異就在 QueueingFuture。
          這個(gè)到底作用是啥,我們繼續(xù)跟進(jìn)去看:
          • QueueingFuture 繼承自 FutureTask,而且紅線部分標(biāo)注的位置,重寫了 done() 方法;

          • 把 task 放到 completionQueue 隊(duì)列里面。當(dāng)任務(wù)執(zhí)行完成后,task 就會(huì)被放到隊(duì)列里面去了;

          • 此時(shí)此刻,completionQueue 隊(duì)列里面的 task 都是已經(jīng) done() 完成了的 task。而這個(gè) task 就是我們拿到的一個(gè)個(gè)的 future 結(jié)果;

          • 如果調(diào)用 completionQueue 的 task 方法,會(huì)阻塞等待任務(wù)。等到的一定是完成了的 future,我們調(diào)用  .get() 方法 就能立馬獲得結(jié)果。

          看到這里,相信大家伙都應(yīng)該多少明白點(diǎn)了:
          • 我們?cè)谑褂?nbsp;ExecutorService submit 提交任務(wù)后需要關(guān)注每個(gè)任務(wù)返回的 future。然而 CompletionService 對(duì)這些 future 進(jìn)行了追蹤,并且重寫了 done 方法,讓你等的 completionQueue 隊(duì)列里面一定是完成了的 task;

          • 作為網(wǎng)關(guān) RPC 層,我們不用因?yàn)槟骋粋€(gè)接口的響應(yīng)慢拖累所有的請(qǐng)求,可以在處理最快響應(yīng)的業(yè)務(wù)場(chǎng)景里使用 CompletionService

          但是請(qǐng)注意!也是本次事故的核心問題。
          只有調(diào)用了 ExecutorCompletionService 下面的 3 個(gè)方法的任意一個(gè)時(shí),阻塞隊(duì)列中的 task 執(zhí)行結(jié)果才會(huì)從隊(duì)列中移除掉,釋放堆內(nèi)存。
          由于該業(yè)務(wù)不需要使用任務(wù)的返回值,沒有調(diào)用 take、poll 方法,從而導(dǎo)致沒有釋放堆內(nèi)存。堆內(nèi)存會(huì)隨著調(diào)用量的增加一直增長(zhǎng)。
          所以,業(yè)務(wù)場(chǎng)景中不需要使用任務(wù)返回值的,別沒事兒使用 CompletionService。假如使用了,記得一定要從阻塞隊(duì)列中移除掉 task 執(zhí)行結(jié)果,避免 OOM!

          總結(jié)

          知道事故的原因,我們來總結(jié)下方法論。畢竟孔子他老人家說過:自省吾身,常思己過,善修其身!
          上線前
          • 嚴(yán)格的代碼 review 習(xí)慣,一定要交給 back 人去看,畢竟自己寫的代碼自己是看不出問題的,相信每個(gè)程序猿都有這個(gè)自信;

          • 上線記錄:備注好上一個(gè)可回滾的包版本(給自己留一個(gè)后路);

          • 上線前確認(rèn)回滾后,業(yè)務(wù)是否可降級(jí)。如果不可降級(jí),一定要嚴(yán)格拉長(zhǎng)這次上線的監(jiān)控周期。

          上線后
          • 持續(xù)關(guān)注內(nèi)存增長(zhǎng)情況(這部分極容易被忽略,大家對(duì)內(nèi)存的重視度不如 CPU 使用率);

          • 持續(xù)關(guān)注 CPU 使用率增長(zhǎng)情況

          • GC 情況、線程數(shù)是否增長(zhǎng)、是否有頻繁的 Full GC 等;

          • 關(guān)注服務(wù)性能報(bào)警,TP99、999 、MAX 是否出現(xiàn)明顯的增高。

          <END>

          推薦閱讀:

          為什么騰訊阿里等互聯(lián)網(wǎng)大廠誕生的好產(chǎn)品越來越少?
          9 個(gè) Java 性能調(diào)優(yōu)技巧,YYDS!
          互聯(lián)網(wǎng)初中高級(jí)大廠面試題(9個(gè)G)

          內(nèi)容包含Java基礎(chǔ)、JavaWeb、MySQL性能優(yōu)化、JVM、鎖、百萬并發(fā)、消息隊(duì)列、高性能緩存、反射、Spring全家桶原理、微服務(wù)、Zookeeper......等技術(shù)棧!

          ?戳閱讀原文領(lǐng)取!                                  朕已閱 

          瀏覽 20
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操阴道福利片视频 | 国产一线二线三线在线 | 国产成人三级在线观看视频 | 俺来也我也去www官网 | 日本午夜福利片 |