性能爆表:SpringBoot利用ThreadPoolTaskExecutor批量插入百萬級數(shù)據(jù)實測!
共 6529字,需瀏覽 14分鐘
·
2024-06-29 08:00
因公眾號更改推送規(guī)則,請點“在看”并加“星標”第一時間獲取精彩技術分享
點擊關注#互聯(lián)網(wǎng)架構師公眾號,領取架構師全套資料 都在這里
上一篇:2T架構師學習資料干貨分享
開發(fā)目的:
提高百萬級數(shù)據(jù)插入效率。
采取方案:
利用ThreadPoolTaskExecutor多線程批量插入。
采用技術:
-
springboot2.1.1 -
mybatisPlus3.0.6 -
swagger2.5.0 -
Lombok1.18.4 -
postgresql -
ThreadPoolTaskExecutor
具體實現(xiàn)細節(jié)
application-dev.properties添加線程池配置信息
# 異步線程配置
# 配置核心線程數(shù)
async.executor.thread.core_pool_size = 30
# 配置最大線程數(shù)
async.executor.thread.max_pool_size = 30
# 配置隊列大小
async.executor.thread.queue_capacity = 99988
# 配置線程池中的線程的名稱前綴
async.executor.thread.name.prefix = async-importDB-
spring容器注入線程池bean對象
@Configuration
@EnableAsync
@Slf4j
public class ExecutorConfig {
@Value("${async.executor.thread.core_pool_size}")
private int corePoolSize;
@Value("${async.executor.thread.max_pool_size}")
private int maxPoolSize;
@Value("${async.executor.thread.queue_capacity}")
private int queueCapacity;
@Value("${async.executor.thread.name.prefix}")
private String namePrefix;
@Bean(name = "asyncServiceExecutor")
public Executor asyncServiceExecutor() {
log.warn("start asyncServiceExecutor");
//在這里修改
ThreadPoolTaskExecutor executor = new VisiableThreadPoolTaskExecutor();
//配置核心線程數(shù)
executor.setCorePoolSize(corePoolSize);
//配置最大線程數(shù)
executor.setMaxPoolSize(maxPoolSize);
//配置隊列大小
executor.setQueueCapacity(queueCapacity);
//配置線程池中的線程的名稱前綴
executor.setThreadNamePrefix(namePrefix);
// rejection-policy:當pool已經(jīng)達到max size的時候,如何處理新任務
// CALLER_RUNS:不在新線程中執(zhí)行任務,而是有調(diào)用者所在的線程來執(zhí)行
executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());
//執(zhí)行初始化
executor.initialize();
return executor;
}
}
創(chuàng)建異步線程 業(yè)務類
@Service
@Slf4j
public class AsyncServiceImpl implements AsyncService {
@Override
@Async("asyncServiceExecutor")
public void executeAsync(List<LogOutputResult> logOutputResults, LogOutputResultMapper logOutputResultMapper, CountDownLatch countDownLatch) {
try{
log.warn("start executeAsync");
//異步線程要做的事情
logOutputResultMapper.addLogOutputResultBatch(logOutputResults);
log.warn("end executeAsync");
}finally {
countDownLatch.countDown();// 很關鍵, 無論上面程序是否異常必須執(zhí)行countDown,否則await無法釋放
}
}
}
創(chuàng)建多線程批量插入具體業(yè)務方法
@Override
public int testMultiThread() {
List<LogOutputResult> logOutputResults = getTestData();
//測試每100條數(shù)據(jù)插入開一個線程
List<List<LogOutputResult>> lists = ConvertHandler.splitList(logOutputResults, 100);
CountDownLatch countDownLatch = new CountDownLatch(lists.size());
for (List<LogOutputResult> listSub:lists) {
asyncService.executeAsync(listSub, logOutputResultMapper,countDownLatch);
}
try {
countDownLatch.await(); //保證之前的所有的線程都執(zhí)行完成,才會走下面的;
// 這樣就可以在下面拿到所有線程執(zhí)行完的集合結果
} catch (Exception e) {
log.error("阻塞異常:"+e.getMessage());
}
return logOutputResults.size();
}
模擬2000003 條數(shù)據(jù)進行測試
多線程 測試 2000003 耗時如下:耗時1.67分鐘
本次開啟30個線程,截圖如下:
單線程測試2000003 耗時如下:耗時5.75分鐘
檢查多線程入庫的數(shù)據(jù),檢查是否存在重復入庫的問題:
根據(jù)id分組,查看是否有id重復的數(shù)據(jù),通過sql語句檢查,沒有發(fā)現(xiàn)重復入庫的問題
檢查數(shù)據(jù)完整性:
通過sql語句查詢,多線程錄入數(shù)據(jù)完整
測試結果
不同線程數(shù)測試:
總結
通過以上測試案列,同樣是導入2000003 條數(shù)據(jù),多線程耗時1.67分鐘,單線程耗時5.75分鐘。通過對不同線程數(shù)的測試,發(fā)現(xiàn)不是線程數(shù)越多越好,具體多少合適,網(wǎng)上有一個不成文的算法:
CPU核心數(shù)量*2 +2 個線程。
附:測試電腦配置
來源:azdebug.blog.csdn.net/article/details/
最后,關注公眾號互聯(lián)網(wǎng)架構師,在后臺回復:2T,可以獲取我整理的 Java 系列面試題和答案,非常齊全。
如果這篇文章對您有所幫助,或者有所啟發(fā)的話,幫忙掃描上方二維碼關注一下,您的支持是我堅持寫作最大的動力。
