你過來,我給你看個寶貝
點擊上方藍色字體,選擇“設為星標”

以下是2020年上半年《大數(shù)據(jù)技術與架構》發(fā)表文章合集,請收藏。
? ? ? ?
Flink1.10和Hive集成一些需要注意的點 Flink事件時間、水印和遲到數(shù)據(jù)處理 Flink使用Broadcast State實現(xiàn)流處理配置實時更新 實戰(zhàn) | MySQL Binlog通過Canal同步HDFS Flink最難知識點再解析 | 時間/窗口/水印/遲到數(shù)據(jù)處理 Hive on Spark參數(shù)調(diào)優(yōu)姿勢小結 Flink Logback日志與郵件報警配置 Kafka設計-恰好一次和事務消息 基于Canal和Kafka實現(xiàn)MySQL的Binlog近實時同步 一個基于RabbitMQ的可復用的事務消息方案 Spark性能優(yōu)化總結 Flink常見異常和錯誤信息小結 Spark SQL快速入門系列之Hive 實時計算雙星-Flink VS Spark 部署模式對比 PID算法和Spark實現(xiàn)反壓的原理 關于SparkSQL的開窗函數(shù),你應該知道這些! Spark SQL是如何選擇join策略的? Spark on Hive & Hive on Spark,傻傻分不清楚 來看看一個大二學生的Spark練習題 Flink 自定義觸發(fā)器實現(xiàn)帶超時時間的 CountWindow Spark Kafka 基于Direct自己管理offset Apache Kylin | 麒麟出沒,必有祥瑞 Flink 參數(shù)配置和常見參數(shù)調(diào)優(yōu) 利用InfluxDB+Grafana搭建Flink on YARN作業(yè)監(jiān)控大屏 網(wǎng)站日志實時分析之Flink處理實時熱門和PVUV統(tǒng)計 大數(shù)據(jù)量下的集合過濾—Bloom Filter 實時數(shù)倉鏈路分享:kafka =>SparkStreaming=>kudu集成kerberos Flink CEP 原理和案例詳解 ProcessFunction:Flink最底層API使用踩坑記錄 Flink 1.10之改進的TaskManager內(nèi)存模型與配置 打通實時流處理log4j-flume-kafka-structured-streaming 如何設計實時數(shù)據(jù)平臺(設計篇) 如何設計實時數(shù)據(jù)平臺(技術篇) SparkSQL內(nèi)核解析-執(zhí)行全過程概述 SparkSQL內(nèi)核解析之邏輯計劃 Flink-1.10中的StreamingFileSink相關特性 Kafka下的生產(chǎn)消費者模式與訂閱發(fā)布模式 Kafka+Spark Streaming如何保證exactly once語義 Flink之實時統(tǒng)計熱門商品的TopN SparkSQL的自適應執(zhí)行-Adaptive Execution Kafka KSQL實戰(zhàn) ELK+FileBeat+Kafka分布式系統(tǒng)搭建圖文教程 HDFS應用場景、原理、基本架構及使用方法 數(shù)據(jù)模型?法復?,歸根結底還是設計問題 Hadoop支持Lzo壓縮配置及案例 快看 | Java連接集成Kerberos的HA HDFS方案 Kafka消費者分區(qū)分配策略及自定義分配策略 Spark Streaming整合log4j、Flume與Kafka的案例 面試必知的 Spark SQL 幾種 Join 實現(xiàn) Flink在大規(guī)模狀態(tài)數(shù)據(jù)集下的checkpoint調(diào)優(yōu) Write-Ahead Log(WAL預寫日志)的工作原理 Kafka常見的導致重復消費原因和解決方案 Spark-submit 參數(shù)調(diào)優(yōu)完整攻略 Kafka數(shù)據(jù)可靠性保證三板斧-ACK/ISR/HW Spark常見錯誤問題匯總 HBase操作組件:Hive、Phoenix、Lealone Redis系列 | 緩存穿透、擊穿、雪崩、預熱、更新、降級 Kafka工作流程及文件存儲機制 Redis6.0主從、哨兵、集群搭建和原理 Spark Streaming官方編程指南 【從0開始の全記錄】Flume+Kafka+Spark+Spring Boot 統(tǒng)計網(wǎng)頁訪問量項目 Spark+Kudu的廣告業(yè)務項目實戰(zhàn)筆記(一) 大數(shù)據(jù)入門:Spark+Kudu的廣告業(yè)務項目實戰(zhàn)筆記(二) 大數(shù)據(jù)入門:Spark+Kudu的廣告業(yè)務項目實戰(zhàn)筆記(三) 大數(shù)據(jù)入門:Spark+Kudu的廣告業(yè)務項目實戰(zhàn)筆記(四) 大數(shù)據(jù)入門:Spark+Kudu的廣告業(yè)務項目實戰(zhàn)筆記(五) 大數(shù)據(jù)入門:Spark+Kudu的廣告業(yè)務項目實戰(zhàn)筆記(六) Flink 1.11新特性之SQL Hive Streaming簡單示例 SparkSQL 整體運行架構和底層實現(xiàn)
《一文了解數(shù)據(jù)庫和數(shù)據(jù)倉庫》 數(shù)據(jù)倉庫系統(tǒng)的實現(xiàn)與使用(含OLAP重點講解) Data Lake 三劍客—Delta、Hudi、Iceberg 對比分析 數(shù)據(jù)也有溫度?Elasticsearch 5.x 版本中的冷熱數(shù)據(jù)架構 數(shù)據(jù)冷熱分離技術 冷熱數(shù)據(jù)分離 | Alluxio元數(shù)據(jù)管理策略 數(shù)據(jù)之眼 | 數(shù)據(jù)探查服務的設計 元數(shù)據(jù)存儲系統(tǒng)管理演變升級 數(shù)據(jù)湖 | 一文讀懂Data Lake的概念、特征、架構與案例 用戶行為數(shù)據(jù)采集系統(tǒng) 創(chuàng)業(yè)公司數(shù)據(jù)倉庫的建設 Kylin使用Spark構建Cube 實時統(tǒng)計分析系統(tǒng)-Apache Druid Elasticsearch索引和檢索優(yōu)化與壓測監(jiān)控總結
我們常說的海量小文件的根源是什么? 如果你在準備面試,好好看看這130道題 你可能需要知道的Kafka面試題與部分答案整理 28道關于ZooKeeper的面試題 【數(shù)據(jù)白皮書重磅分享】推薦|埋點|用研|標簽 一份優(yōu)秀的簡歷該長成什么樣 1萬2千字長文助力春招 | Netty面試篇 消息隊列面面觀 關于技術面試的一點點體會 早點建立自己的知識體系 Filter(過濾)|Project(映射)|Pushdowns(謂詞下推) 閱讀源碼|Spark 與 Flink 的 RPC 實現(xiàn) 三萬六千字通關MySQL面試 深入理解CAP理論和適用場景 HDFS的SecondaryNameNode作用,你別答錯了 Kafka三種可視化監(jiān)控管理工具Monitor/Manager/Eagle Kafka體系架構詳細分解 Kafka筆記—可靠性、冪等性和事務 Kafka體系架構詳細分解 Kafka面試題系列(進階篇) Kafka面試題系列(基礎篇) 面試知識點 | Kafka的數(shù)據(jù)存儲與索引設計 面試必考點:HBase Compaction機制 ZooKeeper需要關注的點 MySQL中InnoDB及索引深入剖析 Kafka面試題系列(進階篇2) MySql的Binlog日志工具分析:Canal、Maxwell、Databus、DTS Redis中的管道Pipeline操作 查看YARN任務日志的幾種方式 Yarn 使用 Cgroup 實現(xiàn)任務資源限制 分析和定位線上作業(yè) OOM 問題利器-MAT 淺談ZooKeeper中Kafka相關信息的存儲 JVM架構體系與GC命令小總結

版權聲明:
文章不錯?點個【在看】吧!??
評論
圖片
表情




