<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          看完這篇文章,你就明白運維監(jiān)控體系了

          共 2092字,需瀏覽 5分鐘

           ·

          2022-01-04 19:20

          總結歸納運維工作中的監(jiān)控內(nèi)容。

          監(jiān)控目標

          明白監(jiān)控的重要性以及使用監(jiān)控要實現(xiàn)的業(yè)務目標

          通常包括以下三點:

          • 對目標系統(tǒng)進行實時監(jiān)控

          • 監(jiān)控可以實時反饋目標系統(tǒng)的當前狀態(tài) 目標系統(tǒng)硬件、軟件、業(yè)務是否正常、目前處于何種狀態(tài)

          • 保證目標系統(tǒng)可靠性,業(yè)務可以持續(xù)穩(wěn)定運行 有問題第一時間反饋出來,便于運維人員處理

          監(jiān)控方法

          • 了解監(jiān)控對象 例如:CPU如何工作?
          • 性能基準指標 例如: CPU使用率、負載、用戶態(tài)、內(nèi)核態(tài)、上下文切換
          • 報警閾值定義 例如: CPU負載高的定義,內(nèi)核態(tài)、用戶態(tài)多少算高
          • 故障處理流程 如何更高效處理故障的流程

          監(jiān)控核心

          • 發(fā)現(xiàn)問題
          • 定位問題
          • 解決問題
          • 總結問題,對故障原因及問題防范進行歸納總結,避免以后重復出現(xiàn)

          監(jiān)控工具

          • 老牌監(jiān)控

            • Cacti

            • Nagios

            • smokeping

          • 流行監(jiān)控

            • Zabbix

            • OpenFalcon

            • Prometheus+Grafana

            • 滴滴開源夜鶯Nightingale

            • smartping(專用于網(wǎng)絡監(jiān)控)

            • LEPUS天兔(專用于監(jiān)控數(shù)據(jù)庫)

            • 自研

          • 第三方監(jiān)控

            • 監(jiān)控寶

            • 聽云

            • newrelic

          監(jiān)控流程

          • 采集
          通過SNMP、Agent、ICMP、SSH、IPMI等對系統(tǒng)進行數(shù)據(jù)采集
          • 存儲
          各類數(shù)據(jù)庫服務,MySQL、PostgreSQL
          • 分析
          提供圖形及時間線情況信息,方便我們定位故障所在
          • 展示
          指標信息、指標趨勢展示
          • 報警
          電話、郵件、微信、短信、報警升級機制
          • 處理
          故障級別判定,找響應人員進行快速處理

          監(jiān)控指標

          硬件監(jiān)控

          • 機器硬件:CPU溫度、物理磁盤、虛擬磁盤、主板溫度、磁盤陣列
            IPMI工具無法獲取到硬件的狀態(tài),可以借助MegaCli工具探測Raid磁盤隊列狀態(tài)
            https://www.ibm.com/developerworks/cn/linux/l-ipmi/

          系統(tǒng)監(jiān)控

          • 主機存活
          • CPU、內(nèi)存、硬盤、使用率
          • inode
          • 負載
          • 網(wǎng)卡出入帶寬
          • TCP連接數(shù)
          • 磁盤讀寫、只讀

          應用監(jiān)控

          MySQL

          • 服務可用性

          • 內(nèi)存使用率

          • 磁盤使用

          • 主從不同步及延遲

          • 備份情況

          • 連接數(shù)

          Redis、Redis Cluster

          • 負載

          • 內(nèi)存使用率

          • 連接數(shù)量

          • qps

          Nginx

          • 狀態(tài)碼

          • 連接狀態(tài)信息

          • RabbitMQ

          • PHP-FPM

          • OpenLDAP

            • 接入IP

            • 調(diào)用次數(shù)

          • Zimbra

          • OpenVPN

            • 版本信息、當前在線

            • 用戶、分配IP、客戶端連接IP、通過IP獲取地址位置、接收發(fā)送流量 連接時間 時長 連接ID

          • ELK

          • Graylog

          • GitLab

          • Jenkins

          • MongoDB

          • HAproxy

          網(wǎng)絡監(jiān)控

          • 網(wǎng)絡質(zhì)量

          • 公網(wǎng)出口

          • 專線帶寬

          • 網(wǎng)絡設備

          流量分析

          日志監(jiān)控

          安全監(jiān)控

          • URL、API監(jiān)控

          • 自研

          • 阿里云方案

          性能監(jiān)控(APM)java|php|go|nodejs|分布式鏈路追蹤

          • PinPoint

          • Zipkin

          • SkyWalking

          • CAT、Jaeger

          業(yè)務監(jiān)控

          電商業(yè)務為例:

          • 每分鐘產(chǎn)生多少訂單

          • 每分鐘注冊多少用戶

          • 每分鐘多少活躍用戶

          • 每天有多少推廣活動

          • 推廣活動引入多少用戶

          • 推廣活動引入多少流量

          • 推廣活動引入多少利潤

          其他

          • SSL證書監(jiān)控

          • 存活性 進程是否還在,端口監(jiān)聽、Log滾動

          • 健康指標 MQ消息堆積量

          • 接口監(jiān)控 API成功率,延遲情況,QPS等等

          監(jiān)控報警

          • 郵件

          • 短信

          • 釘釘、微信、企業(yè)微信等其他即時通信軟件

          • 電話

          報警處理

          故障自愈: 服務器宕機自動啟動。利用軟件機制supervisor,systemd或者自定義腳本實現(xiàn)

          綜合監(jiān)控

          硬件監(jiān)控

          通過SNMP來進行路由器交換機的監(jiān)控、其他內(nèi)容使用IPMI實現(xiàn)。如果都是公有云,可以忽略這部分內(nèi)容。案例:Open-Falcon監(jiān)控H3C-ER3260G2路由器

          系統(tǒng)監(jiān)控

          服務監(jiān)控

          • 服務自帶

            • Nginx自帶status模塊

            • PHP相應status模塊

            • MySQL利用percona官方工具進行監(jiān)控

          • 通過自定義方法獲取數(shù)據(jù)

            • MySQL show global status xxx;

            • Redis info指令信息

          • 網(wǎng)絡監(jiān)控(混合云架構)

            • smokeping

            • smartping

          • 安全監(jiān)控

            • 云服務直接用云安全組即可,或者補充本機iptables

            • 硬件防火墻

            • Web服務使用Nginx+Lua實現(xiàn)Web層面的防火墻,或者Openresty

          • 日志監(jiān)控
            ELK、Graylog實現(xiàn)異常日志,錯誤日志關鍵字的監(jiān)控

          • 業(yè)務監(jiān)控
            確定監(jiān)控指標,監(jiān)控起來,業(yè)務不同各不相同

          • 流量分析
            建議使用百度統(tǒng)計,google統(tǒng)計,商業(yè),研發(fā)嵌入代碼實現(xiàn)。

            或者使用piwik

          • 可視化
            dashboard

          • 自動化監(jiān)控
            通過API,批量操作

          監(jiān)控總結

          完整的監(jiān)控系統(tǒng),需要對業(yè)務有詳盡的了解,軟件只是手段。

          來自:知乎,作者:聆聽幸福

          鏈接:https://zhuanlan.zhihu.com/p/342809838


          End

          《華為工程師Linux核心筆記》高清版.pdf

          ●?數(shù)據(jù)庫整理合集:含MySQL、Redis、Mongodb等常見數(shù)據(jù)庫教程

          ●?142道Linux面試題【務必拿走】

          ●?別讓運維太忙,一文詳解 Ansible 的自動化運維,提高工作效率



          點個在看你最好看


          瀏覽 71
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  www.人人摸 | 岛国一级A片 | 五月天综合网 | 国产精品久久久久久久激情视频 | 最新成人免费黄色视频 |