解決 Grafana Node_exporter 網(wǎng)卡流量監(jiān)控不準(zhǔn)確

最近服務(wù)器添加監(jiān)控和報警后,發(fā)現(xiàn)服務(wù)器網(wǎng)卡流量監(jiān)控不準(zhǔn)確。因為我服務(wù)本身就 10M 帶寬,但是這里的上行和下行帶寬竟然高達(dá) 30M。這里的模板我使用的是大家用的比較多的8919模板

問題分析
首先我這里將 grafana 的出圖語句復(fù)制下來進(jìn)行分析

我們復(fù)制監(jiān)控項的語句到 Prometheus 上進(jìn)行查看

我沒有添加任何規(guī)則,發(fā)現(xiàn)獲取的網(wǎng)卡流量包含docker、lo以及eth的流量
解決問題
發(fā)現(xiàn)了問題后,我們需要修改一下語句,將 docker 網(wǎng)卡以及 lo 或者其它本地流量的網(wǎng)卡進(jìn)行過濾(node_network_receive_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'} )

過濾完成后,修改 grafana 語句
上傳語句
max(rate(node_network_transmit_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'}[$interval]))?by?(instance)
下載語句
max(rate(node_network_receive_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'}?[$interval]))?by?(instance)
修改完成后,我們發(fā)現(xiàn)監(jiān)控的值是沒有問題了,連接數(shù)和上行下行帶寬也對的上,這個之前我也測試過了。

這些改完實際上到此為止是已經(jīng)結(jié)束了,但是我發(fā)現(xiàn)還有一個問題,就是本來 grafana 模板給的是 30M 圖標(biāo)變黃,1000M 進(jìn)行告警。但是目前我本地服務(wù)器的網(wǎng)絡(luò)大部分是處于 5-10M 之間。也就是基本上跑滿我?guī)?,grafana 出圖也不會告警。接下來我們就來修改 grafana 顏色變更閾值
右邊下滑到最下面,這里監(jiān)控的單位是字節(jié),也就是我們要設(shè)置 3M-10M 之間的字節(jié)

修改
換算單位
3?M=3145728?字節(jié)10M?=10485760?字節(jié)
將下面 grafana 出圖單位改成3145728,10485760

我這里將上下行都改成這個,具體按照實際情況進(jìn)行修改
接下來點(diǎn)擊Apply更新

查看
目前來看已經(jīng)恢復(fù)正常,左邊為寶塔控制面板的網(wǎng)絡(luò)監(jiān)控,屬于實時監(jiān)控。右邊為 grafana 出圖監(jiān)控,因為 node_exporter 屬于靜態(tài)監(jiān)控,不能算是實時更新,受網(wǎng)絡(luò)上報的影響。大小差距不大

原文鏈接:https://i4t.com/5284.html


你可能還喜歡
點(diǎn)擊下方圖片即可閱讀

云原生是一種信仰???
關(guān)注公眾號
后臺回復(fù)?k8s?獲取史上最方便快捷的 Kubernetes 高可用部署工具,只需一條命令,連 ssh 都不需要!


點(diǎn)擊?"閱讀原文"?獲取更好的閱讀體驗!
發(fā)現(xiàn)朋友圈變“安靜”了嗎?


