2023/12/08

自從pmg升到8版後
偶爾就會出現cpu跟ram過高的問題
然後机器就會卡住無法運作




之前本來已經有寫了一支檢查程式跑在mg裡
如果收不到外面連線的log
就重啟
可是今天的狀況更嚴重
當几後mg沒法執行任何程式了
只能從 host著手
定時檢查 mg的cpu狀態
如果有問題
就從host下指令重開了
163是lxc id


#!/bin/bash

k=`/usr/bin/pvesh get /cluster/resources|grep 163|cut -d '%' -f 1|awk '{print $NF}'|cut -d '.' -f 1`

#echo $k
if [ $k -gt 96 ]; then

        echo "cpu $k mg reboot"|/usr/bin/mail -s mg_cpu_high_reboot a@bc.de
        /usr/sbin/pct stop 163
        sleep 5
        /usr/sbin/pct start 163

fi

沒有留言: