プロセス監視

【プロセス監視とは】
監視対象のプロセスが落ちていないかプロセスを監視する。基本的に常駐監視とし、監視インターバル毎(1分毎とか)にチェックする。
 
監視ソフトウェアを使う場合も多いが、アクティブ・スタンバイ構成のサーバだとアクティブ側のみで稼働するプロセスがあり、サービス機の切り替えもあったりするため、既存の監視ソフトでは対応しきれない場合もある。そのためアクティブ・スタンバイ両サーバともに常時起動しているプロセスのみ監視ソフトウェアで監視し、クラスターの管理対象のミドルウェアのプロセスは、プロジェクト独自のプロセス監視シェルで監視するという風に使い分けることも多い。また実際に運用する際はプロセス監視シェルのプロセス監視も別途考慮したほうがよい。
 
【プロセス監視をシェルで実装する時の注意点】
①監視のON・OFFについて
基本的に複数のミドルウェアのプロセスを監視することになると思うが、それぞれのミドルウェアの監視のON・OFFを個別にできるようにすべき。そうしないと、一時的に監視抑止したいプロセスがある場合にプロセス監視シェル自体を停止させるしかなく、その他のプロセスの監視が止まってしまう。
 
②連続検知を抑止するか
プロセスダウンはエラーがあればなるべく早く対応する必要があるため、監視インターバルは短めにする必要がある。その場合、例えば監視インターバルを1分にすると、プロセスダウンを復旧するまで1分間隔でエラーを出し続けることになるため、連続検知を抑止するかどうかを考える必要がある。
 
↓ スクリプトの実装例はこちら
http://g-network.boo.jp/wiki/2018/08/post-1472/ 

スポンサーリンク
勉強wikiの下部広告
  • このエントリーをはてなブックマークに追加
スポンサーリンク
勉強wikiの下部広告

コメントをどうぞ

メールアドレスが公開されることはありません。

CAPTCHA