このサーバは、メールの転送設定をして、置いておくサーバになってまして。全体的にはWebサーバ類もまとめて、1枚のdocker composeでサイトのほぼ全てが構築されている。
メールはpostfixのコンテナを立ててやってるんですが、最近イメージを更新したタイミングで落ちていることに気づかずに2週間くらい放置されていました。restart設定で起動→失敗のループが続いていた。
この起動ループは手加減してやってくれるので、急激に負荷が上がったということもなく、害は少ない。少ないけど、多くのSPAMメールを受け取れなかったから、良くない状況ではあった。なんかおかしいと思ったんだよね。それを思うまでに2週間を要したのは恥ずかしい。
というわけで監視を入れようと思った。このサーバの通知はntfy.shを使っていて、syslogのパターンを見てunattended-updateでリブートが予定されている時に通知する、といった機能は入っている。コンテナの死活監視はどうするか。監視と通知のシステムを入れるのがいいんだけど、サーバ自体がスペック低いやつを使ってるから、簡易なものにしたい。