落ちた話 (2012年1月18日)

久々にこのサーバが落ちました。uptimeは約40日。40日前はglibcのバージョンアップなどが行われたため、手動でrebootした。

今回もENOMEMですね。このときと同じような現象です。約1日ずっと落ちてました。最初にspamassassinが落ちたらしく、迷惑メールが大量にメールボックスに入るようになったのがきっかけで、18日の夜には問題に気づいていましたが不覚にも寝落ちしてしまい、19日の朝はもうsshで入れない状態。管理画面から再起動をかけましたが、起動しませんでした。19日の夜に再度の再起動をかけると戻りました。

メモリは以下のとおりスカスカですが、ENOMEMでほとんど何も動かなくなる。

memory-week

VPSの場合はこういうのはしょうがないのかもしれませんね。あとはどう気づいて、動く間にrebootなり重要度の低いプロセスを落とすなり管理者にメールで通知するか、という話になるのかな。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です