サーバーの負荷調査に関する質問です。
さくらのVPSでサーバーを1台借りています。これが時折(1ヶ月に1回とか)、唐突にCPU負荷が跳ね上がりURLを叩いても応答がなくなってしまいます。(トラフィックは特に変わらず)
これの原因調査を行いたいのですが、気付いた時にはSSHすら繋げないほどのCPU負荷となっており、リアルタイムで情報収集ができません。
仮想サーバーをさくらVPSの管理画面から強制的に再起動すれば、すぐに状況は改善されるのですが、それでもう平常時に戻ってしまうので、いったい何が起きていたのかが特定できない状態です。
/var/log にあるログを色々見てみるのですが、いくつか症状が発生した時間帯に近いところに異常なログは見つけているのですが、いずれも高負荷による異常なログであって高負荷の原因となるようなログではないように見受けられます。
こういったケースの場合、どこを調べるべき・疑うべきなどの定番の作業はありますでしょうか。もしくは次に同様の事象が発生したときに、確実に原因を特定するためにとれる対策などありますでしょうか。
お分かりになることがありましたら、なんでも結構ですのでお教えいただければ幸いです。