サーバーの負荷調査に関する質問です。

さくらのVPSでサーバーを1台借りています。これが時折(1ヶ月に1回とか)、唐突にCPU負荷が跳ね上がりURLを叩いても応答がなくなってしまいます。(トラフィックは特に変わらず)

これの原因調査を行いたいのですが、気付いた時にはSSHすら繋げないほどのCPU負荷となっており、リアルタイムで情報収集ができません。
仮想サーバーをさくらVPSの管理画面から強制的に再起動すれば、すぐに状況は改善されるのですが、それでもう平常時に戻ってしまうので、いったい何が起きていたのかが特定できない状態です。

/var/log にあるログを色々見てみるのですが、いくつか症状が発生した時間帯に近いところに異常なログは見つけているのですが、いずれも高負荷による異常なログであって高負荷の原因となるようなログではないように見受けられます。

こういったケースの場合、どこを調べるべき・疑うべきなどの定番の作業はありますでしょうか。もしくは次に同様の事象が発生したときに、確実に原因を特定するためにとれる対策などありますでしょうか。

お分かりになることがありましたら、なんでも結構ですのでお教えいただければ幸いです。

回答の条件
  • 1人10回まで
  • 登録:
  • 終了:2012/03/01 11:33:50
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:oil999 No.1

回答回数1728ベストアンサー獲得回数320

ポイント300pt

自ノードの負荷を監視するなら、logwatchを導入してみてはいかがでしょう。
http://www.happyquality.com/2012/02/02/1924.htm

ただ、/var/log から高負荷の原因が見つかっていないとすると、他ノードに原因があるのかもしれません。その場合、ユーザーサイドではどうにもできません。
logwatchで時系列データをとって、システム管理者に相談した方が良いかもしれません。

id:n_maco2

これはよさそうですね。私の勉強不足でログに原因が見つけられないだけの可能性も高いので、サポートとしてこれを入れてみたいと思います。アドバイスいただきありがとうございました!

2012/02/29 10:42:59

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません