WEBサーバ(Apache2)のhtdocディレクトリをもう一つのWEBサーバにnfsマウント(noatime)して、WEBサーバの負荷分散を2台で行っています。

ある程度負荷が掛かると希にNFSのクライアント側のLoadAverageが50付近まで上がり、突然ハングアップします。
/var/log/messagesにも特にエラーが出ませんので、なかなか原因が特定しにくい状態です。

こちらはどういった原因で起こるのでしょうか?
対策方法をもしご存じでしたら教えて頂けますと幸いです。

◆ アクセス数:
600万PV程

◆ サーバ構成:
LoadBalancer
├WEBサーバ&NFSサーバ
└WEBサーバ&NFSクライアント
その他DBサーバがあります。

OS: CentOS 5.3 64bit
スペック:共にXeon 2.13GHz メモリ4GB Gigabit-Lan
共有しているディスク容量:580M

不足情報ございましたらコメント欄にて指摘お願いします。

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2009/08/20 14:50:02
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

回答1件)

id:morethanjustase No.1

回答回数35ベストアンサー獲得回数5

ポイント60pt

RedHatのBugzillaを検索してみました。

原因としてはRHELが持つバグで、以下の事象が当てはまりそうです。


Hang with RHEL5 used as NFSV4 client when fsx bench running

https://bugzilla.redhat.com/show_bug.cgi?id=226756


「Client running RHEL5 is a x86_64 four CPUs 2Gmemory」ということなので、

ko-takadaさんの環境と発生条件が近いと思われます。


残念ながら、回避策は見つけることができませんでした。

RedHatのサポート契約があれば、サポートに問い合わせできるのでしょうが…。

以上、参考になれば幸いです。

  • id:morethanjustase
    NFSクライアントでのマウントオプションはどう設定されていますか?
    noatimeオプションだけでしょうか。
    mountコマンドの出力結果などを貼って頂ければと。
  • id:ko-takada
    お返事が大変遅くなり申し訳ございません。
    ご紹介のあったBugzillaを拝見しましてNFSを切り離しても問題が発生したため難航しておりました。
    どうやらlibxml2に不正な文字列を渡すことによって発生するクラッシュが原因でした…。

    今回は以下のオプションでマウントしております。こちらは特に問題無い表記でしょうか?
    念のため、ご確認頂けると幸いです。

    fstabの該当箇所:
    hostname:/home/somedirectory /home/somedirectory nfs hard,intr,noatime 0 0

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません