ある程度負荷が掛かると希にNFSのクライアント側のLoadAverageが50付近まで上がり、突然ハングアップします。
/var/log/messagesにも特にエラーが出ませんので、なかなか原因が特定しにくい状態です。
こちらはどういった原因で起こるのでしょうか?
対策方法をもしご存じでしたら教えて頂けますと幸いです。
◆ アクセス数:
600万PV程
◆ サーバ構成:
LoadBalancer
├WEBサーバ&NFSサーバ
└WEBサーバ&NFSクライアント
その他DBサーバがあります。
OS: CentOS 5.3 64bit
スペック:共にXeon 2.13GHz メモリ4GB Gigabit-Lan
共有しているディスク容量:580M
不足情報ございましたらコメント欄にて指摘お願いします。
RedHatのBugzillaを検索してみました。
原因としてはRHELが持つバグで、以下の事象が当てはまりそうです。
Hang with RHEL5 used as NFSV4 client when fsx bench running
https://bugzilla.redhat.com/show_bug.cgi?id=226756
「Client running RHEL5 is a x86_64 four CPUs 2Gmemory」ということなので、
ko-takadaさんの環境と発生条件が近いと思われます。
残念ながら、回避策は見つけることができませんでした。
RedHatのサポート契約があれば、サポートに問い合わせできるのでしょうが…。
以上、参考になれば幸いです。
コメント(2件)
noatimeオプションだけでしょうか。
mountコマンドの出力結果などを貼って頂ければと。
ご紹介のあったBugzillaを拝見しましてNFSを切り離しても問題が発生したため難航しておりました。
どうやらlibxml2に不正な文字列を渡すことによって発生するクラッシュが原因でした…。
今回は以下のオプションでマウントしております。こちらは特に問題無い表記でしょうか?
念のため、ご確認頂けると幸いです。
fstabの該当箇所:
hostname:/home/somedirectory /home/somedirectory nfs hard,intr,noatime 0 0