人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

PC2-5300(DDR2-667)のECC付きメモリモジュールをエラーチェック出来る機材、又はサービスを探しています。
現在DELLのPower Edge 840を使用しているのですが、先日一日に3度もパリティエラーで落ちて(ブルーバック)しまいました。保守が有るのでDELLに修理は依頼出来るのですが、運用中の為修理対応可能時間がネックで、メモリが原因で有ると判断出来ればDELLよりメモリを送ってもらい、こちらで交換を行いたいのです。
マザーボードが原因であればどうしようも無いのですが、極力サーバを止めずに対応したく、またテストに使える同等機種も無い為、上記のような機材、サービスを探しています。

宜しくお願いします。

●質問者: dokuraku
●カテゴリ:コンピュータ
✍キーワード:Dell ECC EDGE POWER エラー
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● tso973
●27ポイント

メモリのチェックにはそれなりの時間がかかります。

メモリのチェックの間はサーバーが止まってしまいますので結局同じことだと思うのですが。

複数枚のメモリを実装している場合は1枚づつ抜いて別機種に載せ替えて検査するという手もありますが、コストを考えると1枚だけメモリを購入してそれを現在のメモリと交換してみて様子をみるのが現実的だと思います。

一日に3度もサーバーが落ちるような状況であればのんびりした事も言ってられないと思います。

オンサイトの保守契約をしているならDELLに事情を話して(話さなくてもオンサイト契約のお客はクリチカルな業務用なので事情は分かっていると思うけど)その場でメモリ交換をして様子を見つつメモリを持ち帰ってもらってDELLに検査させた方がいいですよ。そのためのメーカー保守契約なんですから。


メモリのテストをするならmemtest86がいいでしょう。

メモリを特定するために1枚づつテストすると効率がいいです。

これでメモリスロットの位置に関係なくエラーが出ればメモリの故障、特定のメモリスロットの位置のメモリがエラーになるならマザボの故障です。

http://shattered04.myftp.org/pc_38.html

◎質問者からの返答

tso973さん、回答ありがとうございます。

今回のメモリが動作させられるサーバが他に有れば、仰る通り挙げて頂いたツールを使用するつもりです。しかし今回は残念な事にテストに使用出来る機材が無く、コメントの方にも書いたのですが、専用機材の購入、サービスの利用、サーバ購入の何れがベストか?という点で、皆さんの力をお借りした次第です。


2 ● b-wind
●27ポイント

エンタープライズ製品テクニカル電話サポート

OpenManage Server Administrator 入れてログを確認する。

パリティエラーが出ているなら必ずみれる。

他が原因でも PowerEdge の自己診断機能を実行すれば少なくとも問題のあるパーツは特定できる。


で、サポートに電話して上記のログを確認したことを提示。

自己責任でいいからと交換パーツを要求すれば送ってくれます。


対応する時間がネックなだけなら上記対応で何とかなるかと。

ただし、サポート契約のランクが低いとなかなか融通聞いてくれないので、

交渉は時間かかるかもしれないけど。

◎質問者からの返答

b-windさん回答ありがとうございます。

実は既にPowerEdge Diagnosticsを使用しメモリ廻りが原因で有る事は解っているのですが、マザーのスロット側なのか、メモリモジュール側なのかが、特定に至ってないのです。

DELLとしてはメモリ及びマザーの発送も現地作業もOKなのですが、現地作業の時間が9:00?17:00の為、原因がメモリであれば此方で深夜から早朝の間で交換したいのです。

マザーであれば色々な点からもDELLに出動願うしかないのですが。

1GB×2の所を現状1GBで動作させており、専用の機材又はサービスでも有れば、価格次第で検討してみたいと。

自社で使用しているサーバであれば現物で確認も出来るのですが、ユーザー先のサーバなのでそうも行かず。

と言った状況なのです。


3 ● b-wind
●26ポイント

実は既にPowerEdge Diagnosticsを使用しメモリ廻りが原因で有る事は解っている

それじゃ足りないな。ESM のログも見ないと。

これをみるには Server Administrator か、専用のログ取得ツール(サポートが状況に応じて提供してくる)が必要。

これを使えばどのスロットのメモリモジュールがエラーを出しているかもわかる。

ECCのシングルビットエラーでも出てればそれはすでに交換対象。

メモリ交換してみてそれでもエラーが出るようならそのあとマザーを疑えばいい。


サポートの範囲内なら交換パーツ代はタダなんだから(その分サービス料に入っているわけだが)うまく活用しないと。

人力検索はてな

◎質問者からの返答

b-windさん、回答有難うございます。

確かに仰る通りでESMのログは確認してないのですが、DiagnosticsでSlot1_Aがエラーなのを確認済みなのです。

Slot1_A・B、Slot2_A・B(1と2の併用でデュアルチャネル)の1_A及び2_Aで2GB運用を現状2_Aのみの1GB運用です。

DELLからもSlot1_Bに差し替え、様子を見て欲しいと。症状が出ればメモリモジュール、出なければマザーボードのSlot1_A廻りの障害と確認出来る、と回答を頂いてます。

私はソフト屋の者で、お客様のご依頼によりハードを調達しておりますが、あくまでソフト屋ですのでハード保守担当要員がおりません。私を含め他のサポート担当全員、私物や引き上げ機、社内機にて、電源、マザーボード、CPUまで触りますが、お客様の運用中ハードをそのレベルで触る訳には行きません。

マザー及びメモリを出荷して貰い、お客様の営業時間外(DELLの対応時間外)に此方で作業する事も検討中ですが、上記の理由によりあくまでも最終手段です。

此方にハード保守に関しての義務(責任)は有りませんし、サーバ(業務)を止めなければ修理出来ない点はお客様もご理解頂いてます。現状メモリが減った事でレスポンスは悪くなっていますが、システム(業務)に影響が出る程でもありません。ですがあくまでも「今は」の事であり、このままでは年末に落ちる可能性が大きいのです。

お客様の要望として勿論ですが、此方としても極力業務に影響しない方法を取りたく、色々な方法を検討する為に今回の質問を行った訳です。

どうぞご理解下さい。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ