つきましては、どのようなサーバシステムにすればよいか、全般的なご意見をうかがえればと存じます。
条件は、
・最初は数TB程度の容量から始め、必要に応じて、可能な限り安価に容量が増やせて、数重PB程度まで上げることができる
・システム全体を構築するのに、可能な限り費用が少ない
・多数のHDDを一つのストレージとして認識されることができる
・RAIDなどで、「1つのHDDまでは故障してもよい」程度のデータ保護がなされている
・HDDが故障した場合、システムを稼働させたままでHDDを交換することができる
・使用する各HDDは、どのような型番のものでも(つまりどのような組み合わせのものでも)よい
・クライアントPCはWindowsなので、Windows(特にXP)およびInternet Explorer(ver. 7)と親和性が高い
・日本でユーザ(技術者)が多く、多くの方からご助言をいただける
・クライアントPCからは、ネットワークストレージとして認識されるのでも、ローカルとして認識されるのでも、どちらでもよい
よろしくお願い申し上げます。
ようやく要件が見えてきましたが、貴方の想定している金額で収まるかどうか。
提示されているような要件は「ストレージの仮想化」とよばれ各ストレージベンダーがいくつかの手段を用意しています。
ストレージ仮想化については以下の記事等が参考になるでしょう。
進化するストレージ仮想化 - 進化するストレージ仮想化:ITpro
ブロックとファイルの違いを知る:「ストレージ仮想化」の基礎知識 - ITmedia エンタープライズ
現時点ではこれらの要件を満たす実装はエンタープライズクラスの製品群にしかなく、
中小企業レベルで導入するにはかなり敷居が高いと言わざるを得ません。
具体的な製品としては EMC, IBM, 富士通 や海外ストレージベンダーが出しています。
旧機種の活用と自在な拡張:ストレージ仮想化に対する「3つのアプローチ」 - ITmedia エンタープライズ
[Think IT] 第2回:ストレージ仮想化に対するEMCの取り組み (1/3)
直接の金額はシステム次第なのでおおざっぱになりますが最低で数百万から、
基本的には数千万クラスのシステムになるでしょう。(エンジニアの人件費やサポートも含みます)
これに年単位の保守料金を払って運用していくことになります。
実際の価格は各社営業に問い合わせてください。
一応安価なサーバーやソフトウェアを使用して真似る事は不可能ではありません。実用出来るかは別として。
ただ、それを実現できるだけのスキルを持つエンジニアはそうそう居ませんし、
居たとしても高額の給与を支払って数人雇わなければまともにやっていけないと思います。
これらの状況を考えた上で妥協できる点は妥協し、必要な要件を絞っていくことが
必要かと思われます。
他の部分はともかく、
・最初は数TB程度の容量から始め、必要に応じて、可能な限り安価に容量が増やせて、数重PB程度まで上げることができる
この条件がある限り、そう安易な手段は無いものと思います。
回答にあるようにまねごとは可能でしょう。
ストレージ仮想化のすべての機能が必要な訳ではないでしょうし。
ただ、それを使いこなせるエンジニアを考えるとどう転んでもあまり安くはなりません。
転送量によっては Amazon S3 という選択肢もあるのかもしれません。
http://www.atmarkit.co.jp/news/200901/09/s3.html
http://plusg.topgate.co.jp/apps/
PCI Express とか PCI-X じゃなくて?しかも4台って…。
まともな速度でないけど。
面白いので試算してみる。
前提としては4台のHDDでRAID5構成。
サーバー1台に搭載できるディスク量も4台とする。(1U で3.5inch HDD だとこの辺が限界)
http://akiba-pc.watch.impress.co.jp/hotline/20091031/p_hdd.html
普及価格帯で入手性の良さそうなのは1TB程度。1.5TB じゃないのは計算が面倒なので勘弁。
これを4台で RAID5 を組むとその総容量は3TB。
ペタバイトを実現するには、この組み合わせが最低334以上必要。
OS やアプリの領域もいるから余裕を見て350としておこう。
RAID カード数百枚も持っているのか?という疑問は置くとする。
で実際に必要なディスク数は
4 x 350 = 1400
となる。
最安値にディスカウントも入れて \7,000- としても
1400 x 7000 = 9,800,000
ざっと98万円。
もちろんディスクのみでサーバーやRAIDカード、ネットワーク構築等の費用は一切入ってない。
ワイヤースピードのでる Gigabit L2 Switch 48port が最小でも8台?
それなりの実効速度を求めると1台20万くらいからか?。
あとは故障率だが、1400台のディスクになると月何個壊れるか想像も付かないな。
もちろんサーバーに家庭用のバルクディスク使うこと自体論外な部分もあるし、
300台オーバーのファイルサーバーを管理すると考えただけでぞっとする。
小規模なデータセンター並かな。
当然電源容量も莫大になるしUPSも居るとなれば…。
交換部品だけでもサーバー数台分になるかな。
素人的な発想でも数百万レベルになるのは必然としか言いようがないか。
バラのHDDだと消費電力計算しづらいので TeraStationのXLシリーズ で考えてみたけど、
据え置きで60W、ラックマウントなら110W。
http://buffalo.jp/products/catalog/storage/ts-xl_r5/spec.html
最大でも8TBなので1PB構築には128台必要。8時間30日稼動として
60*128*8*30=1,843,200 / 110*128*8*30=3,379,200
http://www.tepco.co.jp/life/custom/ratesimu/index-j.html
従量電灯B 60Aでシミュレートしてみると・・・
1843KWhで月額4万1千円強、3379KWhだと月額7万5千円弱。
ハブ等は含まれてないし、エアコンも相当使う事になるであろうから・・・。
まぁ、あまり現実的ではない構成だから、こんなの作らんとは思うけどね。
それはさておき、
少し前の質問で、容量は関係ないっておっしゃってましたし、
さらに前の質問で横槍も入れられたので、静観してましたけど、
いつ頃までに、どれだけの容量が必要になるのかによって、
チョイスが変わってくる事、そろそろお気づきになられませんか?
技術的に出来るからという事と、現実的かどうかの乖離は非常に大きいですよ。
確かに「できない」と断言されたのは辛いでしょうけど、同時に、
「どのようなシステムが考えられるかを求めるほうがよろしいかと思います。」
とお聞きしておいたはずですよ。
例えば、短期間でPBクラスの容量に達する見込みなら、
最初からPBクラスに対応したソリューションをチョイスすべきだし、
来年度中くらいはxxTBくらいまでで耐えられるというような場合であれば、
それに見合った方法をチョイスする。
記憶媒体の単価や、ファイルの管理方法などの技術面については、
数年経てば変わってきますので、
今の時点での投資が未来にとって負担にならないとも限りません。
よくよく、お考えあそばせ。
HDDの容量は大体5年で10倍、10年で100倍、15年で1000倍になるので、今数十TBのストレージがあって、
それを15年後くらいに数十PBにするなら、単純にHDDを置換できれば良い、ってことになります。
そのころ今と同じインターフェースを持っているHDDが手に入るかどうかは別にして。
しかし10年15年先を想定するのはかなり無理があります。
Windowsと親和性が高い、という話だって、今高くても将来のWindowsと親和性が高い保障はないですし、
どうなるかわからないので考えるだけ無駄です。
もし安価にファイルサーバを作りたいだけなら、今後5年で必要な容量をもったファイルサーバを、
ごく普通の方法で作るのがベストです。
それ以上先はそのあと考えればいいことです。
もっと速いHDDや、もっと優れた技術や、小型化省電力化したサーバ・ストレージが登場しているでしょうから。
> まぁ、あまり現実的ではない構成だから、こんなの作らんとは思うけどね。
たぶん一番問題になりそうなのは建物自体の電源容量と設置場所。
下手すると一つの事業が立ち上がってしまいそうだね。
> しかし10年15年先を想定するのはかなり無理があります。
まぁ普通はシステムは3年でリプレース、サーバーなど変えにくいものでもサポートは5年程度で終了ってあたりが定番だからね。
一連の言動を見ている限り、この分野に関してはたいした知識はないのだろう。
「どのようなシステムが考えられるか」って言われても想像も付かない段階ではないかな。
もっとも回答に出てきた一言一言を鵜呑みにして次の質問に移るのはいただけないが。
結果として希望しているようなシステムは現状無理という答えになりつつある。
まぁ、自分の知らないウルトラCが出てこないかと若干期待したりもしたが。
本来であれば本当に必要な最低要件は何か?と言うのを突き詰めてからその実現方法を模索するべきだろうが、
今のところそれに関する情報は一切無い。
論文でも書かされてるのかと疑ってしまうよ。
事業規模や用途・利用頻度、予算によって解は千差万別になると言うことだけは言っておこう。
多くの技術者が苦難を積み上げて対応しているような最先端に近い分野であることもね。
ファイルシステムが壊れたら全データが失われていい、というような潔いシステムならいいんだけど。
たまにRAIDがあればバックアップはいらないと思ってる人がいるので念のため。