つきましては、どのようなサーバシステムにすればよいか、全般的なご意見をうかがえればと存じます。
条件は、
・最初は数TB程度の容量から始め、必要に応じて、可能な限り安価に容量が増やせて、数重PB程度まで上げることができる
・システム全体を構築するのに、可能な限り費用が少ない
・多数のHDDを一つのストレージとして認識されることができる
・RAIDなどで、「1つのHDDまでは故障してもよい」程度のデータ保護がなされている
・HDDが故障した場合、システムを稼働させたままでHDDを交換することができる
・使用する各HDDは、どのような型番のものでも(つまりどのような組み合わせのものでも)よい
・クライアントPCはWindowsなので、Windows(特にXP)およびInternet Explorer(ver. 7)と親和性が高い
・日本でユーザ(技術者)が多く、多くの方からご助言をいただける
・クライアントPCからは、ネットワークストレージとして認識されるのでも、ローカルとして認識されるのでも、どちらでもよい
よろしくお願い申し上げます。
ようやく要件が見えてきましたが、貴方の想定している金額で収まるかどうか。
提示されているような要件は「ストレージの仮想化」とよばれ各ストレージベンダーがいくつかの手段を用意しています。
ストレージ仮想化については以下の記事等が参考になるでしょう。
進化するストレージ仮想化 - 進化するストレージ仮想化:ITpro
ブロックとファイルの違いを知る:「ストレージ仮想化」の基礎知識 - ITmedia エンタープライズ
現時点ではこれらの要件を満たす実装はエンタープライズクラスの製品群にしかなく、
中小企業レベルで導入するにはかなり敷居が高いと言わざるを得ません。
具体的な製品としては EMC, IBM, 富士通 や海外ストレージベンダーが出しています。
旧機種の活用と自在な拡張:ストレージ仮想化に対する「3つのアプローチ」 - ITmedia エンタープライズ
[Think IT] 第2回:ストレージ仮想化に対するEMCの取り組み (1/3)
直接の金額はシステム次第なのでおおざっぱになりますが最低で数百万から、
基本的には数千万クラスのシステムになるでしょう。(エンジニアの人件費やサポートも含みます)
これに年単位の保守料金を払って運用していくことになります。
実際の価格は各社営業に問い合わせてください。
一応安価なサーバーやソフトウェアを使用して真似る事は不可能ではありません。実用出来るかは別として。
ただ、それを実現できるだけのスキルを持つエンジニアはそうそう居ませんし、
居たとしても高額の給与を支払って数人雇わなければまともにやっていけないと思います。
これらの状況を考えた上で妥協できる点は妥協し、必要な要件を絞っていくことが
必要かと思われます。
他の部分はともかく、
・最初は数TB程度の容量から始め、必要に応じて、可能な限り安価に容量が増やせて、数重PB程度まで上げることができる
この条件がある限り、そう安易な手段は無いものと思います。
以下のサイトに各ベンダのサーバを利用し、1PBのストレージを構築した場合の概算費用が掲載されています。
Petabytes on a budget: How to build cheap cloud storage | Backblaze Blog
最も安価なケースとして、JFSを用いてBackblaze社が自前でストレージを構築した事例が紹介されています。
しかし、以下の用件は満たさないかもしれません。
・日本でユーザ(技術者)が多く、多くの方からご助言をいただける
コメントにもありますが、転送量が少ない場合はAmazon S3も検討対象に入るかと思います。
そうですか……。
他の方から、「ZFS」というファイルシステムを使ったらどうかというご提案があったのですが、どうなのでしょうかね。
PCIの4台HDDを接続できるRAIDボードを、大量に持っております。これを活用して、他に必要なハードウェアを購入し、フリーのOSを使って何とかできないかと思っているのですがね……。