【コンピュータ】RAIDは万能じゃない

キーマンズネットによると、RAID5利用者の15%がデータ消失という痛い目に遭っているとか。思ったよりあるなぁと思いつつ、なぜRAID5でもデータ消失が起きてしまうのか、考えてみました。

A0006_001157

そもそもRAIDとは、データの冗長性を確保するための仕組みですが、いくつかのレベル(数字)があり、RAID5は性能と安全性のバランスが高いため、多く使われていることが多いようです。

かくいう私も、データの保存、バックアップ用に、バッファローのNASを導入しています。

RAID対応NASを導入する(1)―背景編

4TBタイプで、1TBのHDDを4台搭載しています。RAID5で使えば3TBのストレージとして使用できます。非常に便利なので、何でもかんでも入れてしまいますが、なまじ容量が大きいだけに、壊れたらたいへんなことになりそうです。

RAIDは、すべてのレベルで冗長性を持っているわけではなく、RAID0などはまったく冗長性がありません。単なる外付けHDDと同じような感じで、1台でもHDDがクラッシュしたら、それで終わりです。経験のあるエンジニアの方は、こういうことはないと思いますが、容量を優先してRAID0にしてしまえば、その時点で冗長性は期待できません。

RAID5の利点として、(この場合は)4台あるHDDの1つが故障しても、残る3台で何とかやっていけるので、その間にHDDを交換することができる、ということがあります。しかし、2台がいっぺんに故障したら、その時点でお手上げです(同じメーカーの同じ時期のHDDが装着されていれば、同時に壊れる可能性も高いです)。

2台まで故障してもOKなRAID6というのもありますが、HDDの利用効率が悪く一般的ではありません。サポートされているNASも少数です。

あと、RAIDは、ファイルシステムの損壊まではカバーしてくれないということです。これは意外と見落とされがちで、RAID5だから大丈夫とたかをくくっていたら、HDDは無事なのに中身はごっそりいなくなっていた、という悲劇にもなります。

ファイルシステムのクラッシュは、ソフトウエアが100%万全とは言えない以上、起こることは覚悟しておかなければなりません。しかも、NASでRAIDを組んでいて、ファイルシステムがXFSとかそういうことになれば、どこか別の場所でサルベージする、ということの難易度も上がります。

ということで、RAID5も過剰な期待は厳禁、確実なのはRAID5同士でミラーする、というところでしょうか。ミッションクリティカルでなければ、あえてRAIDでないNASを2台で運用し、かならず双方にバックアップする、という方法もあります。

お金のことを気にしなければいくらでも手が打てそうですが、そのへんはデータの重要度とともに天秤なのでしょうね。ちなみに私は、なくなっては困る写真のデータなどは上記のバッファローのNASとアップルのTime Capsuleに二重に保管しています。

そもそものバックアップデータは、欠損してもその時点ではダメージがないので、どちらかにしか保管しません。また、なくなってもよい動画などは、そのままNASに放り込んでいます。

このような割り切りと、NASやRAIDの特性をよく理解して付き合っていくことが大事と言えますね。

コメント