NTC Newtechデータで未来をつなぐ

RAIDシステム構築を考え直すお客様へのRAID関連コラムをご紹介します。

本ページに記載された技術情報は記事が出稿された時期に応じて推奨システムに対する考え方や実現方法が書かれています。
したがって、最新技術でのシステム構築を前提とし、この情報を利用する場合、その記事が時代に沿わない内容となる事もありますので予めご了承ください。

 

ハードディスクドライブの高速化と大容量化によって、RAID構築にも新たな考えを取り入れるべき時代となりました。大容量を必要とするRAID-5システムでは、ドライブの単体容量が増加したために、そのドライブ障害時は、いかに短時間でシステム復旧するかの対策が必要になります。 このような時代の変化に合わせ、新たにRAIDシステム構築法を考えなおさなければなりません。

 

クライアントコンピュータにもRAIDをお奨めします

何年分もの売上データなど、重要なデータは必ずしもサーバに保存するのがベストとはいえません。CADや画像処理などのアプリケーションによっては、ネットワークファイルではパフォーマンスが不十分な場合もあります。このようなクライアントコンピュータ上に保存する重要なデータに対しても、ストレージのトラブルへの対処が必要です。ハードディスクなどのストレージはコンピュータ機器の一部とはいえ、その技術の多くは精密な機械部品による集合体です。このため、周辺温度やホコリなどの環境からの影響を受けやすく、また、長期使用による部品の磨耗が起こりますから、一種の消耗部品と考える必要があります。したがって、重要なデータを保存するストレージには必ず冗長性を持たせる必要があります。 従来は、クライアントコンピュータでストレージの冗長性を確保するには、低コストで実現できるソフトウェアRAIDが一般的でした。しかし、ソフトウェアRAIDでは故障よるシステム復旧にはシステム管理者の知識が必要で、ハードウェアRAIDのように誰でも簡単にできるわけではありません。 近年、ハードウェアRAIDは大幅なコストダウンと、様々なシステム要件にあわせてラインナップも充実してきています。大規模なサーバ用のシステムパフォーマンスを追及した製品もあれば、システム管理の知識がなくても簡単にトラブルへ対処できるシステムまで様々です。クライアントコンピュータやSOHOサーバ向けには、管理者不在の環境でも復旧の簡単なミラーリングシステムや、IDEベースのRAID-5が適しています。

 

より簡単に使えるハ-ドウェアRAID

システム管理者不在の環境でも、短時間にシステム復旧のできるRAID装置がクライアントコンピュータからSOHOサーバへの導入が盛んです。

このようなハードウェアRAIDは、1台までのハードディスク障害なら、システムの運用から再起動にいたるまで、障害を起こす前の状態とは何ら変わりなく稼動を続けることができます。復旧もいたって簡単で、壊れたハードディスクを取り出し新しいものに交換するだけで、あとはRAIDシステムが自動的に新ディスクを認識し、ユーザーの知らないうちに冗長性まで回復してくれます。これは、プリンタのインクリボンやトナーカートリッジを交換する程度の簡単な作業ですから、システム管理者がその現場まで、わざわざ出向く必要もないためシステム管理費の大幅なコストダウンにつながります。

 

RAIDは内蔵すべきか外付けにすべきか

最近、サーバ機にもRAID装置を内蔵したモデルが増えています。

たしかにRAIDを内蔵したサーバは、コンパクトにまとまり機能的ではありますが、実際のハードウェアトラブル時には不便な点が多いのが実状です。

ハードディスクのトラブルであれば、そのディスク交換のみですみますが、コンピュータ本体・RAID装置のどちらかのトラブルでも、場合によって装置全体の交換が必要となります。 しかし、外付けのRAIDシステムであれば、コンピュータ本体のトラブルがあっても、新しいコンピュータへの接続かえで、これまで蓄積されたデータを容易に再利用できます。
また、データの使い方によっては、すぐに置き換えのコンピュータを用意できなくても、別のサーバに一時的に接続かえして、ファイルサービスを開始するなどの柔軟性もあります。 したがって、ニューテックでは外付けのRAIDシステムをお奨めしています。

 

全て取り替えと接続換え

昔は贅沢なRAIDと言われ たミラーリングも今はベスト

RAIDの元祖といわれるRAID-1は、二つのハードディスクに全く同じデータを書き込むためミラーリングと呼ばれています。二台分のディスクに一台分のデータしか書き込めないわけですから、ハードディスクの容量単価が高い頃は贅沢なRAIDと呼ばれ、ハイエンドのメインフレームに多く採用されていました。しかし近年、ハードディスクの容量単価は大幅にコストダウンされ、ハードディスク単体も300GBをゆうに超える時代となり、ミラーリングしても十分すぎるくらいの容量が得られます。そして、もっとも単純なRAIDアルゴリズムから、コントローラも簡素化によるコストダウンが実現し、今ではクライアントコンピュータからも使われるようになりました。

 

ここだけの話 ! ミラーリングシステムの裏技

ミラーリングシステムは、単純に二つのディスクに全く同じデータを書いているので、例えば、それぞれのディスクをRAID装置から外し、直接コンピュータのSCSIやIDEのインターフェースへ接続しても、それまでミラーリングしていたデータがそのまま使えます。これは、すべてのRAID-1装置で共通とはいえませんが、これまでニューテックの販売してきたミラー専用機ではWindows上で問題なく使えました。つまり、最悪コントローラ側にトラブルがあっても、何とかなりやすいのが単純なミラーリングシステムの利点ともいえます。(なお、この使い方に関してはサポート外とさせていただいておりますので予めご了承ください。)

 

より安全性を求めるRAIDを構築

例えばRAID-5でのシステム構成では、1台のディスク故障には対応できても2台目のディスク故障ではデータ破壊が起こります。つまり、ディスク故障が発生してから、そのディスクが交換されRAIDの再構成(リビルド)が終了するまでの時間はデータ消失の危険性があります。この危険な時間帯をいかに短くできるかが、データを安全に保存していくための条件となります。

 

RAID装置のパフォーマンスが安全性にもつながります

故障したディスクを交換してから、どのくらいの時間でRAIDを再構成できるかは、その装置のパフォーマンスに依存します。再構成は、交換されたディスクの全領域に必要なデータを全て書き込むので、単純計算では、二倍のパフォーマンスを持つ装置は2分の1の時間、三倍の装置では3分の1の時間で再構成できます。したがって、パフォーマンスの高いRAID装置は、データ消失の危険性のある時間帯をそれだけ短くできます。ただし、この再構成時のパフォーマンスとは、単にホストコンピュータからのアクセス性能に比例するのではなく、RAIDコントローラ~ハードディスク間の転送レート、ハードディスクのリードライト性能、RAIDコントローラ内部の処理能力の総合性能に依ります。

 

RAIDレベルによって故障ディスクへの対応台数が違います

ミラーリングRAID-1を利用した場合は、ペアとなるディスクのどちらか一方の故障に対し冗長性をもちます。このため、RAID-1を複数個利用しストライピングRAID-0を組み合わせてボリュームを作るRAID-10(またはRAID 0+1とも呼ぶ)では、ペアとなるディスクの両方が同時に故障しない限り冗長性を確保できます。例えば、ディスク6台使ってRAID-10を構成した場合、条件によって最大3台までの故障に対応できるわけです。しかし、RAID-3~5のパリティディスクを利用するRAID構成では、そのグループを構成するディスクの内、1台目の故障には対応できても2台目の故障が発生すれば、その時点でデータを消失してしまいます。

 

RAID5とRAID0+1の場合

ホットスペアを用意すれば自動復旧可能

ディスクが故障しても即ディスクを交換しRAIDの再構成を実効しなければ、いかにパフォーマンスの良いRAID装置を採用しても、どんなに再構成速度が早いRAIDレベルを選んでも、その安全性に対する価値は少しも上がりません。 この問題の解決には、故障発生時に即RAIDの再構成を開始する、ホットスペアディスクの設定をお奨めします。ホットスペアディスクとは、RAIDに実装されたハードディスクの一つ以上を予備ディスクとして設定されたものを呼びます。通常、RAID稼動状態でのホットスペアディスクは、RAID構成グループに所属せずアクセスされることもなくパワーONの状態で待機しています。そしてディスクの故障発生とともに故障ディスクの代替として、ホットスペアディスクへのRAID再構成が開始されます。このようにホットスペアを設定しておくと、システム管理者がRAIDの異常に気が付いた時は、すでにRAID装置の再構成が始まっているため、冗長性の保たれない危険な時間帯を最小限に抑えることができます。このようにホットスペアディスクの設定を行えば、24時間365日で3時間以内の対応といった大変コスト高の保守契約のグレードを下げることも可能になり維持管理費の大幅な削減になります。

 

RAID装置のメンテナンスにおけるトラブル

RAID装置のディスクが故障した時のメンテナンス作業で、正常なディスクを誤って交換してしまうとRAID構成を破壊しデータを消失してしまいます。この間違ってディスクを抜いてしまうのは、故障したディスクの位置を表示する機能のないRAID装置に多くあります。ディスクを多く実装するRAID装置では、特にこの機能が重要なのです。しかし意外にも、こういったRAID装置は市場に多く出回っていますので、導入の際には必ず仕様の確認が必要です。なお、ニューテックの全RAID製品には、障害ドライブをLEDで表示する機能が標準実装されています。

 

RAID装置のメンテナンストラブル
 

RAID装置でもバックアップは必要

RAIDシステムはディスク故障などのハードウェアの障害に冗長性を持たせることができますが、人為的なオペレーションミスによるデータ消失は意外に多いのが実態です。ニューテックのアンケート調査でも、データ消失の原因として、ドライブ障害に次ぐ第二の位置で、その原因の約4割を占めます。その他にもネットワークトラブルや停電によるもの、アプリケーションのバグが原因となるものまで、RAID装置の冗長性だけでは回避できないデータ消失があります。つまりRAID装置とは自己が管理する範囲内に対し耐故障能力を実現するもので、データ保護の目的には、やはりテープ装置などへのバックアップが有効です。

 

RAIDの故障原因
 

停電への対策

重要なデータを保存するストレージ機器には、ホストコンピュータを含めたUPS(無停電電源装置)を設置することをお奨めします。RAID装置にキャッシュバッテリを搭載している製品もありますが、実際のファイルシステムを管理しているホストコンピュータを含めたUPS設置でなければ確実な停電対策とはいえません。また、電源系のトラブルは停電以外にも、落雷によるトラブルやオフィスの電源の容量不足など様々な問題を持っています。 これら電源系のトラブルを総合的に解決できるUPSの設置は、データ保護に大変役立ちます 。

 

より高い冗長性を持たせる ファイルシステムを利用

UNIX系もPC系にも関係なく現行のOSに共通していえることは、従来からのパフォーマンスやフレキシビリティを重視した設計から大きな変化が無かったところにあります。 しかし、より重要で企業の存続をも左右するデータをストックする現在、単にハードウェア側だけにデータの冗長性を任せるのではなく、ソフトウェア側からも冗長性をサポートし、よりいっそうの強化を図ろうとする構想があります。従来、ソフトウェア側からデータの冗長性を持たせるアプリケーションは、データベースサーバがその代表的なものでした。データベースは、利用しているシステムが様々なトラブルで異常終了を起こしても、その異常が発生する以前の状態にロールバックする機能を備えています。こういった機能を持たせたファイルシステムを「ジャーナルファイルシステム」と呼んでいます。 なお、ジャーナルファイルシステムは、OSに標準装備されていないので、例えばSolarisにはVeritas File Systemなどを別途購入しインストールする必要があります。