NTC Newtechデータで未来をつなぐ

気象庁気象研究所お客様への導入事例をご紹介します。

再現データ格納装置

気象庁気象研究所気候研究部では、産業革命以後の気候の再現に関する研究を実施するにあたり、スーパーコンピュータを使用して計算した気候モデルの出力データを蓄積、解析するために大容量のストレージシステムが必要になりました。

今回、ニューテックの主力製品であるIDEベースRAID装置、「ConfidenceATAII 2UラックマウントFCモデル」を10台ご導入頂きました。総容量で10TBを越える大容量のストレージシステムですが、気候モデル計算結果の蓄積が順調に進み、既にディスク使用率は80%を越えています。システム構成としては、Intel製Xeonプロセッサを2基搭載したPCサーバにFibre Channelカードを2枚入れ、ConfidenceATAIIを5台づつディジーチェーン接続し、大容量のファイルサーバを構築致しました。それらをAPC製無停電電源装置とともに高さ41Uの大型ラックキャビネットに搭載し、観測準備室サーバールームに設置しています。

 
再現データ格納装置
 

大容量ストレージシステムの導入を決めた経緯を伺いました。

「これまでは、スーパーコンピュータを使って計算した気候モデルの出力データは、それらをすべてそのまま格納するにはストレージの容量が不十分であったため、研究に必要な部分のデータを抽出したあとはすべてDLTテープ等にバックアップを取り、解析作業に必要なストレージ領域を確保してきました。このバックアップ作業にかかる人的時間的コストは膨大で研究活動を効率行う上での障害になっていました。しかしながら、近年のハードディスクの大容量化の進展とIDEハードディスクを使用したストレージシステムの登場により、以前に比べて格段に大容量のストレージシステムを導入することが可能になってきました。そこで今回、産業革命以後の気候の再現に関する研究を限られた人員、時間で効率よく行うために、人的にも時間的にも多大なコストを必要とするテープ装置を使用したデータバックアップを行わなくてもよいように、気候モデル計算結果の生データをそのまま格納し、かつ十分なデータ解析領域を確保するために大容量のストレージシステムの導入を決断しました」。仕様の検討段階では、IDEベースのRAID装置よりも品質および信頼性が高いといわれるSCSIベースのRAID装置の導入も検討されたそうです。しかしながら、SCSIベースのRAID装置でIDEベースのRAID装置同じ容量を実現しようとするとIDEベースのRAID装置で構築する場合の3-4倍のコストがかかることがわかり、IDEベースのRAID装置を使用することにしたとのことです。

 

産業革命以後の気候の再現に関する研究を行うためには、気候モデルの出力データの蓄積とデータ解析作業のために合わせて10TBものストレージが必要であるとのことで、これだけの容量を実現するには複数台のRAID装置を使用する必要があります。これらのRAID装置間およびサーバとの接続には、SCSIではなくFibre Channelが使用されました。Fibre Channelを採用した理由は、「SCSIでは検出しがたいエラーが発生しやすく、またケーブルの長さにもLVDによって緩和されたとはいえかなり制限があり、今回のようなこれまで経験したことのないような大容量のストレージシステムにSCSIを使用することには不安がありました。そこで、SCSIに比べて多少コストはかかりますが大規模なシステム向けに作られたFibre Channelを接続インターフェースとすることにしました。」とのことで、安定性重視でFibre Channelを選択されたようです。

 

こうした状況のなかで、ストレージシステムには

(1)RAID装置は、外部インターフェースとしてFibre Channelを使用すること。

(2)RAID装置間およびサーバ間接続をデイジーチェーンで行うことができるようにRAID装置がハブ機能をもつこと。

が、仕様として求められました。

 

上記のような要件及び限られた予算で10TBのストレージシステムを導入すべく実施された一般入札の結果、ニューテック製品が採用されました。

導入後にユーザーに使用されている状況についてお聞きしました。

「今回のストレージシステム導入の結果、気候モデルの生データである1次データをテープに書き出さなくとも解析作業のための十分な領域を確保することができるようになりました。その結果、ストレージ不足を補うために行っていた1次データから必要なデータを抽出し2次データを作成する作業が必須でなくなり、1次データのテープへのバックアップを行う必要がなくなったことと合わせてデータ解析の作業効率が大幅に向上しました。また副次的な結果として、従来はストレージ容量の関係から2次データを別システムのストレージに格納してデータ解析作業は別マシンで行うことが多かったのですが、今回のこれまでにない大容量ストレージシステムを導入したことにより、解析作業のための十分な領域が確保できるようになった結果、解析作業を1次データのあるシステムで行うことができるようになりました。この点においても解析作業の効率は向上しました。さらに、産業革命以後の気候の再現に関する研究を担当する複数の研究官が同一のマシンで解析作業を行うようになった結果、計算機システムの管理運用の点においても負担の削減に成功しました。システムの運用に専門のスタッフを確保することが困難で、研究官自らがシステムの管理運用を行わなければならない私供のような場合には、システムの管理運用にかかる人的時間的コストを削減することは重要で、この点でも研究活動の効率向上に寄与しています。

以上、今回の大容量ストレージシステムの導入により、データ解析に関係する作業の削減と、研究活動に使用している計算機システム数を削減することができたことによるシステム管理運用の負担軽減により、導入前よりもより多くの時間を研究活動に充てることが可能になりました。」

 

導入後は非常に満足されているようですが、導入後の問題点も指摘されております。

 

「サーバルームの消費電力量は、かなりのものです。サーバやRAID装置の購入は目に見えるコストですが、冷房の管理や消費電力など目に見えないコストをどう削減していくかが今後の課題です。例えば、RAID装置にアクセスがないときには、ハードディスクを止めるなどして消費電力問題に対応していく必要があると思います。技術力を持っているニューテックに、今後そのような点を期待したいと思います。」

 

システム導入から約9ヶ月が過ぎた今も快調に稼働しております。

 

ディスクの低価格化により、以前に比べて10TB強のストレージシステムを安価にご購入できる時代になりました。膨大な出力結果を蓄えるための同様のシステムは、大学・官公庁を中心に他の研究機関でも導入が進んでいます。

 

導入製品
導入製品
導入製品

 

(2003/11/20)

 

関連リンク
SupremacyⅢ RAIDシリーズ
SweeprStorⅣシリーズ