NTC Newtechデータで未来をつなぐ

ILM導入のすすめお客様へのNAS関連コラムをご紹介します。

本ページに記載された技術情報は記事が出稿された時期に応じて推奨システムに対する考え方や実現方法が書かれています。
したがって、最新技術でのシステム構築を前提とし、この情報を利用する場合、その記事が時代に沿わない内容となる事もありますので予めご了承ください。

 

ITのキーワードとしてのILM

以前はDLM(Data Lifecycle Management)という言葉がはやり、その後DataがInformationと、より広範囲を示すものに変わりILM(Information Lifecycle Management)というキーワードが定着してきている。ILMは簡単に言ってしまえば価値に基づいてデータを再配置し効率的なストレージ投資を実現する考え方や手法で、この考え方は非常にわかりやすいし納得もされやすい。HSM(Hierarchical Storage Management)、階層型ストレージ管理は既に20年以上も前からあったもので、キャッシュと同じく単一的なアルゴリズムで頻繁にアクセスされるデータは速いディスクへ、そうでないデータはテープ等大容量で安価なストレージに保存、管理するというものである。ディスクベースの仮想テープライブラリ(VTL)も数年前から出回っているが、これも直近のバックアップデータはディスクに(バックアップ、リストア時間が早い)、古いデータはバックエンドに接続されたテープに保存することができる。ILMは包括的な語句なのでHSMもVTLも定義からするとそれに含まれていると考えてよい。ただしILMは局所的なものではなく、様々な情報をそのライフサイクルに応じ、オーダーメイドのアルゴリズムに基づいてデータの管理方法を決定する。データの管理方法は階層型だけではなく複製、移動、削除等、ストレージも高価で高速、安価で低速という単純なものだけではなく、可用性に関する指標、改ざん防止の仕組み等、様々な形態も対象となりえる。企業、部門のビジネス要件に応じて包括的にデータを継続的に管理するという考え方がまさにILMであると言える。

 

データおよびストレージ

情報が多様化しデータ量も膨大になり、年々その増加率は上がっていくと言われているが、それら多様化し増加していくデータを大局的に眺め体系化すると大きく下記のように分類される。

 

  • オンラインデータ
  • 参照データ
  • コンプライアンスデータ
  • バックアップデータ
  • ガーベージ
  •  

    それぞれに分類されたデータに対して時間軸を加味すると、全種データの全ライフサイクルを表せることになる。データのライフサイクルに渡って分類されたデータ及びその各々の時点の価値は、各企業のビジネス形態により様々のはずである。例えばオンライン(読み書きされる)データは、作成されてからどのくらいの期間読み書きされ続けるのか?またその後、ある期間は参照用として必要なのか?それともごみ(ガーベージ)となるのか?バックアップしたデータはどのくらいの期間、保持する必要があるのか?などはその企業独自のもののはずである。

    一方データを保存するストレージも様々なものがあり、それはサービスレベルで分類するとよくわかる(図1)。ストレージに於けるサービスレベルとしては大きく、

     

  • 応答時間
  • 可用性
  • データ保全性
  • キャパシティ
  • セキュリティ
  • 保守サービス
  •  

    などの項目が挙げられる。どのようなデータをどのサービスレベルのストレージに保存するかも、やはり各企業のビジネス形態によって様々のはずである。例えばオンラインデータに必要な応答速度はどれくらいなのか?実は応答速度はあまり重要でなく可用性がもっとも重要なのか?バックアップは必要なのか?等々やはり企業がポリシーとして決定しなければならない点である。

     

    図1

    ここで注意しなければいけないのはストレージのサービスレベルを上げる為にはコストが思った以上にかかるということである(図2)。コストは装置の購入にかかるものはもとより管理にかかる人的なもの、あるいは保守費用、スペース、消費電力等が上乗せされるので、そのようになることは簡単に想像できると思う。

     

    図2

    どんなデータでも高いサービスレベルのストレージに保存することを許容できる企業はないと言っても過言ではない。もちろん、データが増加しなければストレージを増設する必要もなく、IT管理者も悩む必要はないが、指数的にデータが増加している現在、データに必要なサービスレベルとストレージのサービスレベルをマッチングさせる(図3)ということが非常に重要な課題となっており、それがライフサイクルマネージメントという言葉がITのキーワードとなってきたゆえんである。

    図3

    しかしながら、専任のIT管理者がいない、IT管理者は機材の導入管理はしてもデータの管理は十分にしていない、という企業が多いのが現実のようである。そのような企業のIT管理者の中には提供したストレージ空間(ボリューム、フォルダー)をクオータ管理することでデータの増加を抑制している例も耳にする。確かにクオータを設定することにより、無尽蔵なデータ増加は防げるかもしれないが、果たしてそれはユーザ及び企業にとって好ましいことかと言えば必ずしもそうでないことは自明である。なぜならば、データがクオータのしきい値以上になった場合、ユーザが自身でデータを消すか、どこかに移動しない限り継続してストレージを使用できなくなるからである。ユーザとは営業担当やエンジニアなど、ある特定の業務を遂行しているのであって、データ整理のような作業は本来の業務では無いはずである。貴重な人的リソースを無駄な作業に消費してしまうことは、企業にとってもデメリットのはずである。クオータ管理はある意味IT管理者の怠慢といえるかも知れない。また、ILMを導入するより今はディスクが安いからディスクを増設します、というお話も耳にする。確かに現時点での問題解決にはなるかもしれないが、それは目先の対策であって、もしデータが増え続けているのであれば、ある期日が経過するとまた同じ状況になると思われる。またその時点でのデータ量は以前にもまして増えているので、以前にも増してますます管理が大変になる事は想像にやさしい。

     

    コンプライアンスデータについて

    ILMというキーワードとともにコンプライアンスという言葉もよく耳にするが、コンプライアンスとILMの関連について以下に説明する。

    コンプライアンスとは「法令を遵守する」という意味で使われる。ここでコンプライアンスデータというのは法令を遵守する為に対策が必要なデータと考えて良い。現時点で対象となっている法令としては、日本版SOX法及び個人情報保護法などがあるが、実際に法令等が無くても企業不祥事が起こらないような環境を作るという観点からの対策も数多く取られている。企業で実際に取られている対策としては下記のようなものがある。

     

  • 電子メールの一定期間保存
  • 会計データの一定期間保存
  • 個人情報等へのアクセス管理
  • アクセスログの一定期間保存
  •  

    これらを大別し①データを一定期間保存する、②アクセスを管理するという2つの側面に分割して考える。

     

    ① データを一定期間保存する

    保存期間にも依存するがデータの総容量は膨大になる。特にアクセスログのようにプログラムが生成するファイルは自動的に作成されるのでその量は無意識のうちに増加していく。しかもログ等のデータは有事には必要になるが、通常はほとんどの場合見る必要さえないものが多い。もしかしたら抑止効果のために取得している場合もあるかもしれない。このようなある種、取得して保存しておくことに意味のあるデータの保存先というのは特別に考慮しなければならない。

    まず第一に膨大な容量が必要なケースが多いので、それに見合ったサービスレベルのストレージを用意する必要がある。改ざんされないような対策が必要なケースは、アクセス管理をするとかWORM(Write Once Read Many、追記型)ストレージが必要で、また管理という観点からみれば、決められた期間保存した後、削除できるような仕組みも必要かもしれない。そしてなにより、それら保存用ストレージへデータを定期的に保存する操作のためにILMを導入すれば自動化が図れる。

     

    ②アクセスを管理する

    コンプライアンスデータだけではないが、様々な形での認証やアクセス制御をすることによりセキュリティを保っているデータが多く存在する。ILMはデータの再配置をするので、導入する際は気をつけないとセキュリティが甘くなってしまう場合がある。例えば一次ディスク上では正しくアクセス権を管理できていたものが、二次ディスクに移動したら全員が見ることが可能だったというようなことが起こる事がある。従って、ユーザ認証を一元的に管理するような仕組み(例えばWindowsドメイン)とILMが連動することは必須要件となるし、セキュリティホールが無い事も十分に確認しなければいけない。

     

    (2009年4月掲載)