“参照系処理の集約”で
人の知恵を活性化する基盤を作る
まずは前編「だからこのデータは使えない!〜歴史からひも解く『使えないデータ』のなりたち」の内容を簡単におさらいしてみましょう。
ITシステム基盤を、基幹系システム、情報系システム、部門別業務系システムという従来の3つの分類から、登録系処理と参照系処理という2つの分類で見直してみました。データ集計などの参照系の処理は情報系システムだけではなく、基幹系システムの中にも部門別業務系システムの中にも存在しており、これらはどれも汎用データベースを使って動いています。
汎用データベースは「汎用」と呼ばれているものの、参照系処理にはまったく向いていません。これに対しては、情報系システムのほんの一部で、カラムストアデータベースやアプライアンスといった、データウェアハウス専用製品を使った参照系処理の高速化が行われていることを解説しました。
後編では、散在している参照系処理を全社基盤として集約し、汎用データベースから決別することによる運用コスト削減メリット、そしてデータ活用の戦略的意義について考えます。さらに、その中で、カラムストアデータベースとアプライアンスを比較し、全社基盤としての適正を考えたいと思います。
参照系処理にはどのような参照プロセスがあるのか
まず、集約の対象となる参照系処理を定義します。例えば次のような参照プロセスがあります。
- 商品の出荷指示をかける入力画面がある
- 商品コードを入力すると商品名と現在の在庫数が表示される
- 出荷したい数量を入力すると、出荷後の在庫数が表示される
この一連のプロセスでは、商品コードの入力と出荷数量の入力が登録系です。また、商品名、現在の在庫数、出荷後の在庫数の表示が参照系です。
このように、一連のプロセスの中で登録系と参照系が一体となっている場合、ここから参照系のみを切り離すのは簡単ではありません。このようなプロセスの切り離しは想定していません。想定しているのは、いったんデータベースに登録されたデータを、別のプロセスとして集計などの参照を行う処理を対象とします。帳票作成やオンラインレポート、BIや経営情報システムと呼ばれるデータ分析業務がこれに当たります。
これらの参照処理を集約し、参照系専用のデータベースを使っていこうという考え方です。
前回ご紹介しましたとおり、ほとんどのシステムでは、このような参照系処理が汎用データベースを使って行われており、これが、運用コストを大きくしている元凶であるからです。
![]() |
| 図1 全社データと参照系プロセスの集中管理 |
参照系専用データベースを考える
次に、このような全社的な参照系基盤を支える参照系専用データベースの要件を考えてみましょう。
一番重要な点は、この基盤にアクセスするユーザーの数はかなり大きくなる可能性があるということです。すべての帳票作成やオンラインレポートへのアクセス、そして、現在・将来においてさまざまな分析・集計システムにアクセスするユーザーすべてが対象となります。
大きな企業では、ユーザー数が1万人以上となることもあります。一般的なBIシステムでは、ユーザー数全体の約10%程度が同時にシステムにアクセスするとしていますので、1万人のユーザーが意味することは1000人以上のユーザーによる同時アクセス、ということになります。このような要件に耐えるデータベースでなければなりません。また、参照系専用データベースは全社のデータをすべて集約しますので、データ量は膨大になります。できるだけコンパクトにデータを格納する仕組みも重要なポイントです。さらに、データ量の増加や、ユーザー数の増加は、基幹系システムの変化や環境の変化に大きく依存することになります。必要な時に必要なだけ拡張していけなければ、長期的に維持することはできません。
継続的なTCO削減という意味では、オープンな世界におけるハードウェア価格の低下のメリットも享受できるべきです。基幹系システムの構成変更で余剰ハードウェアが出てきたときには、その活用も考えたいものです。
このような観点で、参照系基盤用のデータベース候補となるカラムストアデータベースとアプライアンスを比較してみましょう。
| 1/3 |
| Index | |
| “参照系処理の集約”で人の知恵を活性化する基盤を作る | |
| Page 1 参照系処理にはどのような参照プロセスがあるのか 参照系専用データベースを考える |
|
| Page 2 カラムストアデータベースとアプライアンスの比較 カラムストアデータベースの特徴 |
|
| Page 3 参照系基盤への移行の考え方 参照系基盤を選択すべき本当の意味 |
|
| Databaseフォーラム全記事インデックス |
TechTargetジャパン
- IBMが歴史を変える!? 新カテゴリの製品を発表 (2012/5/25)
IBMは新たな製品カテゴリとなる「PureSystems」を発表。DB2 10とビッグデータの関係、PureSytemsの斬新さはどこかに迫ります - クラウド時代のデータ処理を支える分散KVSの可能性 (2012/5/23)
現在、高速データ処理の主流はインメモリ型データ処理だが、別の方法として分散KVSが注目を集めている。今回は分散KVSについて話を聞いた - 複数の表からデータを取り出して表示させる(2) (2012/4/23)
前回はSQLの基本的な結合構文について説明しました。今回は、より複雑な自己結合や外部結合について説明します - SQL Server、OOWにIQ、盛りだくさんの4月 (2012/4/20)
オラクルオープンワールドが3年ぶりに東京で開催されたほか、SQL Server 2012が提供開始されるなど、今月は話題が盛りだくさんです
|
|
キャリアアップ
スポンサーからのお知らせ
- - PR -
イベントカレンダー
- - PR -

