運用自動化も障害対応も、全ては「現場のため」ではなく「顧客のため、ビジネスのため」特集:情シスに求められる「SRE」という新たな役割(1)

デジタルビジネスの激化を受けて、「いかにスピーディにITサービスを企画・開発するか」が重視されている。だが重要なのは「作ること」だけではない。リリースして以降、収益・ブランド向上はサービス運用を支える「運用管理の在り方」に掛かっている。本特集では米グーグルが提唱するSRE――Site Reliability Engineerの概念を通じて「運用管理のビジネス価値」を再考。今求められる情シスの役割を考える。

» 2016年12月01日 05時00分 公開
[編集部,@IT]

ITサービスは「作った後」こそ重要

 IoT、X-Techトレンドの高まりに象徴されるように、国内でも「テクノロジの力で新たな価値を生み出す」デジタルトランスフォーメーションが進んでいる。もはやUberなどの例を持ち出すまでもなく、“これまでになかった利便性”が既存の商流を変え、各業種の主要プレーヤーを脅かすデジタルディスラプションが起こっていることも社会に広く浸透した。これを受けて、多くの企業が「IT活用の在り方が収益・ブランドに直結する」ことをあらためて認識し、実際に行動に乗り出す例も増えているようだ。

 例えばガートナージャパンが2016年11月に発表した「日本企業のデジタル・ビジネスへの取り組みに関する調査」(有効回答者数165)では、69.7%が「デジタルビジネスへの取り組みを行っている」と回答。「部門としてではなく、全社的に取り組んでいる」と答えた企業も、1年間で20.1%から29.3%に増加した。

参考リンク:ガートナー、日本企業のデジタル・ビジネスへの取り組みに関する調査結果を発表

 これは米ガートナーや、製造業からクラウド業界に打って出たGEのジェフ・イメルトCEOをはじめ、各方面が指摘してきた「全ての企業はソフトウェア企業になる」といった認識が着実に広がっていることの表れといえるだろう。これを受けて、「IoTに何から着手すればよいか分からない」「自社に内製する人材・仕組みがない」といった企業を支援する製品・サービスも複数のベンダー/クラウドサービスプロバイダー/SIerから提供され、デジタルビジネスに取り組む環境は着実に整いつつある。

 ただ、ここで気を付けるべきは、ITサービスを「作ること」ばかりにフォーカスしがちな傾向もあることだ。確かにITサービスは「企画力」とリリース・改善の「スピード」が勝負。ニーズの変化が激しくライバルも多い中では、リリース・改善に時間をかけるほどサービス価値は低下してしまう。だが言うまでもなく、ただ単に早くリリースすればよいわけではない。

 いかにスピーディに利便性の高いサービスをリリースできても、安定運用できなければ信頼失墜を招いてしまう。たとえ安定運用できても、機能や使い勝手、パフォーマンスを改善し続けなければ顧客は離れてしまう。事実、ほんの数秒でも待たせられたり、使いにくいと感じたりした瞬間にモバイルアプリを削除した経験は誰しもあるはずだ。

 ITサービスの機能やパフォーマンスは、いわば“自社の顔”。昨今、ITサービスの中身や、その開発を担うSoE領域の開発エンジニアばかりが注目されているが、サービスをリリースして以降、ビジネス勝敗のカギは、安定運用を通じて収益・ロイヤルティ向上を支える運用エンジニアが握っているのだ。

「ビジネスゴールを見据えた運用管理」が不可欠

 無論、こうした認識はITサービスがビジネスに直結しているWebサービス系はもちろん、一般的な企業にも以前からある程度浸透している。だが、ひと口に安定運用といっても決して簡単でないのは周知の通りだ。

 まず「何が当たるか分からない」中では、トラフィックの急激な増減に耐えられなければならない。またモバイルが浸透し、マルチデバイス/マルチOSが当たり前の上、エンドユーザーのITリテラシーも多様な中では、「どんなデバイス/OSでどんな操作をされるか」予測することは難しい。これに耐え得る品質を作り込むことはもちろん、万一の障害時も迅速に原因を突き止めて復旧できなければ、大幅な機会損失・信頼低下を招いてしまう。さらに、サーバなどシステムは正常に動いていてもサービスのレスポンスは遅れているなど、監視ツール上では正常でもユーザーが快適に使えていないという問題も起こり得る。

 特にITサービス開発・運用にクラウドは必須。例えば、パブリッククラウド上のサービスがオンプレミスの基幹系とデータ連携している、もしくはサービスをオンプレミスで運用している、いずれのケースにおいても仮想化/クラウドで複雑化したシステムの全体像を見渡し、問題原因をスピーディに究明できる体制があることもポイントとなる。もちろんサービスを止めずに、ユーザーが無理なく受け入れられる粒度、タイミングで機能を継続的に改善していく配慮や技術力も不可欠だ。

 こうした問題を一言で言えば、死活監視に象徴される静的な運用管理ではなく、状況に応じて変わる「動的なインフラを管理する、動的な運用管理が大切」ということになるだろう。だが「ITサービスは“自社の顔”であり、ビジネスの成果に直結する」という前提に照らせば、「運用管理で何をしなければならないか」ということ自体は本質的な問題ではない。最も大切なのは、「いかにユーザーの視点、ビジネスの視点を持って能動的にサービスを運用できるか」であり、「ビジネスの安定運用・改善のために」最善の判断を下し、必要な運用管理ツールを選び、使いこなすスタンスだといえるだろう。そもそもビジネスゴールを見据えた運用管理ができなければ、「ビジネスの成果を出すまでのリードタイムを短縮する」DevOpsも成立しないのだ。

運用自動化も、現場のためではなくビジネスのため〜注目を集めるSREという役割〜

 こうした中、Webサービス系企業のエンジニアの間で注目を集めている概念がある。米グーグルが提唱した「SRE」――Site Reliability Engineer「サイト信頼性エンジニア」だ。Webサービス企業にとって顧客接点となる「サイトの信頼性向上のために、運用自動化、障害対応、パフォーマンス管理、可用性担保などを通じて、収益・ブランドを支える役割」という概念だ。

 運用自動化、障害対応など、1つ1つの取り組みを見れば、決して目新しいものでもなければ特別なことでもない。ただ従来と異なるのは、「サイトの信頼性向上のために、収益・ブランドを支える」というスタンス――すなわち、「運用管理がビジネスに与えるインパクト」を見据えて“能動的に”各種管理を行っている点だ。

 よって、SREが各種自動化ツール、監視ツールなどを使う目的は「サービス=ビジネスの信頼性を維持・向上させるため」であり、決して「運用現場の省力化・効率化・コスト削減のため」ではない。そしてサービスの改善・復旧には何より「スピードと確実性」が求められる。人的ミスを抑止し、作業のスピードを大幅に向上させる運用自動化ツールを使うことも、SREにとっては「ビジネスの成果を獲得」する上で必然的な選択なのだ。

 こうしたSREは、本来的にはWebサービス系企業におけるITサービス運用管理の役割だ。だがデジタルトランスフォーメーションが進展し、ほぼ全てのビジネスをITが支えている今、一般的な企業の情シスにこそ、ビジネスゴールを見据えて主体的に運用管理を行うSREの視点、スタンスが強く求められているのではないだろうか。

 特に昨今はパブリッククラウドの浸透を受け、「なかなか要求に応えてくれない情報システム部門」といった声に象徴される“情シス不要論”も一部でささやかれている。また、コンテナ技術やCI/CDツール、サーバ構築自動化ツールなどにより、ある程度、開発者自身でインフラを整備できてしまうことを受けて、運用管理を行うインフラエンジニアの存在価値が問われる傾向も生じつつある。だが、“不要”と目されがちなのは「言われたことを言われたままにこなすだけ」というスタンスだ。ITでビジネスを成長させる上では、開発と運用、共に“専門性を持って主体的にビジネスを支える”という不可欠な役割があるのだ。

 本特集では、SRE導入企業への取材などを通じて、SREという概念を深掘り。クラウドやコンテナ技術などの浸透を受けて、インフラの仕組みや運用管理の在り方が変わりつつあることにも注目しながら、「運用管理のビジネスインパクト」を再確認。デジタルビジネス時代における「情シスの価値と役割」を再定義する。

特集:情シスに求められる「SRE」という新たな役割

IoT、X Techトレンドの本格化に伴い、ニーズの変化に合わせて「いかにスピーディにITサービスを企画・開発するか」が重視されている。だがビジネス差別化の上で重要なのは「作ること」だけではない。リリース後の運用が大きなカギを握る。本特集では米グーグルが提唱する「SRE――Site Reliability Engineer(サイト信頼性エンジニア)」という概念を深堀りし、「運用管理のビジネス価値」を再定義する。




Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。