SLAに関する7つの誤解とは、Uptime.comが解説ダウンタイムはゼロにはならない

Uptime.comは、SLAに関する誤解がDevOps業務に悪影響を与える場合があると公式ブログで指摘した。SLAについて、7つの一般的な誤解を取り上げ、どこが間違っているのかを解説した。

» 2021年02月26日 16時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Webサイトのアップタイムやパフォーマンスを向上させるソリューションを提供するUptime.comは、2021年2月19日(米国時間)に公式ブログで、SLA(サービスレベル契約)に関する誤解について解説した。SLAについて誤った考えを抱いていると、DevOps業務に悪影響を与える場合があるという。DevOps担当者向けに7つの一般的な誤解を取り上げ、どこが間違っているのかを解説した。

誤解1 1つの開発言語を使うべきだ

 DevOpsを適切に進めるには、複数のツールが必要だ。作業に応じて適切なツールを使う必要があり、使用する言語を1つに絞るべきではない。

 PythonやJavaScriptは多種多様な目的に使えるが、決して唯一の選択肢ではない。

誤解2 100%のアップタイムは達成可能で、持続可能でもある

 この誤解は、今回取り上げた中で最も有害な誤解だろう。この誤解のせいで、非現実的なSLAを達成できずに仕事を失ったり、企業として訴えられたり、ユーザーが不満を抱いたりするからだ。

 100%のアップタイムは達成不能、持続不能だ。SLAで規定すべき目標基準については、2つのシンプルな原則がある。この原則に基づいて自社に適した内容を検討しなければならない。

  1. SLAの義務としてアップタイムを決定するには、サービスレベル指標が必要になる
  2. SLAでは義務を定義する。同時にエラー予算(許容可能なダウンタイム時間)も定めなければならない

誤解3 システムのアップタイムは、サービスの可用性と同じである

 管理画面のステータスページでは、全てが問題なく稼働していると表示されていても、ユーザーからはそうではないと否定される場合がある。これは、サービスの可用性に注意を払っていないのが原因だ。

 顧客と接点があるシステムが最も重要だ。SLA通りに99.99999999%のアップタイムを実現したとしても、Webサイトにアクセスできなければ、顧客はアップタイムのレベルなど気に掛けない。

 まずはインフラやネットワーク、サービスについて知識を深める必要がある。何が分からないのかが分かっていない状態だからだ。モニタリングだけではこの問題の解決にはならない。障害が発生して初めて、そもそも何が問題なのか気付く場合もある。エラー予算を確保しておけば、障害や見落としを学習につなげることができる。

 顧客と接点があるシステムの接続が切れたら、早急に接続を回復するよう努めることが、評価の決定的な悪化を避けるために有効だ。

誤解4 クラウドなら任せきりにできる

 クラウドコンピューティングは営業担当者の宣伝文句の通り、安全性が高く、柔軟に運用できるかもしれない。だが、大規模なクラウドプロバイダーは攻撃の対象となる領域も大きく、問題が発生した場合の影響も少なくない。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。