クラウドのメンテナンス遅延を回避 顧客の業務を停止させない運用技術――富士通研究所から

富士通研究所は、パブリッククラウドのメンテナンスが原因となる顧客業務の遅延や停止を回避するクラウド運用技術を開発。安定稼働が必要な業務のクラウド運用を支える機能として、富士通のクラウド「FUJITSU Cloud Service K5」でのサービス化を計画する。

» 2018年03月29日 16時30分 公開
[金澤雅子ITmedia]

 富士通研究所は2018年3月28日、パブリッククラウドのメンテナンスが原因となる顧客業務の遅延や停止を回避し、安定稼働を提供するクラウド運用技術を開発したと発表した。

 パブリッククラウドでは、メンテナンスのために、顧客が利用する仮想マシン(VM)をいったん停止させて別のサーバで再起動するか、VMを停止させずに別のサーバに移動するライブマイグレーション(LM)を行う場合がある。しかし、それが原因で顧客の業務が停止したり、可動速度が低下したりする影響が生じることがあり、ミッションクリティカルな業務にクラウドを利用しにくいというという課題がある。

 LMでは、業務の停止は回避できるものの、VMが高負荷のときには一時的な性能低下や数秒間の停止などが発生し、業務に影響することがあり得る。そのため、VMが低負荷のときにLMを行う必要があるが、多数のVMを運用するパブリッククラウドでは、VM間で都合のよいタイミングを調整することが難しい。

Photo

 今回、富士通研究所が開発したクラウド運用技術では、機械学習でVMへの負荷を割り出し、影響が少ない時間帯に短時間でメンテナンスを完了できるようにメンテナンス計画を自動作成する。

Photo

 具体的には、VMごとに、過去のメンテナンス時にLMにかかった時間と、そのときのVMの負荷情報を機械学習することで、LM所要時間の予測モデルを作成し、これに基づいて、メモリ使用量や通信量といった外部から観測可能なデータで推定したVMの負荷を算出。LM所要時間と業務への影響を抑えられる時間帯を分単位で予測する。

 また、業務への影響が少なく、なるべく短期間でクラウド全体のメンテナンスが完了する計画を、大量の組み合わせの中から効率的に算出する。サーバとVMの構成情報、メンテナンス可能な条件など、クラウド運用特有の制約を用いることで、最適解を算出するという。

 同社は、8割の時間でCPU負荷が90%以上の高負荷、残り2割の時間は低負荷という条件の商用クラウド約5000VM分の稼働データにこの技術を適用し、シミュレーションを実施。従来技術では、延べ425VMは高負荷時にメンテナンスが実行されたのに対して、全てのVMが高負荷時を避けてメンテナンスが実行されることを確認したという。

 同社は、今回開発した技術を活用することで、クラウドのメンテナンスによる顧客業務への影響を低減できるため、これまでクラウド利用が難しかった、より安定稼働が必要な業務を行う顧客のクラウド利用を支援できると説明。今後、富士通のラウドサービス「FUJITSU Cloud Service K5」の運用を支える機能として、2018年度中のサービス化を目指すとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。