もはやPoCばかりやっている場合ではない――企業が抱くAIへの誤解と課題：特集：2020年、AI活用の成否を分かつ技術とは（1）

Deep Learningがブレークスルーとなった昨今の「第3次AIブーム」。2020年は、企業の「AI」活用において、ブームのままPoC（概念実証）で終わるのか、本番で稼働するシステムやサービスに適用できるのかの分水嶺（れい）となるだろう。その成否を分かつものは何なのだろうか。本特集では、現在の機械学習・Deep Learningにおけるさまざまな課題の中でも技術的なものを中心に整理し、その解決策としてAutoML（機械学習自動化）、MLOps（機械学習基盤）といった技術を解説。加えて、それらを活用している企業の事例を紹介する。初回は、日本ディープラーニング協会の理事に、2020年現在のAI活用における課題について聞いた。

» 2020年05月29日 05時00分公開

[高橋睦美，＠IT]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　あらゆる分野で活用が広がる人工知能（AI）技術。中でもDeep Learning（以下、DL）は画像処理や映像処理での活用に始まり、Googleが2018年10月に発表した「BERT」をきっかけに、自然言語処理（NLP）分野でも進化が進むなど、できることは日々広がっている。こうした技術を企業がビジネスに活用していく際に直面する課題とは何だろうか。ABEJAの代表取締役兼CEOであり、日本ディープラーニング協会（JDLA）の理事を務める岡田陽介氏に聞いた。

技術的な課題よりも、AIに対する「根強い誤解」が課題に？

ABEJA 代表取締役兼 CEO
日本ディープラーニング協会理事
岡田陽介氏
（写真提供：ABEJA）

　今やさまざまなメディアで「AIを活用すべき」「機械学習（以下、ML）やDLを生かした新しいビジネスを」といった論調が飛び交っているが、自社でどのように取り入れ、実践すべきか、思い悩む企業は少なくないのではないだろうか。岡田氏によると、データやテクノロジーの活用を考える際にまず重要なのは、「企業が何を実現したいか」だ。実現したいことによって、使うべきテクノロジーもデータも変わってくる。しかし、「何でもいいのでAIを活用したい」と、本来は手段であるテクノロジー導入を目的化してしまうケースは多い。

　また、企業の間にはAIに対する根強い誤解があるという。「しばしば『AIって、一度作ってしまえばそれをずっと使えるんですよね』と言われる。AIの導入を、単なるツールの導入として捉えている企業はいまだに多い。だがそれは違う。構築直後はAIが期待されたレベルのタスクをこなせないことも多く、サイバー空間上でAIを継続的に運用・改善していくことによってはじめて、AI導入の本当のメリットを享受できるようになる」（岡田氏）。

　「導入して一部が効率化されて終わり」という考えで取り組みを終えるのではなく、継続的な改善サイクルを回し続けることによってAIはその真価を発揮するのである。

モデル開発のサイクルだけではなく、幅広い概念を含む「MLOps」

　データの習得、学習、再学習など、企業で継続的に機械学習を活用し続けるために、提唱されているのが「MLOps」だ。「MLOps」とは、「Machine Learning」と「DevOps」を組み合わせた造語言葉で、MLをビジネスで円滑に利用するために行われる活動やそのための基盤の総称として使われると岡田氏は説明した。一度モデルを構築してそれで終わりにせずに、データの見直しや更新、再学習を続けながら、モデルの精度を維持・向上していくためにMLOpsが必要なのだ。

　MLのモデル（教師あり学習の場合）を開発する際には、まず多くのデータを集め、データラベリングなどの前処理を行い、教師データを作成することになる。そして、この教師データをMLモデルに学習させ、精度を検証する。十分な精度が得られた段階で本番環境にデプロイしていくが、プロセスはここで終わりではない。本番環境にデプロイしたモデルに再学習をかけることによって、フィードバックのサイクルを回していく必要がある。

　こうしたフィードバックサイクルを回すためには、ログ解析やモニタリングといった周辺システムも不可欠だ。岡田氏によると、MLOpsは、こうした一連のシステムとサイクルを含めて考えなければならないという。

　加えて、MLOpsを効率的に回していくには、さまざまなツールやアプローチが必要になる。

　例えば、MLOpsの中で一部の判断や制御を人間が担う「Human in the loop」（人間参加型機械学習）は注目されている概念の一つである。「数年前から、PoC（概念実証）に取り組んでも実装に行き着かず、終わりの見えないPoCを繰り返す『PoC貧乏』や『PoC地獄』が指摘されるようになった。その原因の一つとして、最初から高水準の精度を求めてしまうことが挙げられる。例えば、検品作業をAIで完全に自動化しようとすると、99％以上の確率で欠品を見つけ出す精度が求められてしまう。ある程度の精度が出るようになったら、人間がAIの精度を補いながら、早期に運用をスタートすることを推奨している。そうして、AIの学習に必要なデータを蓄積、そのデータを再学習に回す、ということを繰り返す。これだけでモデルの精度が上がるわけではないが、適切にサイクルを回すことで精度向上が期待できるからだ」（岡田氏）。

　こうした、継続的な改善プロセスを回すためにはモデルを監視し、フィードバックをするための仕組みが必要だという。

　「どのデータを使って、どのモデルを学習させたのか。そして生成されたモデルのバージョンが幾つで、本番システムに適用したときにどんな振る舞いをしたかといったフィードバックが必要になる。こういった事柄がばらばらに管理され、パイプラインがしっかり回らなければ、MLOpsとして使い物にならない」（岡田氏）

継続的学習のためのMLパイプライン（出典：MLOps: Continuous delivery and automation pipelines in machine learning）

　このように、企業が本番運用でMLを活用するには、モデルそのものだけを考えるのではなく、モデルの継続的改善を支える仕組みも含めて整備することが非常に重要であることを岡田氏は強調した。

　モデルの学習から運用、再学習まで一貫して支援をする「ABEJA Platform」でMLOpsを支援してきた立場としても、MLOpsがないと、MLは話にならないという。

　「PoCで作成したモデルを本番環境に組み込んだとき、想定外のデータが来れば来るほど、データパターンが分散することによって学習のパターンも広がる。これに対応できるのかどうかがモデルの精度向上につながる」（岡田氏）。こうした「想定外」を学習させ続けることによって、精度をどんどん向上させていくプロセスが極めて重要であり、それなしにMLの価値をビジネスに最大限に生かすことはできないという。

MLOpsの実践に欠かせないのはリテラシーを備えた各レイヤーの「人材」

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(https://image.itmedia.co.jp/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}

続きを閲覧するには、ブラウザの JavaScript の設定を有効にする必要があります。

2020年の「AI／機械学習」界わいはこうなる！　10大予測
MLOps／AutoMLなどの自動化に、自然言語処理（BERTなど）、倫理問題／信頼と、2019年の「AI／機械学習」界わいの変化は止まらなかった。2020年はどう進化していくのか？　英語での情報を参考に、10個の大胆予測を行う。
Gartnerの「人工知能のハイプサイクル：2019年」が示したAIのトップトレンド
AIに関するGartnerのハイプサイクルレポートは、AIが多種多様な形で企業に導入されていくことを浮き彫りにしている。同報告書は、特に「拡張インテリジェンス」「チャットBot」「機械学習」「AIガバナンス」「インテリジェントアプリケーション」に注目すべきだとしている。
なぜデータ基盤を作ったのか？「ゼクシィ縁結び・恋結び」で必要になった理由
「ゼクシィ縁結び・恋結び」の開発現場において、筆者が実際に行ったことを題材として、「データ基盤」の構築事例を紹介する連載。初回は、サービスの概要とデータ基盤が必要になった理由について。