特集
» 2018年10月17日 05時00分 公開

「深層学習の現状は、1998年のインターネットに近い」:「インターネット」で勝てなかった日本が、「深層学習」で勝つには 東大・松尾豊氏 (2/2)

[石川俊明,@IT]
前のページへ 1|2       

松尾氏が現在注目する2つの研究

 2012年、Googleが深層学習を用いた猫画像認識に関する論文を発表してから、6年間で深層学習に関する研究が「急激に進んだ」と松尾氏は振り返る。2018年現在は、画像認識におけるエラー率は3%台で、「人間のスコアを大きく上回り、画像認識による物体検出ができやすい環境になった」と深層学習の現状を分析する。

 「深層学習の精度向上で、画像認識や、映像からの行動認識を実現することが可能になった。一方、人間が脳で無意識に行う運動や行動のための予測は実現できていない」

 松尾氏によれば、2018年現在、深層学習を用いて現実世界を理解、予測できるような手法はないという。しかし、「研究が進めば、深層学習が現実世界を理解、予測できるようになるのではないか」と予測し、その実現に向けた研究として「World Models」や「Generative Query Network(GQN)」に注目しているそうだ。

 World Modelsは、外界から受け取った運動や行動などの刺激を基に、将来の外界世界の構造をシミュレートするという研究だ。GQNは、複数の視点における画像のペアを基に、別の視点の画像を生成する。この2つの研究が発展することで、「ボールを投げればどうなるか、土を掘ればどうなるか、といった現実空間の情報を、深層学習で予測できるようになる」と松尾氏は考察する。

「深層学習は汎用目的技術(GPT)の仲間入りを果たす」

 「現在、ロボットと深層学習を組み合わせた事例が増えている」と言う松尾氏は、その事例の一つとしてAI(人工知能)を研究する非営利団体「OpenAI」の腕型ロボット「Dactyl」を紹介した。

 Dactylは、指が動く速度やキューブの重さなど、さまざまなパラメーターをランダム化したシミュレーター環境において、強化学習アルゴリズムを用いた学習でモデルを生成する。その結果、人間のような指の動きを実現させているという。松尾氏は、こうした事例を「眼を持った機械の登場」と表現する。

 加えて、2018年3月にMicrosoftが中国語から英語への翻訳精度を人間と変わらないレベルにまで高めたという記事や、特定の人物の表情や目の動きを深層学習で再現する「Deep Video Portraits」を取り上げ、深層学習の研究の発展について予測する。

東京大学 特任准教授、日本ディープラーニング協会 理事長の松尾豊氏

 「深層学習とロボットが融合し、『眼を持った機械』が登場してきている。今後は、深層学習による翻訳が実用レベルに達する可能性も出てきた。日本の労働市場が、現在の欧州と米国のような環境になれば、単純な事務職からクリエイティブな職業までも深層学習が使われる時代がやってくる」

 松尾氏はこの予測を基に、「深層学習が人類の汎用目的技術(GPT)の一つになる」と考察する。汎用目的技術とは、インターネットやトランジスタ、車軸の発明といった、社会全体に影響を及ぼした技術のことだ。

 松尾氏は「現在の企業の時価総額ランキング上位企業には、『インターネット』を利用したビジネスを展開した企業が多い。20年後、『深層学習』が汎用目的技術の一つになっていれば、『深層学習事業』を展開する企業がランキング上位に入っていてもおかしくない」と予想。講演最後には、ものづくりに強い日本企業に対する思いを述べて講演を終えた。

世界の時価総額上位企業ランキングについて説明するスライド 世界の時価総額上位企業ランキング

 「日本はインターネットというGPTには不向きだった。しかし、深層学習においては『機械を持った眼』のように、ものづくりと深層学習を組み合わせることで、日本のものづくりの強みを生かせられる。今から20年後に深層学習がどうなっているのか、先を読んで考えたプレイヤーが勝つので、深層学習を学ぶと同時に、深層学習が社会をどう変えるのか、死ぬほど考え抜いていってほしい」

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

編集部からのお知らせ

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。