マイクロソフト、「コンピュータが、人間のように概念化して考えられるようになる」技術を開発「Microsoft Concept Graph」を公開

マイクロソフトの研究部門 Microsoft Research Asiaが、コンピュータが人間のように物事を概念化して処理できるようにするために必要となる技術「Microsoft Concept Graph」を開発。AIなどの研究用としてプレビュー版を公開した。

» 2016年11月04日 10時00分 公開
[@IT]

 米マイクロソフトの研究部門 Microsoft Research Asia(北京)は2016年11月1日(現地時間)、コンピュータが人間のように物事を概念化するのを支援する技術「Microsoft Concept Graph」を開発したと発表した。

 Microsoft Research Asiaのシニアリサーチマネジャーで、Microsoft Concept Graphの開発プロジェクトに携わっているジュン・ヤン氏は、この技術の基本的な考え方をこう説明する。「コンピュータの限界は、常識的な知識や、意味を理解する方法を持っていないことにあると考える。コンピュータは、言葉の文字の並びなどは認識できるが、人間のようにこれまでの背景から物事を理解するまでの知識は持っていない。私たちの研究は、抽象度の高い常識的な概念をコンピュータに提供し、コンピュータが人間のコミュニケーションをさらによく理解し、処理できるようにすることを目指している」

photo Microsoft Research Asiaのシニアリサーチマネジャーのジュン・ヤン氏(写真=中央)とMicrosoft Concept Graph開発チーム(出典:マイクロソフト)

 この概念を形にするためのMicrosoft Concept Graphでは、機械学習アルゴリズムとして数十億のWebページと何年分もの匿名化された検索クエリから、2016年11月現在、540万件以上の概念を「知識グラフ」として抽出し、蓄積。それを継続的に拡充している。このような知識グラフは、産業界や学術界で「人間の思考をコンピュータ的にシミュレートしていく」ための研究/開発要素の1つとして期待されているという。

 例えば、Microsoft Concept Graphの活用が見込まれる分野としては、検索広告(キーワード選択の支援)、検索サービス(精度の向上)、人間のようなチャットボットの開発などがある。

 ヤン氏のチームはMicrosoft Concept Graphの開発に当たり、インデックスが作成されたWebページと検索クエリから、「such as ...」(〜などの)、「is a ...」(〜である)といった一般的なフレーズで結び付けられた言葉のつながりを抽出するように機械学習アルゴリズムを訓練した。例えば「犬」というインスタンスと「動物」という概念、あるいは「マイクロソフト」というインスタンスと「ソフトウェア会社」という概念のペアを選び出すという。

 こうしたインスタンスと概念のペアを選別する処理は、Webページや検索クエリにおける登場頻度の分析に基づいて、より正しいと考えられるものが残されるようになっている。また、概念グラフの質を高めるために、インスタンスと概念のペアを人間がチェックするプロセスも設けている。

 こうして抽出された数百万に上る概念には、「都市」や「ミュージシャン」といった一般的な単語から、「ウェディングドレスデザイナー」や「胃酸の分泌を抑える胸やけ治療薬」といったものまで含まれる。それぞれの概念が、ヒト/コト/モノなどの属性や、〜にある/〜の友人/〜の社長といった関係で一連のインスタンスと結び付けられる。

「I want to eat an apple」と「I want to visit Apple」は何が違うのか、をコンピュータに理解させるには

 この他Microsoft Research Asiaは、Microsoft Concept Graphと関連する技術である「Microsoft Concept Tagging Model」も公開した。この技術は、インスタンスと概念を自動的に結び付けて、そのペアに確実性を示すスコア付けをすることで、コンピュータが人間のように概念化を行えるよう支援するもの。コンピュータ的に最も役立つ概念に高いスコアが与えられる。

 例えば、「マイクロソフト」というインスタンスは、「企業」「ソフトウェア会社」「最大のOSベンダー」などいった概念と自動的に結び付けられる。この中では、「ソフトウェア会社」に最も高いスコアが付く。「最大のOSベンダー」の概念は1つのインスタンスしか当てはまらないが、「ソフトウェア会社」の概念はそれ以外のインスタンスにも当てはまるためだ。こうすることで、検索の実行や質問への回答といった意味論的計算を行うのに役立てている。

 また、Microsoft Concept Tagging Modelは、インスタンスとともに使われる言葉のコンテキストを加味することで正確性を高めている。例えば、「I want to eat an apple」(リンゴを食べたい)という文章では、「apple」に関連付ける概念から「フルーツ」に高いスコアを付け、「I want to visit Apple」(アップル社を訪問したい)という文章では、「IT企業」の概念に高いスコアを付ける。



 Microsoft Concept GraphとMicrosoft Concept Tagging Modelは、検索エンジン、チャットボット、その他のAI(Artificial Intelligence:人工知能)システムなどに向けた、「自然言語理解の研究」の支援を目的に公開したという。

 この2つの技術は研究用にプレビュー版が公開されている。2016年11月現在のバージョンには、英語の概念データのコアバージョンが含まれる。将来のリリースで、テキストを理解するためのコンテキストを含む概念化技術や、中国語を始めとする他言語対応機能も用意するとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。