Microsoftは2019年5月15日(米国時間)、検索エンジン「Bing」で使用しているAIアルゴリズムの一つをオープンソースソフトウェア(OSS)として公開した。

公開したのは「SPTAG」(Space Partition Tree And Graph:空間分割ツリーおよびグラフ)。SPTAGはC++で作成され、Pythonでラップされた高速な近似最近傍探索ライブラリだ。

SPTAGではディープラーニングモデルを利用して、数十億個のベクトル情報を数ミリ秒で探索できる。これにより、ユーザーにとって関連性の高い検索結果を高速に提供することが可能になった。

検索エンジンがベクトル探索を使用すると、概念検索が容易になる。例えば、ユーザーが、「How tall is the tower in Paris?」(パリにある塔はどのくらいの高さか)と入力したとしよう。この検索クエリには「Eiffel」(エッフェル)という単語が含まれていない。それにもかかわらず、「エッフェル塔が1063フィート(約324メートル)だ」とBingは自然言語で結果を返す。なお、検索結果には、入力時にあった「tall」という言葉が含まれていない。

ベクトル探索は、Bingが数十億件に上るWeb検索の意図をより良く理解し、数十億のWebページの中から最も関連性の高いものを見つけるために役立っている。

何がベクトルなのか?

