ニュース
» 2020年01月08日 19時30分 公開

確率伝播法を採用した機械学習モデル:ウォール街アナリストを上回る企業業績予測モデル、MITが開発

MITの研究チームが、企業の四半期業績を予測する数理モデルを開発した。ウォール街のアナリストを超える成績を実証した。特徴は匿名化された週次のクレジットカード取引データと四半期業績レポートのみを使用したことだ。

[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 マサチューセッツ工科大学(MIT)の研究チームは、企業の四半期業績を予測する数理モデルを開発した。匿名化された週次のクレジットカード取引データと四半期業績レポートというごく限られた情報だけを用いていることが特徴。

 開発したモデルを使って34社の四半期業績を予測したところ、57%においてウォール街のアナリストの平均予測を上回る精度を実現した。今回の研究で注目すべき点は豊富な情報を利用できるアナリストよりも圧倒的に少ないデータだけを用いて的確な予測を下したことだ。

MITの研究チームが開発した機械学習モデルは、ウォール街のアナリストを上回る精度で四半期業績を予測できる

 ウォール街のアナリストは業績予測に当たって、使用可能なプライベートデータと公的データ、今回のものとは異なる機械学習モデルにアクセスできたのに対し、研究チームが開発したモデルは、非常に小規模な2種類のデータセットのみを使用した。

代替データが使いにくい理由は?

 金融業界では現在、企業が発表する業績データ以外に、「代替データ」を用いた企業収益予測に対して関心が高まっている。用途は取引や投資だ。

 代替データとは漠然としているが頻繁に生成される消費者データをいう。例えばクレジットカード取引データやスマートフォンから得られる位置データ、小売店舗の駐車場の混雑具合を示す衛星画像などであり、代替データの種類は多岐にわたる。

 だがこれまでのところ、代替データを使って正確な予測を頻繁に行うことは、非常に難しかった。なぜだろうか。

 研究者によれば、データの量が不足しているためだという。四半期ごとのレポートや各週のクレジットカード取引などの財務入力は1つの数値のみから構成されている。つまり2年間の四半期報告では、合計しても8つのデータポイントしかない。例えば、同じ期間の毎週のクレジットカードデータは、約100個のノイズの多いデータポイントにすぎない。つまり、これらのデータには解釈できない情報が含まれている可能性がある。

 ノイズが多いデータを扱う手法が今回の研究では中心を占めた。博士課程を修了後、MITの情報/意思決定システム研究所(LIDS)で研究を行い、論文の第一著者を務めたマイケル・フレダー氏は次のように述べている。

 「われわれは、『代替データというノイズの多いシグナルと、四半期業績データを組み合わせて、企業業績を高頻度に予測することは可能か』という問いを立てた。研究の結果、答えはイエスである」

 研究チームが開発した予測モデルは、投資家やトレーダー、あるいは自社と競合他社の売り上げを頻繁に比較する企業にとって、有力なツールになる可能性がある。もちろん社会科学者や政治科学者が、大量の匿名データを使って人々の行動を研究する場合などにも役立ちそうだ。

 「このモデルは、人々が何を行おうとしているかを理解したいと考える全ての人に役立つだろう」(フレダー氏)

機械学習をどのように活用したのか

Copyright © ITmedia, Inc. All Rights Reserved.

編集部からのお知らせ

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。