データ、分析、確率とスーパーボウル「The Next Platform」で読むグローバルITトレンド(1)

アメリカンフットボールの世界では、データ分析がどのように活用されているか。一般企業が学べる点はあるのか。スーパーボウルの開催を機に、アメリカンフットボールと統計の関係を取材した。

» 2017年03月10日 05時00分 公開
[Jeffrey Burt, The Next Platform]

英国のIT専門媒体、「The Register」とも提携し、エンタープライズITのグローバルトレンドを先取りしている「The Next Platform」から、@IT編集部が独自の視点で“読むべき記事”をピックアップ。プラットフォーム3へのシフトが急速に進む今、IT担当者は何を見据え、何を考えるべきか、バリエーション豊かな記事を通じて、目指すべきゴールを考えるための指標を提供していきます。

 データはビジネスのほとんどの分野で、急速に通貨のような存在になりつつあり、分析は企業にとってデータ活用の決め手になる。だが、データはシステムやデバイスの陰に隠れがちだ。IoT(モノのインターネット)に関する議論の多くも、小型センサー、モバイルデバイス、自動運転車、大規模製造システムなど、モノ自体に偏っているきらいがある。しかし、IoTの本当の価値は、マシンで生成されるデータに加え、「できるだけリアルタイムに近いタイミングでそのデータを抽出、分析し、その結果を基に意思決定を行える」ということにある。

 スポーツほど統計(スタッツ)やデータが論じられる分野はなかなかない。そしてスーパーボウルほど注目されるスポーツイベントもなかなかない。2017年2月5日に米国テキサス州ヒューストンで開催された第51回大会は、スーパーボウル史上初の延長戦の末、ニューイングランド・ペイトリオッツがアトランタ・ファルコンズを34―28で破り、5回目の栄冠を勝ち取った。

 米オークリッジ国立研究所 地理データサイエンス部門のリサーチサイエンティスト、ジェシー・ピバーン氏は、スーパーボウルの開催を間近に控えた時期、このゲームを題材にデータサイエンスの専門知識と経験を披露した。

 Newswiseが2017年2月初めに開催したパネルディスカッション「The Science of the Super Bowl」(スーパーボウルの科学)およびThe Next Platformの取材において、ピバーン氏は、「米国のプロアメリカンフットボールリーグ『NFL(National Football League)』とそのチーム(特に、ペイトリオッツとファルコンズ)がいかに急速にデータ分析の活用を進めているか」、さらに「そうした取り組みがビジネス界にとってどのように参考になるか」「データ分析プロセスにおいて人間による判断がいかに重要か」を語った。

 それによると、データ分析はペイトリオッツとそのオーナーのロバート・クラフト氏にとって非常に重要であるため、同氏はKAGR(Kraft Analytics Group)という新事業を立ち上げた。データをファンエンゲージメント(ファンとのつながり)の向上に活用するとともに、データサイエンスに取り組む他の企業に技術を提供することが狙いだ。

 NFLはデータサイエンスを、毎年の選手ドラフト、選手の健康やパフォーマンスの管理、ゲーム準備、ファンエンゲージメントといった形で全面的に活用している。例えば、2014年からNFLの全選手は、ショルダーパッドにRFIDタグを付けてプレーしている。RFIDタグはフィールド上の全選手のリアルタイムの位置と動きを、速さと加速を含めて常に追跡する。取得したデータは、ゲームを包括的に理解するための統計値をユーザー(コーチやファンなど)に提供するために利用できる。

 例えば、ペイトリオッツのレシーバーのクリス・ホーガンとファルコンズのレシーバーのジュリオ・ジョーンズは、いずれも最近のゲームでパスを9回キャッチし、レシーブ獲得ヤードが180に達した。だが、データを活用することで、両選手の走行ルートの違いや、獲得ヤード数のうち、パスをキャッチした後にランで得たヤード数などの情報が分かる。

NFL Next-Gen Stats(画像提供:NFL)

 また、ピバーン氏が集めた別のスタッツは、1)ペイトリオッツのクオーターバック(QB)トム・ブレイディとファルコンズのQBマット・ライアンが各ダウン(4回の攻撃権のそれぞれ)でパスを投げる場所の傾向、2)各チームがランでボールを動かすことが多い場所(ペイトリオッツは中央寄り、ファルコンズはアウトサイド寄り)、3)20ヤードラインとエンドゾーンの間の“レッドゾーン”(得点圏)で各チームが選択するプレーの傾向(ファルコンズはリード時にパスを多用、ペイトリオッツはランを多用)――などの情報を示していた。

 恐らくデータがスーパーボウルに最も影響を与えるのは、「Game Win Probability Models(ゲーム勝利確率モデル)」だろうと、ピバーン氏は語った。このモデルは、特定の条件下で各チームが勝利する確率を示すものだという。例えば、ファルコンズが勝つ確率が上がるのは、早い時間に数回のタッチダウンを決めた場合。ペイトリオッツが勝つ確率が上がりそうなのは、ランでボールを進められる場合だ。ゲーム勝利確率モデルは、ゲーム中の状況評価にも一役買う。第4ダウンにおいてランで攻撃するか、パントを選ぶかといった場合だ。

 しかし、ピバーン氏は、NFLなどのスポーツ組織ではほとんどの場合、データは意思決定のためにではなく、意思決定の支援のために利用されると強調した。コーチは、第4ダウンにおける各選択肢のメリットとデメリットを示す大量のデータや統計を持っているかもしれない。「だが、第4ダウンにどう戦うかを決めるのは、常にヘッドコーチであり、モデルではない」とピバーン氏。データはコーチの決断を支援するが、データが決断を下してくれるわけではない。

カンファレンスチャンピオンシップでのQBのターゲットゾーン

 こうした次元では、人間の判断がモノを言う。データサイエンスでは、あるプレーがどの程度うまくいきそうか、チームがどの程度勝ちそうかが分かるが、さまざまな定性的な情報(コーチが相手チームの特定の選手について知っているようなことや、プレッシャーがかかったときのトム・ブレイディの冷静さのような)を考慮に入れることはできない。

 また、データ分析では、過去に起こったことが将来も起こるということが前提になっている。ファルコンズは、「『ファルコンズがワイドでランを選択する傾向がある』ことをペイトリオッツが知っている」ことを知っている。では、ファルコンズのコーチがインサイドでランを選んだら、データサイエンスで導き出される確率はどうなるのだろうか。

 「われわれが生み出すモデルは、『未来が過去に似ている限りにおいて、われわれが将来したいこと』を表している。われわれは、『ファルコンズがこれまでやってきたことを、スーパーボウルでもやる』と決めてかかっている」。ピバーン氏は、The Next Platformの取材に対してそう語った。

 データ分析に関して、スポーツの世界には企業ビジネスとの共通点がある。全ての組織がデータを活用したいと考えていて、それはゲームに勝つ、売上高を伸ばす、健康管理の成果を高めるといった目的のためだ。だが、大きな違いもある。ビジネスや他の世界の大半とは異なり、スポーツは非常に管理された環境で行われる。定められたルールがあり、プレーするための囲まれた場所があり、アメリカンフットボールや野球では、何が行われることになるかを誰もが理解していて、物事は順番に起こる傾向がある。これらのスポーツでは、あるプレーが終わってから別のプレーが行われ、あるプレーが、次にどんなプレーが行われるかを左右する。

 スポーツ以外の世界ではこうはいかない。プレーの場所は必ずしも厳密に定義されておらず、ルールも必ずしも明確ではなく、考えるべき変数もはるかに多い。

 「ビジネスの世界は、それほどすっきりしていない。そう整然とはしていないし、順序立ってもいない」(ピバーン氏)

 しかし、スポーツのように、「データサイエンスでも、人的ファクターが最も重要な部分を占める」とピバーン氏は語った。データ分析や確率計算では、ベイズ統計学を採用することが多い。これは、対象についての専門家の知識や経験を生かし、システムの振る舞いに関する人間の理解を取り入れる方法だ。人間の知見によって、考慮すべき要素が新たに加わるわけだ。

 オークリッジ国立研究所の地理データサイエンス部門では、ピバーン氏と同僚のグループがさまざまなビッグデータ戦略により、国家安全保障や都市開発、水力エネルギー力学などの課題解決に取り組んでいる。例えば、同グループが利用している「LandScan」というアプリケーションは、高精度の世界人口分布推計を提供する。

 米国のような高度先進国では、人口の計算は比較的簡単だ。町、市、州や県、国の各レベルで全てのデータが整っている。だが、他の国ではそうではない。LandScanのアルゴリズムは、空間データ、衛星画像分析、多変数気体密度モデリング技術を利用して、1キロの解像度で人口を計算できる。世界のあらゆる地域の特定の行政区分について、人口調査の確定値の算出を支援するためだ。

 LandScanは、ビル&メリンダ・ゲイツ財団のナイジェリアのプロジェクトで利用されている。人口を正確に見積もり、医薬品をより効率的に配布するためだと、ピバーン氏は説明した。これまでは地域によって、医薬品の配布量が多過ぎたり(20人しか住んでいない地域に100パックを配送など)、少な過ぎたり(5000人が住む地域に500パックを配送など)することがあった。LandScanを活用すれば、医薬品の配布担当者は、特定の地域について人口と医薬品配布量をより適切に推計できる。

 こうしてデータサイエンス、分析、確率について話した後も、ピバーン氏はスーパーボウルについて熱弁を振るった。ペイトリオッツが勝つ可能性が60%とされていたが、同氏はファルコンズの優勝を予想した。理由を尋ねると、同氏は、いかにもスタッツや確率の話にふさわしいもう1つの要素を指摘した。この予想は、「最終判断がいかに大事か」という例だという。

 「この場合、私の判断には重要な長期的影響はないので、仮に予想が外れても大したことはない。だが、そうでない立場だと、判断するのは大変だ」(ピバーン氏)

出典:Data, Analytics, Probabilities and the Super Bowl(The Next Platform)

筆者  Jeffrey Burt

Microsoft, Stanford Researchers Tweak Cloud Economics Framework


Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。