ニュース
» 2021年03月23日 17時30分 公開

偽の文書を大量に自動生成して知財を保護するAIシステムを設計、ダートマス大攻撃者側のコストが跳ね上がる

ダートマス大学の研究チームは、AIを用いて偽の文書を大量に自動生成し、医薬品設計や軍事技術のような知的財産を保護するシステム「WE-FORGE」を設計した。人手を借りることなく、本物と見分けることが難しい文書を大量生成することで、攻撃者にコストを強いることが目的だ。

[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 ダートマス大学は2021年3月1日(米国時間)、コンピュータサイエンス学科の研究チームが、新しいデータ保護システム「WE-FORGE」を設計したと発表した。このシステムは、AIを用いて偽の文書を大量に自動生成することで、医薬品設計や軍事技術のような知的財産を保護する。

 「このシステムが生成する偽の文書は、元の文書と非常に似ており、本物らしく見えるが、実は元の文書と異なる不正確なものだ」と、研究チームを率いた同大学のサイバーセキュリティ、技術、社会ディスティングイッシュトプロフェッサーのV.S.スブラマニアン氏は語る。

ハニーファイルとはどこが違うのか

 サイバーセキュリティの専門家はこれまで、サイバー攻撃者をだましておびき寄せるために、「ハニーファイル」と呼ばれるおとりのファイルを作成して利用してきた。WE-FORGEは自然言語処理を用いて、もっともらしいが不正確な偽の文書を大量に自動生成する点で、従来の手法よりも優れているという。さらにWE-FORGEは、ランダム要素を挿入することで、攻撃者が本物の文書を簡単に特定できないようにしている。

 WE-FORGEでは、任意の技術設計文書の偽バージョンを大量に作成できる。攻撃者がシステムのハックに成功したとしても、多数の似たような文書のうちどれが本物かを見分けるという厄介な作業を強いられる。

 「われわれは今回の手法により、攻撃者に時間と労力を浪費するよう強いることができる。攻撃者は正しい文書を見つけても、見つけたという確信を持てないかもしれない」(スブラマニアン氏)

どのように偽文書を生成するのか

 偽の技術文書を生成するのは、決して容易なことではない。研究チームによると、1件の特許には1000以上の概念が含まれることがあり、それぞれの概念は最大20種類の置き換えが可能だという。WE-FORGEはある一つの技術文書において、置き換えが求められる可能性がある全ての概念について、数百万通り以上の置き換え方を出力できるという。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。