課題レポートの代筆を90%近い精度で識別可能、コペンハーゲン大学13万本のレポートでニューラルネットを訓練

コペンハーゲン大学の研究チームは、高校生が提出した課題レポートを読み取り、「本人が書いたものか代筆されたものか」を90%近い精度で識別できるAIプログラムを開発した。

» 2019年06月04日 10時30分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 デンマークのコペンハーゲン大学コンピュータサイエンス学部の研究チームはニューラルネットワークを用いてこれまで解決困難だった課題に挑戦した。課題レポートを入力すると、高校生本人が書いたものか、それとも代筆なのかを90%近い精度で見分けられる。

 デンマークの高校生の間では、有料のオンラインサービスなどを利用した課題レポートの代筆がまん延しているという。代筆と盗作は検出の難しさが違う。高校で課題レポートの盗作(過去に提出されたレポートからの盗用)をチェックするために使われてきた「Lectio」プラットフォームは有用だが、代筆を特定することは難しいという。

 こうした状況を背景に、研究グループ「DIKU-DABAI(Danish Center for Big Data Analytics Driven Innovation)」は数年前から、機械学習とニューラルネットワークを利用して代筆レポートの特定に役立つ「Ghostwriter」プログラムを開発してきた。

 デンマークの1万人の高校生が書いた13万本の課題レポートをニューラルネットワークにデータセットとして与え、レポートの書き方を学習した。データセットを提供したのはLectioを開発したデンマークMaComだ。

文章のどこを見ているのか?

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。