連載
» 2017年12月21日 05時00分 公開

ディープラーニングでテキストマイニング:TensorFlowを使った機械学習を論文抽出に適用、ヒントは大学入試問題対策の裏ワザ (1/2)

医師が、ディープラーニングフレームワークのTensorFlowを自ら用い、診療ガイドラインの作成における「心の折れる作業」である論文スクリーニング作業を自動化。効果を実証した。ヒントは共通一次試験の対策本にあった。

[三木泉,@IT]

 医師が診療ガイドラインの作成で根拠とする論文の抽出作業を自動化するため、自らディープラーニングフレームワークのTensorFlowを使い、機械学習によるテキストマイニングを行った。

東京共済病院腎臓高血圧内科部長の神田英一郎氏

 これを行ったのは、東京共済病院腎臓高血圧内科部長、東京医科歯科大学臨床教授などを務める神田英一郎氏。日本腎臓学会の組織した委員会による、慢性腎臓病(CKD)をテーマとした「エビデンスに基づくCKD診療ガイドライン2018」(未出版)の作成に関わった。その作成プロセスにおいて、論文スクリーニング作業の負担が重いことから、機械学習の活用を思い付き、「第3のスクリーニング担当者」を生み出した。

 以下では、同氏の説明に基づき、これを紹介する。

「心の折れる作業」をどう軽減できるか

 医療の世界では、「EBM(Evidence Based Medicine)」への取り組みが進められてきた。EBMとは、「医療行為は最新、最良の科学的根拠に基づいて行うべき」という考え方だ。診療ガイドラインは、EBM推進の観点から、臨床現場での意思決定における判断材料の1つとして利用することを目的とした文書で、各専門分野の学会などが委員会を組織して作成している。

 診療ガイドラインは、医療従事者の経験とそれに基づく判断を否定するものではないが、推奨も含む重要な文書。EBM推進という目的に照らしても、記載事項が正確・妥当であり、根拠が明確でなければならない。根拠が十分でない場合は、そのことを明記する必要がある。

 診療ガイドラインでは、多数の「クリニカルクエスチョン」と呼ばれるトピックのそれぞれにつき、1〜3ページ程度の分量で解説が行われる。クリニカルクエスチョンの例として、「エビデンスに基づくCKD診療ガイドライン2013」には、「食塩摂取制限は小児CKDの腎機能障害の進行を抑制するため推奨されるか?」「生体腎ドナーの術後腎機能予後および生命予後を悪化させないためにはどのような CKD管理が推奨されるか?」などがある。

 各クリニカルクエスチョンの解説には、執筆者のバイアスあるいは独自の意見が入ってはならない。このため、解説は最新、最良の論文に基づくものでなければならない。解説作成プロセスの透明性を確保するため、各クリニカルクエスチョンの解説に続いてベースとした文献検索の内容、二次資料、参考文献が示される。

診療ガイドラインは、クリニカルクエスチョン、推奨事項、解説、根拠となる文献で構成される

 こうした性質の文書であるため、ガイドラインの作成では「システマティックレビュー」という過程が重要だという。関連する文献を漏れなく調査し、質の高い研究データについて吟味・評価して、偏りを可能な限り排除し、まとめるプロセスだ。「この作業の負荷が、ガイドライン作成に参加する医師たちにとって非常に大きい」と神田氏は指摘する。

 システマティックレビューでは、まず適切な時期の論文を、医療論文データベース「PubMed」などで検索し、その結果を2段階でスクリーニングし、特定のクリニカルクエスチョンに関する記述の根拠とするのに適切な論文を選定する。「1次スクリーニング」では論文のアブストラクトの内容で選別を行い、「2次スクリーニング」では、論文の内容で分類し、さらに選別を進め、採用・不採用を判断する。

 漏れを防ぐため、当初の文献検索では幅広く結果を取得する。このため特に1次スクリーニングは、多数の論文のアブストラクトと格闘することになる。例えば今回神田氏が機械学習を適用した「患者教育は透析回避に効果があるか」というクリニカルクエスチョンでは、1012の論文が1次スクリーニングの対象になったという。2人の医師が、それぞれ別個に選定を行って、結果を持ち寄る形だが、「心の折れる作業」(神田氏)だという。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。