連載
» 2021年05月24日 05時00分 公開

[損失関数/評価関数]平均二乗誤差(MSE:Mean Squared Error)/RMSE(MSEの平方根)とは?AI・機械学習の用語辞典

用語「平均二乗誤差」について説明。損失関数/評価関数の一つで、各データに対して「予測値と正解値の差(=誤差)」の二乗値を計算し、その総和をデータ数で割った値(=平均値)を表す。

[一色政彦,デジタルアドバンテージ]
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説「MSE」

 統計学/機械学習における平均二乗誤差MSEMean Squared Error)とは、各データに対して「予測値と正解値の差(=誤差)」の二乗値を計算し、その総和をデータ数で割った値(=平均値)を出力する関数である。(図1)。なお誤差は、「予測値−正解値」ではなく「正解値−予測値」でもよい。

図1 「平均二乗誤差」のイメージ 図1 「平均二乗誤差」のイメージ

定義と数式

用途

 MSEは、最も一般的な損失関数として使われるだけでなく、主に回帰問題における出力層の評価関数としても用いられる。いずれの関数から出力される値も、0に近いほどより良い。

 MSEや後述するRMSEは、誤差を二乗する。そのため、誤差が大きいほど過大に評価する、つまり間違いをより重要視するという特徴がある。MSE/RMSEは、評価がしやすい指標といえるだろう。

 その利点の裏返しとして、外れ値に過敏に反応してしまうことにもなるので、損失関数として利用する場合は外れ値にも過剰適合(=過学習)してしまいやすいという問題がある。

 また、MSEは誤差を二乗することで単位が変わってしまうので(例えば元の数値「1」を2乗すると→出力結果は「1」、10の2乗100100の2乗10,000と単位が変化するので)、人間にとって単純には理解しづらいことが欠点として挙げられる。この単位問題を回避する方法としては、絶対値を使う方法(MAE:平均絶対誤差)や、ルート(√)を使って二乗した単位を元の単位に戻す方法(後述のRMSE:Root MSE)が考えられる。

API

 主要ライブラリでMSEは、次のクラス/関数で定義されている。

用語解説「RMSE」

 RMSERoot MSEMSEの平方根)とは、名前の通り、MSEの結果に対するルート(√)を求めることである。MSEで二乗した単位が元に戻るので、MSEよりも人間が理解しやすい指標だといえる。

定義と数式

API

 主要ライブラリでRMSEは、次のクラス/関数で定義されている。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

Copyright© Digital Advantage Corp. All Rights Reserved.

編集部からのお知らせ

6月16日にフォーマット統一のため利用規約を変更します

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。