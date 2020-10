連載目次

QMNISTデータセット(以下、QMNIST)は、

といった手書き数字の画像データセットである(図1)。

QMNISTは、MNISTの改良版/再構築版として、NIST Special Database 19から抽出&加工して作られたサブセットである。MNISTの代わりとして、主に画像認識を目的としたディープラーニング/機械学習の研究や初心者向けチュートリアルで使われることが想定される。

中身の画像データやラベルはMNISTデータセット(以下、MNIST)とほぼ同じであるが、

が異なる。

まず6万件に増やした理由については、論文「Cold Case: The Lost MNIST Digits」(2019年、arXiv:1905.10498)やFacebook AI Research(FAIR)が公開するGitHub上のqmnist公式サイトで、次のように言及されている。

The official MNIST testing set only contains 10K randomly sampled images and is often considered too small to provide meaningful confidence intervals.

(訳:公式のMNISTにおけるテストデータは、ランダムサンプリングされた1万枚の画像しか含まれておらず、(統計的に)意味のある信頼区間を提供するには小さすぎる、と多くの場合、考えられる。)