国内最大の日本語辞典がオンライン版を公開

「ういまご・はつまご」、正しい読みに決着

2007/07/02

 「初孫」の読みは、「ハツマゴ」か「ウイマゴ」か。

 読者にはハツマゴ派が多いかもしれないが、少しコトバにうるさい人なら、「それは新しい読みで誤読。正しくはウイマゴ」というだろう。日本語能力の低下、コトバの乱れを指摘して、ため息をつくかもしれない。

 しかし、実はハツマゴが「近頃の若者」の誤読だなどという事実はない。明治初期の三代目三遊亭円遊の落語、「三年目の幽霊」には「早く初孫(ハツマゴ)の貌(かほ)でも見たいと夫(それ)を楽しみに私は思って居るんです」との用例が見られる。

 初孫をウイマゴと読む例は、17世紀の仮名草子にまでさかのぼる。では、より古いウイマゴの読みが正統かというと、もう少し話は複雑だ。平安時代の古典、栄花物語には「ハツムマゴ」の読みが見られ、むしろ「初」をハツと読むほうが古いからだ。

 つまり、あえて決着を付けるとすれば、初孫はウイマゴ、ハツマゴのどちらの読みでも構わず、いずれかを「誤読だ」と言いつのることこそが誤りということだ。

英国に「OED」、日本に「日国」あり

 こうしたことは、小学館グループのネットアドバンスが7月2日にサービスを開始した「JKセレクトシリーズ 日国オンライン」を使えば一発で分かる。日国オンラインは、小学館が長年作り育ててきた日本語辞典「日本国語大辞典 第二版」、通称「日国」(にっこく)のオンライン版サービスだ。紙媒体で全13巻、50万項目、100万用例という膨大な日本語データベースとなっている。

nikkoku01.png 「初孫」の読みは、過去に3通りあったことが分かる
nikkoku02.jpg 今回電子化された全13巻、50万項目、100万用例の日本国語大辞典 第二版

 日国は、世界最大の日本語辞典だ。英語圏で最も権威があり最大の辞典と言われるイギリスの「オックスフォード英語辞典」にならい、古今の膨大な文献から集めた用例を、その出現年とともに採録している。日国の初版は1972年から76年にかけて全20巻として出版され、2000年に改訂、13巻からなる第2版が出ている。

nikkoku03.jpg 小学館 国語辞典編集部 編集長の佐藤宏氏

 現編集長の佐藤宏氏によれば、日国の元となった辞典は、まだ50音順の近代的な辞書が「言海」ぐらいしかなかった時代の1916年〜1921年にかけて出版された。古事記、万葉集、徒然草といった文献から実例を丹念に拾い上げる実証主義的アプローチは、当時はまだ珍しかったという。戦後、小学館がそれを引き受け、現在に至っている。元となった辞典の編纂作業は1892年に国語学者の松井簡治氏により開始されており、そこから数えると通算115年の歴史がある辞典ということになる。

方言にも強い日国

 その100年以上の歴史を持つ浩瀚な大辞典が、初めてデジタル化され、ネットで縦横に検索できるようになった。これまで小学館は、コンピュータで扱える文字の制限などからデジタル化作業を見送ってきたが、今回、一部の文字をGIFで表現することでなんとか公開できるようになったという。データはXML化し、索引や相互参照のリンクも自動生成している。5000点の関連図版も収録した。

 辞書データはフィールド情報を持っており、検索の柔軟性は高い。

 見出し、用例、本文などを指定して、論理演算を用いた高度な検索を使えば、言葉の起源や用例を調べる際に、さまざまなアプローチが可能だ。例えば「東京」という地名は、かつて「トウケイ」と読まれていた時期もあるが、トウケイ・トウキョウの変遷を調べるには、「東京 and トウキョウ」「東京 and トウケイ」と検索すれば、すぐに用例が出てくる。

 日国は方言も多く収録しているという特徴があり、検索対象を方言だけに絞ることで活用できる。例えば、「かまぎっちょ」という言葉を検索すると、それがカマキリの方言であることが瞬時に分かる。逆に「カマキリ」という標準語から各地の方言を検索することもできる。方言から標準語を探す、その逆に標準語から方言を探すという作業は、従来の紙媒体の資料ではデジタルほどの自由さがなかったという。青森や埼玉といった特定の地方ではカマキリのことをトカゲと呼ぶということも、検索とジャンプを繰り返しているうちに、すぐに分かる。

nikkoku04.png 「東京」はかつてトウケイと呼ばれていた時代もあった
nikkoku05.png 方言の検索結果では典拠となった文献もバルーン表示される

 紙の辞典では不可能な、こうした調べ物をすることで、「それぞれの言葉についての文化的な背景について知ることができ、われわれの日本語の力も強力なものになっていく」(佐藤編集長)。「初孫」の例でいえば、「ハツマゴ」「ウイマゴ」の読みから調べたのでは「ハツウマゴ」という例には気付かない、ということもある。

 将来はWeb2.0的なCGMコンテンツの融合も視野に入れ、現在、ネット上で「日国友の会」も運営中だ。日国友の会には、1日に50件前後の用例報告が寄せられており、「いずれ用例の公募サイトと本体をリンクしていくことも考えていく」(同)。

大学や図書館を中心に、個人にも提供

 日国オンラインの利用料金は、法人契約の場合、同時1アクセスで月額1万5750円(税込み)から。主に大学や図書館などでの利用を想定しているが、個人でも利用できる。個人ユーザーは月額1575円(税込み)。

 ネットアドバンスでは、百科事典や現代用語辞典を含む辞典・事典類を集めた会員制サイト「ジャパンナレッジ」を運営している。今回の日国オンラインも、同サイトの1コンテンツとしても公開されており、会員であれば割引利用ができる。

  ネットアドバンス副社長の黒木重昭氏は、これまでのジャパンナレッジの運営を振り返り、「私が赴任した3年前には、会員として60〜70の法人しかなかった。今は400法人を超え、年内に500に手が届きそうだ」と話す。Wikipediaやフリーのオンライン辞書といったライトなツールが人気を集める昨今だが、規範性が高く、実証主義的アプローチを取る重厚な知のオンラインデータベースが、どこまで普及・発展するのか、今後が注目される。

(@IT 西村賢)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)