連載
» 2011年10月21日 10時00分 公開

ものになるモノ、ならないモノ(45):エモーショナルな文字入力を可能にした「7notes」の秘密 (1/2)

浮川夫妻がジャストシステムの時代から培ってきた日本語入力処理技術と、近年登場した格段に進化したハードウェアが高い次元で融合して生まれた「7notes」。その気持ちよさの秘密に迫ってみた。

[山崎潤一郎,@IT]
インデックス

連載目次

「あめんぼ」の移動のように滑らかな書き心地

 先日、iPadを使っている友人が「手書き入力なんてかえって面倒なだけで使えないよ」と言い放った。話を聞いてみると、昔使っていた「Newton」や「Palm」でのネガティブ体験をそのまま引きずっているようだ。

 筆者は諭した。「いやいや、ダンナ! 当時とは異なり、いまはあらゆることが各段に進歩している。手書き入力もバッチリ実用域に達してまっせ。疑うなら『7notes』を使ってみな」と。それから数日後、その友人から「カンドーした!」というメールが届いた。

 手書きで文字入力が可能なメモアプリ「7notes」による入力の気持ちよさを、何と表せばよいのだろうか。波紋1つない鏡のような水面でスーッと指を滑らせたときのような爽快感。滑らかな曲線を伴って指先に追従する文字の軌跡は、水面を自在に移動する「あめんぼ」のようだ。

 この気持ちよさがあってこその手書き入力だし、ここまでの快適性を実現しなければ、手書き文字入力は成り立たないなのだろう、と思う。

【関連記事】

制約が生んだ新UI、手書きメモ「7notes」iPhone版が登場(ITmedia News)
http://www.atmarkit.co.jp/news/201105/27/7notes.html

手書き文字認識アプリで世界に挑戦、メタモジ(ITmedia News)
http://www.atmarkit.co.jp/news/201108/25/metamoji.html


ハードウェアの進化が理想に追い付いた

 「7notes」を開発したMetaMojiの浮川和宣社長と浮川初子専務は「NewtonやPalmの時代と比較して、いまは、CPUパワーやセンサの解像度といったハードウェアの能力が各段に進歩した。手書き入力が実用に耐えるようになったのは、このような背景があるから」という。

浮川和宣社長(左)と浮川初子専務(右) 浮川和宣社長(左)と浮川初子専務(右)。ATOKで日本語を知り尽くした浮川夫妻が次に目指したのは、タッチパネル型端末における手書き入力の完成。ビジョナリー型人間の社長と優秀なプログラマである専務と話していると、Apple創業時の2人のスティーブを連想する。といっても2人のスティーブには会ったことはないが……。

 確かにそうだろう。約10年前に使っていたソニーの「CLIE」(PalmOSで動作)は、決められたルールにのっとった一筆書きをマスターした上で、ローマ字入力のために一文字一文字ひらがなを書き入れる必要があった。つまり、人間が機械に合わせていたのだ。PalmOSは、当時としては非常に優れたOSだったが、ハードウェアの制約からこのような結果になった部分も多々あるだろう。

 そしていま、我々は、iPadやiPhoneという各段に進化したハードウェアを手に入れた。いまさらいうまでもないが、CPUやタッチパネルのセンサは、驚くほどの進化を遂げている。そして、そのような進化したハードウェアと、浮川夫妻がジャストシステムの時代から連綿と培ってきた卓越した日本語入力の処理技術が高い次元で融合したことで、「7notes」が誕生したのだ。浮川夫妻が開発者として追い求めていた理想の文字入力に、ハードウェアの進化が追い付いたといえよう。

 実際、浮川社長は「手書き入力技術をiPhoneやiPadに対応させるにあたり、どこかで妥協したり、我慢しなければならないことを覚悟していたが、十分に満足する仕上がり」と顔をほころばせる。

 一方、浮川専務は、「7notes」の手書きの気持ちよさを「インテグレーションの集大成」という言葉で言い表す。それは、(1)インキング(画像処理)、(2)文字認識技術、(3)日本語辞書、(4)ユーザビリティといったソフトウェア技術が集結することで、進化したハードウェアの性能を十分に引き出し、それぞれの領域で高度な処理をしているからこその結果なのだという。

漢字と仮名の交ぜ書きで変換効率向上

 手書き文字の処理について一例を示そう。

 下図の左の画面は、iPhone版である「7notes mini(J) for iPhone」で「能」という文字を入力しようとしているところだ。この「能」の1文字で「約500点のXY座標を拾って処理している」(浮川専務)という。iPhoneの画面に1文字入れただけでも、これだけの座標を識別する必要があるが、それを高速に処理するハードウェア性能があってこその手書き処理なのだ。

 とはいっても、ハードウェアの能力にばかり依存していたのでは、ここまで軽快な手書き入力は実現できないそうだ。

手書きエリアに書かれた「能」1文字で、「約500点のXY座標を拾って文字認識の処理を行い、変換の候補を表示する」作業を行っている 手書きエリアに書かれた「能」1文字で、「約500点のXY座標を拾って文字認識の処理を行い、変換の候補を表示する」作業を行っている
4分の1の円を描くと、通常は約50の座標を取得するが、アルゴリズムを使って座標を間引くことで約10座標にまでダイエットして処理を行うことが可能 4分の1の円を描くと、通常は約50の座標を取得するが、アルゴリズムを使って座標を間引くことで約10座標にまでダイエットして処理を行うことが可能

 右の画面は、手書き文字エリアに4分の1の円を描いたところ。通常であれば、これだけで約50カ所程度の座標を取得する。だが、「少しでも認識の動作を軽くするために、アルゴリズムを使って座標を間引くための処理を行う」(浮川社長)という。

 この場合、描かれた手書きの軌跡は、人間が見て「4分の1の円だ」と視認できさえすればいいので、データ的には10座標程度まで間引いているという。例えていうなら、PCM録音された音源ファイルを、人間が聴いても劣化していることが分からないように、MP3などに圧縮処理して容量を減らすようなものであろう。

 そうやって認識した画像から最適な文字を拾い出し、変換候補として表示する。このあたりの日本語の辞書に関する技術が優れていることは、ジャストシステム時代にATOKを開発した当事者だけに、いまさら特段の説明は不要であろう。

 ただし、従来のパソコン向けIMEでは実現できない、タッチパネル端末ならではの「mazec(マゼック)」と呼ばれる変換技術が盛り込まれていることは特筆すべきだ。

漢字と仮名を交ぜ書きすることで、すべて仮名で入力する場合に比べ変換候補の絞り込みが容易になる。漢字を忘れた場合でも入力できるというメリットもある 漢字と仮名を交ぜ書きすることで、すべて仮名で入力する場合に比べ変換候補の絞り込みが容易になる。漢字を忘れた場合でも入力できるというメリットもある

 mazecは、MetaMojiが独自に開発した手書き入力向けのIMEとその技術名。その仕組みを知ると、確かにパソコンにおけるキーボード入力では、この技術を使うことは不可能だと分かる。要は、漢字と仮名を“交ぜて書く”ことにより、変換効率を上げることができるというものだ。

 左の画面では、「公園」と入力しようとしている。手書きで「公えん」と入れることで、候補の先頭に「公園」が出ているのが分かる。これは、2文字目の入力が「えん」と仮名であっても、1文字目に描かれた「公」の漢字から、次に来る字が「園」あるいは「演」になるであろうと判断しているのだ。候補が絞り込まれたことで変換効率が一気に上がる。

 キーボード入力のパソコンならこうはいかない。「kouenn」とタイプし「こうえん」から変換するので、IMEが学習されていない状態では、「講演、後援、好演、公苑……」など、多数の選択肢が示され、効率が低下する場合もある。

 mazecは、まさに「交ぜ書き」という手書き入力の特性を十二分に生かした技術なのだ。もちろん、変換効率が高まるというメリットだけでなく、「漢字を忘れて書けない」あるいは「画数が多くて書きにくい」といった場合においても、快適な入力の実現に一役も二役も買っているのはいうまでもない。

       1|2 次のページへ

Copyright© 2018 ITmedia, Inc. All Rights Reserved.

@IT Special

- PR -

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。