APIコールだけでおよそ欲しい画像認識系の機能が使えるGoogle Cloud Vision APIとは：Raspberry Piとちょっとのコード実装で「バナナです」

グーグルの画像認識APIが限定プレビューに。画像認識や分類などの手間の掛かる実装をAPIコールで外に出せるため、一般的な用途であれば端末側を賢く作り上げる必要がなくなる。

» 2015年12月04日 15時00分公開

　2015年12月2日、Google Cloud PlatformのプロダクトマネジャーであるRam Ramanathan氏が、Google Cloud Vision API（以下、Cloud Vision API）の限定プレビュー版を発表。既にソニーモバイルコミュニケーションズの子会社で商用ドローンなどの事業を手掛けるAerosense（エアロセンス）がアーリーテスターとしてこのAPIを利用しているという。

顔の各パーツの座標などを検出できる（出典：Cloud Vision APIのYoutube動画、以下同様）

　Ramanathan氏は「Cloud Vision APIはあらゆるタイプのアプリケーション開発者にゲームチェンジをもたらすもの」だと記している。というのも、画像認識や自動分類などの機能をAPIコールで簡単に利用できるからだ。このAPIは、グーグルが先日提供を開始した機械学習ライブラリ「TensorFlow」の機能を、複雑なプログラムを組むことなく利用できるようにしている。特殊なパターンや分類方法を学習させて利用するような用途でなければ、このAPIで処理をまかなえるものも少なくないだろう。

　Ramanathan氏によると「Cloud Vision APIは迅速に画像を数千にも及ぶカテゴリに分類し、関連する感情と共に顔を認識し、多様な言語で書かれた印刷物の単語を理解できる」という。Cloud Vision APIを利用すると画像カタログにメタデータを構築でき、不快な画像の表示を防いだり、画像が含む「感情」の分析を基にした新しいマーケティングシナリオを構築したりすることができる。あるいは、画像に含まれる象徴的な要素に対してラベル付けを行うことで、画像ベースの検索やレコメンドも可能だ。この他、製品ロゴや一般的なランドマークも検出できるという。

　すでにYouTubeにはCloud Vision APIを利用したロボットのデモ動画が公開されている。周辺の物体を認識しながら走行するだけでなく、「笑顔」を認識することもできるという。Raspberry Piをベースにしたロボット開発キット（GoPiGo）と数百行程度のPythonコードで実装している。

Youtubeのデモ

「バナナです」　カテゴリ“BANANA”が返されている

　現在、登録制の限定プレビュー版ではリクエストの一部として画像を埋め込めば、このAPIを無料でコールできるようになっており、正式サービスでの料金は今後アナウンスするとしている。なお将来的には、Google Cloud Storage上でのシステム構築を可能にする予定。グーグル自身が画像に関連するデータを保有することはないとしている。

もう絶望しない！ディープラーニングによる画像認識のビジネス活用事例
最近注目を浴びることが多くなった「Deep Learning」と、それを用いた画像に関する施策周りの実装・事例について、リクルートグループにおける実際の開発経験を基に解説していく連載。今回は、Deep Learning／CNN（Convolutional Neural Net）をどうビジネスに活用しているかに焦点を当て、その試行錯誤の過程を紹介します。
機械学習で画像処理はここまで変わる：顔写真3Dモデル化、絶対フォント感、複数画像検索、観光写真無人化、陰影分離、簡単フォント自作、消失点自動作成――デザイナー／クリエイターが茫然自失で拍手喝采な最先端技術動画11連発
アドビシステムズは、2015年10月6日（現地時間）に開催した「Adobe MAX 2015 Sneak Peeks」で、11の新技術を披露。顔写真3Dモデル化、絶対フォント感、複数画像検索、観光写真無人化、陰影分離、簡単フォント自作、消失点自動作成naなど、今回もデザイナー／クリエイターのみならず、日常的にデジカメやスマホで写真を撮る人でも欲しくなるような機能が多数見られた。
画像処理や機械学習も簡単に：Windows系ITエンジニアのための産業用ドローン開発環境
Windows系のITエンジニアのための産業用ドローン開発環境が登場。ドローンワークスは、Windows 10 IoTとMicrosoft Azureを組み合わせた新たなドローン開発プラットフォームを「IoT Technology 2015」で展示。
Deep Dreamを簡単に体験：グーグルの人工知能を利用できるWebインターフェースが登場
オズミックコーポレーションとイントロンワークスは7月7日、グーグルの人工知能アルゴリズム「Deep Dream」を利用できるWebインターフェースを公開した。