Google Cloud Vision APIのパブリックβ版が公開：画像認識機能が使えるAPI

米グーグルは2016年2月18日、「Google Cloud Vision API」のパブリックβ版を公開した。APIコールのみで画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識（OCR）機能を利用できる。

[原田美穂，＠IT] PC用表示関連情報

LINE

Hatena

　米グーグルは2016年2月18日（米国時間）、「Google Cloud Vision API」のパブリックβ版を公開した。Google Cloud Vision APIは2015年12月に限定β版として発表していたもの。パブリックβ版になったことで、誰でも試せるようになった。APIコールのみで、画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識（OCR）機能を利用できる。

Google Cloud Vision APIによる画像認識のイメージ（出典：米グーグル）

　限定β版で提供されていた「APIリクエストに画像を埋め込む方法」に加えて、グーグルのクラウドストレージサービスである「Google Cloud Storage」に格納した画像を指定する方法も用意されている。APIの詳細はドキュメントで公開されている。

{
  "requests":[
    {
      "image":{
        "source": {
          "gcs_image_uri":"gs://bucket-name/path_to_image_object"
        }
      },
      "features": [
        {
          "type":"LABEL_DETECTION",
          "maxResults":1
        }
      ]
    }
  ]
}

Google Cloud Storageの画像を指定してラベル付けを行う場合のサンプルコード（出典：Google Cloud Vision APIのドキュメント）

　このAPIの利用料金は「ユニット」単位で行われる。1つの画像であっても「顔検知」と「ラベル検知」を行った場合は2ユニットとカウントする。日本語版のGoogle Cloud Vision APIを紹介するWebサイトによると、それぞれの機能は1000ユニットまで無料。価格は、ユニット数が多くなればなるほど単価が安くなるように設定されている。

Google Cloud Vision APIの料金（出典：グーグル）

Google Cloud Vision APIのパブリックβ版が公開：画像認識機能が使えるAPI

関連記事

関連リンク

Coding Edge 記事ランキング