猫発見機APIは、雑然とした背景画像の中から複数の猫らしき画像を検出して、それらを長方形で囲む、物体検出APIです。
このAPIは、APIエコノミー、オープンイノベーション推進の核となるプログラミングコンテスト、Line Boot Award2018,LOD Challenge2018,Mashup Award2018,ならびに関連のハッカソン参加者に、具体的な猫の種別を判定する「この猫なに猫?(what cat)」APIとともに、無償で提供されます。
メタデータ株式会社では、機械学習における正解データの整備に別のAIを活用する “AI for AI”構想 を提唱しています。
現在の画像判定/分類の業務フローでは、「対象物がありそうな領域を無意識に絞る」「領域の中に何があるかを正確に把握する」「種類ごとに物の数を数える」といった人間の持つ多彩な視覚能力を活用しています。しかし、それら全てを単一のAIに対応させることには現状無理があります。
そこで、前工程の典型例である「対象物がありそうな領域を絞る」という働きをするAIとして、画像中の猫らしきものがいる領域を切り出す「猫発見器」APIを開発・リリースしました。
上の図は、猫候補とそれ以外を識別して長方形の領域を切り出す様子です。猫のみを赤線の長方形枠で囲んでCATと表示し、犬は判定から外れています。
この「猫発見器」APIは、汎用の高性能物体検出AIの仕組みを持っているので、領域を検出する対象物を猫以外のものとし、正解データを用意すれば、その対象物についても高い発見能力を発揮します。
上の図は、猫の画像を検出する「猫発見器」APIを前工程、具体的な猫の種別を判定する「この猫なに猫?(what cat)」APIを後工程として構成したシステム(アプリ)の処理の流れを示しています。
このように、複数のAIを工程別に組み合わせることで、精度の高い視覚情報処理を行うことが出来ます。
URL :
コマンドライン上で
curl -X POST -o [ダウンロードしたあとの保存ファイル名.jpg] -F image=@[判別したいファイル]
ファイルサイズに関わらず、5-8秒を目安に判別結果が出力されます。
下の画像(testcat.jpg)から猫を検出してみます。
コマンドライン上で
curl -X POST -o result.jpg http://metacatdetector.ap.mextractr.net/infer -F image=@/Users/ユーザー名/Desktop/testcat.jpg
今回は4秒で出力されました。
猫がいる範囲が長方形で囲まれて出力されました。
エンドポイントを以下の通り「http://metacatdetector.ap.mextractr.net/infer.json」に変更すると、返り値が座標を格納したjsonデータになります。
<コマンド例>
curl -X POST -F image=@/Users/ユーザー名/Desktop/testcat.jpg
<返り値の例>
{“cats”:[{“height”:294,”left”:145,”top”:135,”width”:115}]}
他のAPI