猫発見機API


 

猫発見機APIは、雑然とした背景画像の中から複数の猫らしき画像を検出して、それらを長方形で囲む、物体検出APIです。

 

このAPIは、APIエコノミー、オープンイノベーション推進の核となるプログラミングコンテスト、Line Boot Award2018,LOD Challenge2018,Mashup Award2018,ならびに関連のハッカソン参加者に、具体的な猫の種別を判定する「この猫なに猫?(what cat)」APIとともに、無償で提供されます。

 

開発背景

 

メタデータ株式会社では、機械学習における正解データの整備に別のAIを活用する “AI for AI”構想 を提唱しています。

 

現在の画像判定/分類の業務フローでは、「対象物がありそうな領域を無意識に絞る」「領域の中に何があるかを正確に把握する」「種類ごとに物の数を数える」といった人間の持つ多彩な視覚能力を活用しています。しかし、それら全てを単一のAIに対応させることには現状無理があります。

 

そこで、前工程の典型例である「対象物がありそうな領域を絞る」という働きをするAIとして、画像中の猫らしきものがいる領域を切り出す「猫発見器」APIを開発・リリースしました。

 

猫発見器APIについて

 

上の図は、猫候補とそれ以外を識別して長方形の領域を切り出す様子です。猫のみを赤線の長方形枠で囲んでCATと表示し、犬は判定から外れています。

 

この「猫発見器」APIは、汎用の高性能物体検出AIの仕組みを持っているので、領域を検出する対象物を猫以外のものとし、正解データを用意すれば、その対象物についても高い発見能力を発揮します。

 

物体名検出APIによる後工程との組み合わせ

 

 

上の図は、猫の画像を検出する「猫発見器」APIを前工程、具体的な猫の種別を判定する「この猫なに猫?(what cat)」APIを後工程として構成したシステム(アプリ)の処理の流れを示しています。

 

このように、複数のAIを工程別に組み合わせることで、精度の高い視覚情報処理を行うことが出来ます。

 

猫発見器APIの利用方法

 

URL : http://metacatdetector.ap.mextractr.net/infer

 

コマンドライン上で

curl -X POST -o [ダウンロードしたあとの保存ファイル名.jpg] http://metacatdetector.ap.mextractr.net/infer -F image=@[判別したいファイル]

 

ファイルサイズに関わらず、5-8秒を目安に判別結果が出力されます。

 

デモンストレーション

 

下の画像(testcat.jpg)から猫を検出してみます。

 

 

コマンドライン上で

curl -X POST -o result.jpg  http://metacatdetector.ap.mextractr.net/infer -F image=@/Users/ユーザー名/Desktop/testcat.jpg

 

 

今回は4秒で出力されました。

 

 

猫がいる範囲が長方形で囲まれて出力されました。

 

 

開発者向け追加情報

エンドポイントを以下の通り「http://metacatdetector.ap.mextractr.net/infer.json」に変更すると、返り値が座標を格納したjsonデータになります。

<コマンド例>
curl -X POST http://metacatdetector.ap.mextractr.net/infer.json -F image=@/Users/ユーザー名/Desktop/testcat.jpg

<返り値の例>

{“cats”:[{“height”:294,”left”:145,”top”:135,”width”:115}]}


利用例


他のAPI

日本語のテキスト中に含まれている日時・地名・人名といったイベントのメタデータを抽出します。
雑然とした背景画像の中から猫を検出します。
画像に類似する猫の種類上位5種の名前とその確率値を、呼び出したアプリケーションに返します。
ソーシャルに流れる投稿の中から、人々の「したいこと」を検索します。
入力された特定の単語に対して、そこから連想される・関連度の高い単語のリストを提示します。
テキストデータ内に含まれる、わいせつ・誹謗中傷・犯罪・暴力等10ジャンルのNG表現を自動判断します。
10万以上の日本語語彙を、約1万種の意味カテゴリ―に区別して認識します。
文章を解析しスコアリングすることで、文章全体のネガポジ値(肯定的/否定的の度合い)を点数化します。
日本語文章を「好ましい―嫌い」「嬉しい―悲しい」「怒り―怖 れ」の3軸・6種の感情で解析します。

Contact

弊社のサービス・APIについてお気軽にご連絡・ご相談ください

> お問い合わせはこちらから <