5W1H抽出API


5W1H抽出APIとは

 5W1H抽出APIは、日本語テキストを受け取ると、その中に含まれている日時・地名・人名といったイベントのメタデータを抽出して、数値化、正規化してAtom-gData 形式で返します。 
    また、リアルタイムモードで提供するので、例えば今年の9月28日に「再来週金曜日朝八時」という表現を解析する と”2010-10-15T08:00:00+9:00″と出力します。

APIご試用ページはこちら

個人情報99の使用

 また、この5W1H抽出APIでは、弊社「個人情報99」フィルタの結果も合わせて出力します。

個人情報99は、個人情報を伏せ字化します。日本語テキストを受け取ると、その中に含まれている人名・企業/団体名・住所・ tel・クレジットカード番号・URL・メルアド等の個人情報を伏せ字化します。住所や電話番号などについては、部分伏せ字化の指定が可能です。例えば、 住所の完全な特定を避けるため、「東京都文京区【…住所1(市区町村下の地名)…】?【…住所1(丁以下の番地)…】」のように出力できます。 


個人情報99の使用例
 

このことにより、設定・登録せずに個人情報漏洩対策が行えます。 

 

例えば、


来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社


というテキストを入力した場合、


 what value=定時株主総会

 who=メタデータ株式会社

 when staratTime=2011-10-23

 where=弊社本店A会議室/文京区小石川2-1-2



のように抽出されて表示されます。

 

使用例

 5W1H抽出APIは、以下に示したように様々な場面での活用が考えられます。

 

 


利用例


他のAPI

日本語のテキスト中に含まれている日時・地名・人名といったイベントのメタデータを抽出します。
雑然とした背景画像の中から猫を検出します。
画像に類似する猫の種類上位5種の名前とその確率値を、呼び出したアプリケーションに返します。
ソーシャルに流れる投稿の中から、人々の「したいこと」を検索します。
入力された特定の単語に対して、そこから連想される・関連度の高い単語のリストを提示します。
テキストデータ内に含まれる、わいせつ・誹謗中傷・犯罪・暴力等10ジャンルのNG表現を自動判断します。
10万以上の日本語語彙を、約1万種の意味カテゴリ―に区別して認識します。
文章を解析しスコアリングすることで、文章全体のネガポジ値(肯定的/否定的の度合い)を点数化します。
日本語文章を「好ましい―嫌い」「嬉しい―悲しい」「怒り―怖 れ」の3軸・6種の感情で解析します。

Contact

弊社のサービス・APIについてお気軽にご連絡・ご相談ください