Mextractr 5W1H抽出API

Mextractr WebAPIは、イベント(出来事)のメタデータ自動抽出APIです。日本語テキストを受け取ると、その中に含まれている日 時・地名・人名といったイベントのメタデータを抽出。数値化、正規化してAtom-gData 形式で返します。リアルタイムモードで提供するので、例えば今年の9月28日に「再来週金曜日朝八時」という表現を解析する と"2010-10-15T08:00:00+9:00"と出力します。

また、この5W1H抽出APIでは、弊社「個人情報99」フィルタの結果も合わせて出力します。

個人情報99は、個人情報を伏せ字化します。日本語テキストを受け取ると、その中に含まれている人名・企業/団体名・住所・ tel・クレジットカード番号・URL・メルアド等の個人情報を伏せ字化します。住所や電話番号などについては、部分伏せ字化の指定が可能です。例えば、 住所の完全な特定を避けるため、「東京都文京区【...住所1(市区町村下の地名)...】?【...住所1(丁以下の番地)...】」のように出力できます。

5W1H mextractor API attaches intelligent metadata to unstructured content written in Japanese to enable text analytics. It extracts 5W1H - proper nouns and numerical expression. 5W1H mextractor API offers content creators a way tag people, places, companies, facts, and events to increase conent value, accessibility and interoperability.
Japanese only.

 


※このバージョンは商用にご提供できません。商用のご利用要望は別途お問い合わせください。


登録に関して 

下記、利用登録フォームからお申し込みください。

http://ap.mextractr.net/ma8/signup


API呼び出しURL

http://ap.mextractr.net/ma8/mext5w1h

入力パラメータ

http://ap.mextractr.net/ma8/mext5w1h?out=atom&apikey=xxxxx&text=<URLエンコードした文字列>
パラメータ     形式     意味
text     UTF8でURLエンコードした文字列     メタデータ抽出元の文字列
out     現状"atom"だけ     出力データの形式:デフォルトはatom
apikey     文字列     MextractrのAPIキー(必須)


出力形式


:Atom

gDataのEventKindの仕様に準拠しています。
(gDataについての詳細は: Googleコードサイト内gdEventKindの解説 )

下記では、Mextractr WebAPIの仕様として注意点のあるものだけを記述しています。
文字コード:UTF-8
要素(属性)名 *は0?N回、無印は1回    データ型     説明
feed/entry/content    string     抽出元文字列すべて
(<,>,&は'&gt;','&lt;','&amp;' に置換されます)
feed/entry/gd:who(valueString) *    string     人名/法人名
法人名と推測される場合は先頭に'*'を付ける
feed/entry/gd:when(valueString) *    date/datetime     日時に関する抽出結果
feed/entry/gd:where(valueString) *    string     場所、位置に関する抽出結果
feed/entry/gd:extendedProperty name='what'(value) *    string     何をするかに関する抽出結果

また、summary内に、個人情報を伏字化したテキストを返します。


呼び出し例

http://ap.mextractr.net/ma8/mext5w1h?apikey=XXXXXXXX&out=atom&text=%e6%9d%a5%e3%82%8b10%e6%9c%8823%e6%97%a5%e3%80%81%e5%ae%9a%e6%99%82%e6%a0%aa%e4%b8%bb%e7%b7%8f%e4%bc%9a%e3%82%92%e6%96%87%e4%ba%ac%e5%8c%ba%e5%b0%8f%e7%9f%b3%e5%b7%9d2%2d1%2d2%e3%81%ae%e5%bc%8a%e7%a4%be%e6%9c%ac%e5%ba%97A%e4%bc%9a%e8%ad%b0%e5%ae%a4%e3%81%ab%e3%81%a6%e9%96%8b%e5%82%ac%e3%81%84%e3%81%9f%e3%81%97%e3%81%be%e3%81%99%e3%80%82%e6%98%af%e9%9d%9e%e3%81%94%e5%87%ba%e5%b8%ad%e3%81%84%e3%81%9f%e3%81%a0%e3%81%91%e3%81%be%e3%81%99%e3%82%88%e3%81%86%e3%81%8a%e9%a1%98%e3%81%84%e7%94%b3%e3%81%97%e3%81%82%e3%81%92%e3%81%be%e3%81%99%e3%80%82%20%e3%83%a1%e3%82%bf%e3%83%87%e3%83%bc%e3%82%bf%e6%a0%aa%e5%bc%8f%e4%bc%9a%e7%a4%be

 

パラメータの指定内容は以下のとおりです。

    * out=atom
      atom形式での出力を指定(現状、固定パラメータです)
    * apikey=XXXXXXXX
      APIキーの指定(ここではダミーです。実際の使用では、キーを取得して置換してください)
    * text= ...
      UTF-8でURLエンコードした文字列。
      内容は次のとおり:"来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社"



出力結果
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:gd="http://schemas.google.com/g/2005" xmlns:georss="http://www.georss.org/georss"xmlns:cac="urn:oasis:names:specification:ubl:schema:xsd:CommonAggregateComponents-2"xmlns:cbc="urn:oasis:names:specification:ubl:schema:xsd:CommonBasicComponents-2"xmlns:ext="urn:oasis:names:specification:ubl:schema:xsd:CommonExtensionComponents-2" xmlns:mxtr="http://api.emetadata.net/mextractr">
<title>Mextractr WebAPI results</title>
<updated>2011-09-27T23:07:24+09:00</updated>
<author>
<name>Mextractr</name>
</author>
<id>20110927_1_0</id>
<entry xmlns:gd="http://schemas.google.com/g/2005">
<category scheme="http://schemas.google.com/g/2005#kind" term="http://schemas.google.com/g/2005#event"/>
<id>20110927_1_0</id>
<title>extracted event metadata</title>
<author>
<name>Mextractr WebAPI</name>
</author>
<updated>2011-09-27T23:07:24+09:00</updated>
<content>
来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社
</content>
<summary>
来る10月23日、定時株主総会を【...住所1(市区町村)...】【...住所1(市区町村下の地名)...】-【...住所1(丁以下の番地)...】の【...地名・施設名1...】にて開催いたします。是非ご出席いただけますようお願い申しあげます。【...法人・団体名1...】
</summary>
<gd:extendedProperty name="what" value="定時株主総会"/>
<gd:who valueString="*メタデータ株式会社"/>
<gd:when startTime="2011-10-23" valueString="10月23日"/>
<gd:where valueString="弊社本店A会議室"/>
<gd:where valueString="文京区小石川2-1-2">
<mxtr:postal_address>
<mxtr:city>文京区</mxtr:city>
<mxtr:town>小石川2</mxtr:town>
<mxtr:address_num>1-2</mxtr:address_num>
</mxtr:postal_address>
</gd:where>
</entry>
</feed>
エラー出力サンプル
<?xml version="1.0" encoding="utf-8" ?>
<error>
  <message>GET/POST param apikey is invalid.</message>
</error>
 利用制限

呼び出し回数 1日1000回

Webアプリ版でお試しください!


メタデータ株式会社

  • 〒113-0033 東京都文京区
    本郷3-25-4 津久井21ビル4F
  • Tel. 03-3813-5447
    (平日 9:30 - 18:30)

企業情報

個人情報について

お問い合わせ