5W1H API試用・技術仕様について


Mextractr WebAPIは、イベント(出来事)のメタデータ自動抽出APIです。日本語テキストを受け取ると、その中に含まれている日 時・地名・人名といったイベントのメタデータを抽出。数値化、正規化してAtom-gData 形式で返します。
リアルタイムモードで提供するので、例えば今年の9月28日に「再来週金曜日朝八時」という表現を解析する と”2010-10-15T08:00:00+9:00″と出力します。

また、この5W1H抽出APIでは、弊社「個人情報99」フィルタの結果も合わせて出力します。

個人情報99は、個人情報を伏せ字化します。

日本語テキストを受け取ると、その中に含まれている人名・企業/団体名・住所・ tel・クレジットカード番号・URL・メルアド等の個人情報を伏せ字化します。住所や電話番号などについては、部分伏せ字化の指定が可能です。
例えば、 住所の完全な特定を避けるため、「東京都文京区【…住所1(市区町村下の地名)…】?【…住所1(丁以下の番地)…】」のように出力できます。

5W1H mextractor API attaches intelligent metadata to unstructured content written in Japanese to enable text analytics. It extracts 5W1H – proper nouns and numerical expression. 5W1H mextractor API offers content creators a way tag people, places, companies, facts, and events to increase conent value, accessibility and interoperability.
Japanese only.

 

※このバージョンは商用にご提供できません。商用のご利用要望は別途お問い合わせください。

API呼び出しURL:登録時のご案内メールに記載
入力パラメータ:(呼び出しURL)?out=atom&apikey=xxxxx&text=<URLエンコードした文字列>
パラメータ     形式     意味
text     UTF8でURLエンコードした文字列     メタデータ抽出元の文字列
out     現状”atom”だけ     出力データの形式:デフォルトはatom
apikey     文字列     MextractrのAPIキー(必須)

出力形式

:Atom

gDataのEventKindの仕様に準拠しています。
(gDataについての詳細は: Googleコードサイト内gdEventKindの解説 )

下記では、Mextractr WebAPIの仕様として注意点のあるものだけを記述しています。
文字コード:UTF-8
要素(属性)名 *は0?N回、無印は1回    データ型     説明
feed/entry/content    string     抽出元文字列すべて
(<,>,&は’&gt;’,’&lt;’,’&amp;’ に置換されます)
feed/entry/gd:who(valueString) *    string     人名/法人名
法人名と推測される場合は先頭に’*’を付ける
feed/entry/gd:when(valueString) *    date/datetime     日時に関する抽出結果
feed/entry/gd:where(valueString) *    string     場所、位置に関する抽出結果
feed/entry/gd:extendedProperty name=’what'(value) *    string     何をするかに関する抽出結果

また、summary内に、個人情報を伏字化したテキストを返します。

パラメータの指定内容は以下のとおりです。

* out=atom
atom形式での出力を指定(現状、固定パラメータです)
* apikey=XXXXXXXX
APIキーの指定(ここではダミーです。実際の使用では、キーを取得して置換してください)
* text= …
UTF-8でURLエンコードした文字列。
内容は次のとおり:”来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社”

出力結果
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:gd="http://schemas.google.com/g/2005" xmlns:georss="http://www.georss.org/georss"xmlns:cac="urn:oasis:names:specification:ubl:schema:xsd:CommonAggregateComponents-2"xmlns:cbc="urn:oasis:names:specification:ubl:schema:xsd:CommonBasicComponents-2"xmlns:ext="urn:oasis:names:specification:ubl:schema:xsd:CommonExtensionComponents-2" xmlns:mxtr="http://api.emetadata.net/mextractr">
<title>Mextractr WebAPI results</title>
<updated>2011-09-27T23:07:24+09:00</updated>
<author>
  <name>Mextractr</name>
</author>
<id>20110927_1_0</id>
<entry xmlns:gd="http://schemas.google.com/g/2005">
<category scheme="http://schemas.google.com/g/2005#kind" term="http://schemas.google.com/g/2005#event"/>
<id>20110927_1_0</id>
<title>extracted event metadata</title>
<author>
  <name>Mextractr WebAPI</name>
</author>
<updated>2011-09-27T23:07:24+09:00</updated>
<content>
  来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社
</content>
<summary>
  来る10月23日、定時株主総会を【...住所1(市区町村)...】【...住所1(市区町村下の地名)...】-【...住所1(丁以下の番地)...】の【...地名・施設名1...】にて開催いたします。是非ご出席いただけますようお願い申しあげます。【...法人・団体名1...】
</summary>
<gd:extendedProperty name="what" value="定時株主総会"/>
<gd:who valueString="*メタデータ株式会社"/>
<gd:when startTime="2011-10-23" valueString="10月23日"/>
<gd:where valueString="弊社本店A会議室"/>
<gd:where valueString="文京区小石川2-1-2">
  <mxtr:postal_address>
    <mxtr:city>文京区</mxtr:city>
    <mxtr:town>小石川2</mxtr:town>
    <mxtr:address_num>1-2</mxtr:address_num>
  </mxtr:postal_address>
</gd:where>
</entry>
</feed>
 利用制限

呼び出し回数 1日100回

Webアプリ版でお試しください!


他のAPI

Mextractr WebAPIは、イベント(出来事)のメタデータ自動抽出APIです。日本語テキストを受け取ると、その中に含まれている日 時・地名・人名といったイベントのメタデータを抽出。数値化、正規化してAtom-gD […]

Contact

弊社のサービス・APIについてお気軽にご連絡・ご相談ください

> お問い合わせはこちらから <