Mextractr WebAPIは、イベント(出来事)のメタデータ自動抽出APIです。日本語テキストを受け取ると、その中に含まれている日 時・地名・人名といったイベントのメタデータを抽出。数値化、正規化してAtom-gData 形式で返します。
リアルタイムモードで提供するので、例えば今年の9月28日に「再来週金曜日朝八時」という表現を解析する と”2010-10-15T08:00:00+9:00″と出力します。
また、この5W1H抽出APIでは、弊社「個人情報99」フィルタの結果も合わせて出力します。
個人情報99は、個人情報を伏せ字化します。
日本語テキストを受け取ると、その中に含まれている人名・企業/団体名・住所・ tel・クレジットカード番号・URL・メルアド等の個人情報を伏せ字化します。住所や電話番号などについては、部分伏せ字化の指定が可能です。
例えば、 住所の完全な特定を避けるため、「東京都文京区【…住所1(市区町村下の地名)…】?【…住所1(丁以下の番地)…】」のように出力できます。
5W1H mextractor API attaches intelligent metadata to unstructured content written in Japanese to enable text analytics. It extracts 5W1H – proper nouns and numerical expression. 5W1H mextractor API offers content creators a way tag people, places, companies, facts, and events to increase conent value, accessibility and interoperability.
Japanese only.
※このバージョンは商用にご提供できません。商用のご利用要望は別途お問い合わせください。
:Atom
gDataのEventKindの仕様に準拠しています。
(gDataについての詳細は: Googleコードサイト内gdEventKindの解説 )
下記では、Mextractr WebAPIの仕様として注意点のあるものだけを記述しています。
文字コード:UTF-8
要素(属性)名 *は0?N回、無印は1回 データ型 説明
feed/entry/content string 抽出元文字列すべて
(<,>,&は’>’,’<’,’&’ に置換されます)
feed/entry/gd:who(valueString) * string 人名/法人名
法人名と推測される場合は先頭に’*’を付ける
feed/entry/gd:when(valueString) * date/datetime 日時に関する抽出結果
feed/entry/gd:where(valueString) * string 場所、位置に関する抽出結果
feed/entry/gd:extendedProperty name=’what'(value) * string 何をするかに関する抽出結果
また、summary内に、個人情報を伏字化したテキストを返します。
パラメータの指定内容は以下のとおりです。
* out=atom
atom形式での出力を指定(現状、固定パラメータです)
* apikey=XXXXXXXX
APIキーの指定(ここではダミーです。実際の使用では、キーを取得して置換してください)
* text= …
UTF-8でURLエンコードした文字列。
内容は次のとおり:”来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社”
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:gd="http://schemas.google.com/g/2005" xmlns:georss="http://www.georss.org/georss"xmlns:cac="urn:oasis:names:specification:ubl:schema:xsd:CommonAggregateComponents-2"xmlns:cbc="urn:oasis:names:specification:ubl:schema:xsd:CommonBasicComponents-2"xmlns:ext="urn:oasis:names:specification:ubl:schema:xsd:CommonExtensionComponents-2" xmlns:mxtr="http://api.emetadata.net/mextractr"> <title>Mextractr WebAPI results</title> <updated>2011-09-27T23:07:24+09:00</updated> <author> <name>Mextractr</name> </author> <id>20110927_1_0</id> <entry xmlns:gd="http://schemas.google.com/g/2005"> <category scheme="http://schemas.google.com/g/2005#kind" term="http://schemas.google.com/g/2005#event"/> <id>20110927_1_0</id> <title>extracted event metadata</title> <author> <name>Mextractr WebAPI</name> </author> <updated>2011-09-27T23:07:24+09:00</updated> <content> 来る10月23日、定時株主総会を文京区小石川2-1-2の弊社本店A会議室にて開催いたします。是非ご出席いただけますようお願い申しあげます。 メタデータ株式会社 </content> <summary> 来る10月23日、定時株主総会を【...住所1(市区町村)...】【...住所1(市区町村下の地名)...】-【...住所1(丁以下の番地)...】の【...地名・施設名1...】にて開催いたします。是非ご出席いただけますようお願い申しあげます。【...法人・団体名1...】 </summary> <gd:extendedProperty name="what" value="定時株主総会"/> <gd:who valueString="*メタデータ株式会社"/> <gd:when startTime="2011-10-23" valueString="10月23日"/> <gd:where valueString="弊社本店A会議室"/> <gd:where valueString="文京区小石川2-1-2"> <mxtr:postal_address> <mxtr:city>文京区</mxtr:city> <mxtr:town>小石川2</mxtr:town> <mxtr:address_num>1-2</mxtr:address_num> </mxtr:postal_address> </gd:where> </entry> </feed>
呼び出し回数 1日100回
Webアプリ版でお試しください!
他のAPI