gooラボ 時刻情報正規化API を試した

2018年6月28日木曜日

gooラボ

t f B! P L

gooラボ 時刻情報正規化API を試した

はじめに

goo ラボが提供している[時刻情報正規化API]を試してみました。
“今日”, “明日”, "○日後"などの表現を、
"yyyy-mm-dd"形式の日付表現に正規化してくれます。

公式ドキュメント

試す

今日が “2018-06-28” とした場合の出力結果です。

↓入力文字

昨日は曇りでした。
今日は晴天です。
明日は雨です。
明後日も雨です。
10日後は嵐です。
2ヶ月後はおそらく雨です。
半年後は分かりません。
1年後もわかりません。
100年後は地球があるか分かりません。

↓実行結果

["昨日","2018-06-27"]
["今日","2018-06-28"]
["明日","2018-06-29"]
["明後日","2018-06-30"]
["10日後","2018-07-10"]
["2ヶ月後","2018-09-10"]
["1年後","2019"]
["100年後","2118"]

半年後は認識しないみたいです。。。
○年後を入力すると、実行結果は "yyyy"の年だけになります。

キーワード抽出APIなどと組み合わせれば、
自動でカレンダーの予定とかが作成できそうですね。

サンプルコード (ruby)

以下のサンプルの chrono 関数に、解析対象の文字列を渡すと、
結果を配列で返却します。

require  'net/https'
require  'json'

  # ご自身のapikeyに書き換えてください
  CLIENT_ID = "xxxxxxxxxxxxxxxxxxxxxxxxxxxx"

  ##
  # 時刻情報正規化APIの実行
  # @param sentence 解析対象のテキスト
  #  - chrono : 時刻情報正規化API
  #  - entity : 固有表現抽出API
  # @result 正規化前後の情報を格納したリスト
  #   [[ "明日", "2018-06-29" ],[ "10日後", "2018-07-10" ]]
  def chrono(sentence) 
    result = exec(sentence, "chrono")
    result["datetime_list"]
  end

  ##
  # gooラボAPIの実行
  # @param sentence 解析対象のテキスト
  # @param api_type 呼び出すAPIの種類
  # @result 処理結果を格納したHash
  def exec(sentence, api_type) 

    request_data = {'app_id' => CLIENT_ID, "sentence" => sentence}.to_json
    header = {'Content-type' => 'application/json'}
    
    https = Net::HTTP.new('labs.goo.ne.jp', 443)
    https.use_ssl=true
    responce = https.post("/api/#{api_type}", request_data, header)
    JSON.parse(responce.body)
  end
スポンサーリンク

QooQ