スキップしてメイン コンテンツに移動
文書要約API

A3RT Text Summarization API を Ruby から呼び出す

はじめに

リクルートテクノロジーズが提供している、
文章要約を行うAPIを Ruby on Rails から呼び出すサンプルコードです。

使い方は、以下のサンプルコードをコピーし、
exec() 関数に、要約を行う文書を渡して呼び出すと、
要約結果を文字列の配列で取得できます。

サンプルコード


require 'net/http'
require 'uri'
require 'json'

  # ご自身のAPIキーを書き換えてください
  CLIENT_ID = "xxxxxxxxxxxxxxxxxxxxxx"

  ##
  # 文書要約 API の実行
  # @param sentence 解析対象のテキスト
  # @result 文書の要約結果 (ex: ["センテンス"])  
  def exec(sentence) 

    # APIのURL
    url = URI.parse("https://api.a3rt.recruit-tech.co.jp/text_summarization/v1")
    
    separation = "。"

    # 文章数を取得
    line_count = get_line_count(sentence, separation)
    if line_count <= 1
      # 文章数が1以下の場合、APIでエラーとなるため、
      # 指定された sentence をそのまま要約結果とします
      return [sentence]
    end

    # リクエストパラメータを設定
    post_data = { 
      'apikey' => CLIENT_ID,      #APIキー
      'sentences' => sentence,    #要約する文章
      'linenumber' => 1,          #抽出文章数
      'separation' => separation  #文章の切れ目の文字
    }

    # postリクエスト送信
    res = post_request(url, post_data, true);
  
    # エラーの場合、nilを返却
    return nil if res.code != "200"

    # JSON文字列をパースし、要約結果を返却
    result = JSON.parse(res.body)
    return result['summary']
  end

  ###
  # 指定された sentence の文章数を取得します。
  # @param sentence   要約する文章
  # @param separation 文章の切れ目の文字
  # @return 文章数
  def get_line_count(sentence, separation)
    sentence.count(separation)
  end

  ### 
  # POSTリクエストを送信し、そのレスポンスを取得する
  def post_request(url, data, use_ssl = true) 
    req = Net::HTTP::Post.new(url.request_uri)
    req.set_form_data(data)

    # postリクエスト送信
    Net::HTTP.start(url.host, url.port, 
        :use_ssl => use_ssl, 
        :verify_mode => OpenSSL::SSL::VERIFY_NONE) do |http|
      http.request(req)
    end
  end

注意事項

Text Summarization API は、要約する文書の文章数が、
抽出文章数よりも少ない場合、API エラーとなります。

このサンプルでは抽出文章数を"1"としている為、
渡された文書の文章数が1つの場合、
引数の値をそのまま要約結果として返すようにしています。

※ ちなみに文章の切れ目は、"。"です。


試してみる

str = <<"EOS"
日本における焼きそばは家庭料理や飲食店のメニューとして一般的である。
さらに屋外であっても鉄板一枚あれば調理可能なことや調理手順が簡単な事から、
縁日の露店、学園祭などイベントの模擬店・売店、スナックコーナーなど様々な場所で売られている。
EOS

p exec(str)

↓ 実行結果

["日本における焼きそばは家庭料理や飲食店のメニューとして一般的である"]

文書からキーワードを探して、最も特徴的な文章を返すようになっているみたいです。

最後に

文書によっては、要約結果が微妙な時がありますが、
今後、学習してどんどん賢くなったら、
音声認識で文字起こしてから、文書を要約すれば、
簡単に議事録とかが作成できる時代が来るかもですね。。。

スポンサーリンク
スポンサーリンク
スポンサーリンク

コメント

このブログの人気の投稿

axiosの使い方まとめ (GET/POST/例外処理)

axiosの使い方まとめ (GET/POST/例外処理)最近何かとよく使うJavaScriptでAJAX通信を行うaxiosについて、簡単に使い方をまとめました。GETリクエストをaxiosで送るまずはGETリクエストをaxiosで送る方法です。const res =await axios.get('/users') console.log(res.data)分割代入の記法を使うと、以下のようにも書けますconst{data}=await axios.get('/users') console.log(data)クエリパラメータ (URLパラメータ)を指定クエリパラメータを指定する方法は2つあります。1つ目は、axios.getに指定するURLに直接記述する方法です。axios.get('/user?id=123')2つめは、axios.getの第2引数に、オプション指定する方法です。axios.get('/user',{ params:{ id:123}})POSTリクエストをaxiosで送る次はPOSTリクエストをaxiosで送る方法です。JSON形式でPOSTするJSON形式でPOSTする場合は、axios.postの第2引数に、送信するデータをJavaScriptオブジェクトで指定します。const res =await axios.post('/user',{ id:123, name:'Yamada Tarou'})application/x-www-form-urlencoded形式でPOSTするapplication/x-www-form-urlencoded形式でPOSTする場合は、URLSearchParamsを使います。var params =newURLSearchParams() params.append('id',123) params.append('name','Yamada Tarou')const res =await axios.post('/user', params)axios でファイルをアップロードする画像などのファイルを、axiosでアッ…

[VB, C#] Windows 8, Window 10 で ImeModeが制御できない問題を解決する

[VB, C#] Windows 8, Window 10 で ImeModeが制御できない問題を解決するタイトルの通りですが、Windows 8 以降では Windows Form アプリケーションで、コントロールの ImeMode に Katakana や KatakanaHalf を設定しても、カタカナになってくれません。なぜ ImeMode が効かないのか?Windows 8 以降、IME Mode の切り替えは、ユーザー単位で切り替わるようになった為、アプリから IME Mode 制御が出来ないようになりました。
(IME をON にした場合、常に ひらがな モードになます)※ Windows 7までは、IME Modeの切り替えはアプリ単位で行われていた為、問題なくアプリから IME制御が行えました。対処方法Windows 8 以降、IMEの制御は、InputScope クラスの利用が推奨されています。
しかし、InputScope クラスは、WPF、Windows ストアアプリでしか使えない為、Windows Formアプリでは使用できません。
(Windows Form はもう使うな!という事でしょうか (涙) )結論としては、コントールパネルの設定で、IMEの制御をユーザ単位から アプリ単位に変更する事ができます。
これで、Windows Formアプリでも 従来通りIMEの制御を行う事が出来ます。おわりにこの方法だと、アプリをインストールする端末すべてに設定が必要となり、とっても面倒です。。。
しかし、今の所これしか方法がない状態です。
これからは Windows Formではなく、WPFや Windows ストアアプリで作れという事ですかね (^^;)

MailKitの使い方! エンコーディング指定や添付ファイをメールで送信する方法[C#/VB Tips]

MailKitの使い方! エンコーディング指定や添付ファイをメールで送信する方法[C#/VB Tips]MailKitを使ってメールを送るサンプルコードです。(C#)UTF8/iso-2022-jpのエンコーディング指定、GMail/YahooのSMTPサーバで送るなど、4つのサンプルコードでMailKitの使い方を紹介します。MailKitって何?2017年に.NET標準のSystem.Net.Mail.SmtpClientが廃止予定となり、Microsoftより今後はオープンソースライブラリである、MailKitに置き換えるとアナウンスがありました。既にSmtpClientは非推奨になっており、今後は廃止されていきます。現在、SmtpClientを使用したソースコードには、Visual StudioからMailKitを使うよう警告が出るようになっています。さっそく、MailKitを使ってメールを送信するサンプルコードを作っていきます。UTF8でメールを送信文字エンコーディングを、UTF8でメールを送信するサンプルコードです。
MailKitは、デフォルトの文字エンコーディングがUTF8なっている為、シンプルなコードでメールを送信する事ができます。var host ="<smtp server name>"; var port =25;// or 587using(var smtp =new MailKit.Net.Smtp.SmtpClient()){//SMTPサーバに接続する smtp.Connect(host, port, MailKit.Security.SecureSocketOptions.Auto);//認証が必要な場合は、以下のコメントを解除//smtp.Authenticate("<id>", "<password>");//送信するメールを作成する var mail =new MimeKit.MimeMessage(); var builder =new MimeKit.BodyBuilder(); mail.From.Add(new MimeKit.MailboxAddress("",&quo…