IBM Watson Text to Speech でテキストの読み上げ

2018年7月27日金曜日

AI Watson テキスト読み上げ

t f B! P L

enter image description here

IBM Watson Text to Speech でテキストの読み上げ

はじめに

Text to Speech とは、テキストを自然に感じで読み上げた音声を作成しているサービスです。
日本語に対応しています。
実際試してみると、人間が喋るよりも、音声は機械的ですが、まったく問題なく聞き取れます。

IBM Cloud への登録は済ませてある事を前提に、手順を記載して行きたいと思います。

1. まずは、IBM Cloud でリソースの作成

Text To Speech のページを開き、リソースを作成します。

enter image description here

2. 資格情報 (ユーザ名/パスワード) の確認

リソースの作成が完了すると、資格情報のページに移動します。
以下の赤枠の「表示」をクリックして、ユーザ名・パスワードを確認します。

enter image description here

3. curl コマンドで APIを実行してみる

{username}, {password}を自分の物に書き換えて、コマンドを実行し下さい。
実行後、カレントディレクトリに "hello.ogg"が作成されたら成功です。
再生すると「はじめまして」と喋ってくれるハズです。

curl -X POST -u "{username}:{password}" \
--header "Content-Type: application/json" \
--header "Accept: audio/ogg" \
--data "{\"text\":\"はじめまして\"}" \
--output hello.ogg \
"https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?voice=ja-JP_EmiVoice"
スポンサーリンク

QooQ