enter image description here

IBM Watson Text to Speech でテキストの読み上げ

はじめに

Text to Speech とは、テキストを自然に感じで読み上げた音声を作成しているサービスです。
日本語に対応しています。
実際試してみると、人間が喋るよりも、音声は機械的ですが、まったく問題なく聞き取れます。

IBM Cloud への登録は済ませてある事を前提に、手順を記載して行きたいと思います。

１. まずは、IBM Cloud でリソースの作成

Text To Speech のページを開き、リソースを作成します。

enter image description here

2. 資格情報 (ユーザ名/パスワード) の確認

リソースの作成が完了すると、資格情報のページに移動します。
以下の赤枠の「表示」をクリックして、ユーザ名・パスワードを確認します。

enter image description here

3. curl コマンドで APIを実行してみる

{username}, {password}を自分の物に書き換えて、コマンドを実行し下さい。
実行後、カレントディレクトリに "hello.ogg"が作成されたら成功です。
再生すると「はじめまして」と喋ってくれるハズです。

curl -X POST -u "{username}:{password}" \
--header "Content-Type: application/json" \
--header "Accept: audio/ogg" \
--data "{\"text\":\"はじめまして\"}" \
--output hello.ogg \
"https://stream.watsonplatform.net/text-to-speech/api/v1/synthesize?voice=ja-JP_EmiVoice"

IBM Watson Text to Speech でテキストの読み上げ

IBM Watson Text to Speech でテキストの読み上げ

はじめに

１. まずは、IBM Cloud でリソースの作成

2. 資格情報 (ユーザ名/パスワード) の確認

3. curl コマンドで APIを実行してみる

0 件のコメント:

コメントを投稿

人気の投稿

このブログを検索

Profile

ラベル