• 2018-05-30
ウズマスター戦記
ウズマスター戦記 https://www.uzumax.org/2018/05/amazon-pollypython.html

Amazon Pollyでテキストを音声に変換するPythonコードのサンプル

テキスト読み上げAIサービス「Amazon Polly」に対してリクエストを送り、音声データをmp3で取得する為のサンプル。

元ネタとしては以下公式サイトのサンプルコードなんだが、ちょっとした設定に手間取らされたので自分用メモとして記録しておく。


Pipでこれをインストールする

  • pip install awscli
  • pip install boto3

実際に動いたソースはこちら


"""Getting Started Example for Python 2.7+/3.3+"""
from boto3 import Session
from botocore.exceptions import BotoCoreError, ClientError
from contextlib import closing
import os
import sys
import subprocess
from tempfile import gettempdir
import logging
from logging import  getLogger

logging.basicConfig(level=logging.DEBUG)

# IAMユーザ画面からアクセスキーとシークレットアクセスキーを見つけて貼り付け
# この情報は流出させないこと
session = Session(aws_access_key_id="XXXXXXXXXXXXXXXXX",aws_secret_access_key="XXXXXXXXXXXXXXXXX")
polly = session.client("polly")

logger = getLogger(__name__)

text = "日本一平凡なサンプル" # 話させたい文章を定義
VoiceId = "Mizuki" # 日本語を話させたい場合、「Mizuki」「Takumi」のどっちかにすること

try:

    response = polly.synthesize_speech(Text="日本一平凡なサンプル", OutputFormat="mp3",VoiceId="Mizuki")

except (BotoCoreError, ClientError) as error:

    logger.error(error)
    sys.exit(-1)

logger.info(response)

# Access the audio stream from the response
if "AudioStream" in response:
    # Note: Closing the stream is important as the service throttles on the
    # number of parallel connections. Here we are using contextlib.closing to
    # ensure the close method of the stream object will be called automatically
    # at the end of the with statement's scope.
    with closing(response["AudioStream"]) as stream:
        output = os.path.join(gettempdir(), "speech.mp3")

        logger.info("mp3_file_path:%s",output)

        try:
            # Open a file for writing the output as a binary stream
            with open(output, "wb") as file:
                file.write(stream.read())
        except IOError as error:
            # Could not write to file, exit gracefully
            logger.error(error)
            sys.exit(-1)

else:
    # The response didn't contain audio data, exit gracefully
    print("Could not stream audio")
    sys.exit(-1)

# Play the audio using the platform's default player
if sys.platform == "win32":
    #ダウンロードしたMP3をローカルのオーディオアプリで軌道する
    os.startfile(output)
else:
    # the following works on Mac and Linux. (Darwin = mac, xdg-open = linux).
    opener = "open" if sys.platform == "darwin" else "xdg-open"
    subprocess.call([opener, output])

0 件のコメント:

コメントを投稿

お気軽にコメント下さい。