M5Stickをしゃべらせてみよう

＼ポイント最大11倍！／

ポチップ

VoiceText Web APIに登録する

今回、Aveterがしゃべる際に発する音声を作成するために、VoiceText Web APIという音声合成してくれるWebサービスを使用します。
このWebサービスを利用することで、テキストデータから音声データを生成することができます。

以下のページにアクセスしてユーザー登録をしてください。（登録は無料です）

あわせて読みたい

VoiceText Web API Webに声を、感情を。高品質な音声合成VoiceTextが、簡単に使えるWeb APIに。

ユーザー登録が完了すると、APIを使用するためのキーをもらうことができます。

M5Stack-Avatarをインストール

M5Stack AvaterはM5Stackのディスプレイに顔を表示させることができるアプリケーションです。プログラムから表情を変化させたり、吹き出しを表示してしゃべらせることができます。
Avaterを使うことでM5Stackをロボットのように見せることができます。

こちらはバージョン0.7.3をダウンロードしてください。

GitHub

GitHub – meganetaaan/m5stack-avatar: An M5Stack library for rendering avatar faces An M5Stack library for rendering avatar faces. Contribute to meganetaaan/m5stack-avatar development by creating an account on GitHub.

人工知能は人間を超えるか (角川ＥＰＵＢ選書)

著:松尾豊

¥891 （2023/09/11 22:12時点 | Amazon調べ）

＼ポイント最大11倍！／

ポチップ

ESP8266Audioをインストール

ESP8266Audioは、WAV、MP3、MIDIなどのオーディオファイルを再生するためのライブラリです。VoiceText Web APIで合成した音声データをM5Stackから出力するために必要になります。

こちらはバージョン1.9.3をダウンロードしてください。

GitHub

GitHub – earlephilhower/ESP8266Audio: Arduino library to play MOD, WAV, FLAC, MIDI, RTTTL, MP3, and … Arduino library to play MOD, WAV, FLAC, MIDI, RTTTL, MP3, and AAC files on I2S DACs or with a software emulated delta-sigma DAC on the ESP8266 and ESP32 – earle…

ソースコードの修正

さて、ここからは「M5Core2_Avatar_VoiceText_TTS」のプロジェクトファイル内のソースコードを変更していきます。

Avatar.cpp

Arduino IDEのファイル->環境設定の「スケッチブックの保存場所」のパスにある「libraries」フォルダ内を「Avatar.cpp」というファイル名で検索をかけてください。
ファイルが見つかったらエディタで開き、以下の箇所を修正します。

「init()」関数（96行目～123行目）で実行されている「xTaskCreate」、「xTaskCreate」、「xTaskCreate」の3つの関数の第3引数を「512」→「1024」と変更します。

void Avatar::init() {
  DriveContext *ctx = new DriveContext(this);
  // TODO(meganetaaan): keep handle of these tasks
  xTaskCreate(drawLoop,     /* Function to implement the task */
                          "drawLoop",   /* Name of the task */
                          2048,         /* Stack size in words */
                          ctx,          /* Task input parameter */
                          1,            /* Priority of the task */
                          NULL);        /* Task handle. */
  xTaskCreate(saccade,      /* Function to implement the task */
                          "saccade",    /* Name of the task */
                          1024,         /* Stack size in words */
                          ctx,          /* Task input parameter */
                          2,            /* Priority of the task */
                          NULL);        /* Task handle. */
  xTaskCreate(updateBreath, /* Function to implement the task */
                          "breath",     /* Name of the task */
                          1024,         /* Stack size in words */
                          ctx,          /* Task input parameter */
                          2,            /* Priority of the task */
                          NULL);        /* Task handle. */
  xTaskCreate(blink,        /* Function to implement the task */
                          "blink",      /* Name of the task */
                          1024,         /* Stack size in words */
                          ctx,          /* Task input parameter */
                          2,            /* Priority of the task */
                          NULL);        /* Task handle. */
}

このソースのように修正されていれば完了です。

M5Core2_Avatar_VoiceText_TTS.ino

M5Core2_Avatar_VoiceText_TTSのリポジトリ内にあるファイル、「M5Core2_Avatar_VoiceText_TTS.ino」の17、18行目にあるwifiのSSIDとパスワードをお使いのルーターのものに書き換えてください。

const char *SSID = "YOUR_WIFI_SSID";
const char *PASSWORD = "YOUR_WIFI_PASSWORD";

AudioFileSourceVoiceTextStream.cpp

上記「M5Core2_Avatar_VoiceText_TTS.ino」と同じディレクトリにある「AudioFileSourceVoiceTextStream.cpp」についても修正を行います。

30行目の以下の部分を修正します。

const String tts_user = "YOUR_TSS_API_KEY"; // set your id

「YOUR_TSS_API_KEY」の部分を、先ほどVoiceText Web APIに登録した際に発行されたAPIキーに変更してください。

深層学習　改訂第２版 (機械学習プロフェッショナルシリーズ)

著:岡谷貴之

¥3,300 （2024/07/22 18:01時点 | Amazon調べ）

＼ポイント最大11倍！／

OWON 4チャンネルデジタルオシロスコープ SDS1104 1Gs/S 100MHz 4CH FFT機能フルセットハイコストパフォーマンス【国内正規品】【メーカー直営3年保証】【日本語取扱説明書対応】

ポチップ

コンパイルしてみる

実際にコンパイルしてみると、私の環境では以下のようなエラーが発生しました。

\libraries\ESP8266Audio-1.9.3\src\libtinysoundfont/tsf.h: In function 'void tsf_channel_midi_control(tsf*, int, int, int)':
tsf.h:2100:1: error: insn does not satisfy its constraints:tsf.h:2100:1: internal compiler error: in extract_constrain_insn, at recog.c:2210

調べてみるとESP8266Audioライブラリに含まれる「tsf.h」というファイルのバグのようです。
以下のような方法でコンパイルエラーを解消することができました。

ボードマネージャーのバージョンを変更する

ボードマネージャーのバージョンによってもエラーがでるようです。今回のv2.0.2はNGでした。
v2.0.0にバージョンを下げるとエラーが解消されます。

ボードマネージャーについては紅樹　タカオさんが以下のページでまとめてくれていますので、ぜひご覧ください。

あわせて読みたい

【M5Stack】ビルド時のボード・オプションの選び方(ArduinoIDE,VSCode+PIO) | M5Stack沼人の日記　M5Stack製品は星の数ほど発売されています。進化が早すぎて、Arduino-ESP32やPlatformIOの設定に新しい製品の名前が無くて混乱する方も増えてきたようです。今回の記事で…

tsf.hをバグ修正版に置き換える

もう１つの方法はコンパイルエラーの原因になっているtsf.hを修正されたファイルに置き換えです。以下のページにバグが修正された「tsf.h」のソースがあります。「libraries」フォルダ内を「tsf.h」で検索し、見つかったファイルを置き換えてください。

あわせて読みたい

OWON

¥33,800 （2024/07/23 15:33時点 | Amazon調べ）

＼ポイント最大11倍！／