« iModela(iM-01)とWINSTAR PCB for iModelaによるプリント基板作成(11) | メイン | 貴田電子設計 KEM-RX7の組み立て ~基板の組み立て その1~ »

音声合成LSI使用レポート

 テキストを送ると読み上げる音声合成LSI ATP3011F4-PUが発売されたので試してみます。このLSIは28ピンDIPサイズで、パソコンなど外部からローマ字で文章を送ると女性の声で音声出力するものです。面白い電子工作としては「しゃべる時計」が思い浮かび、さらに時刻を声で教えた後に何かを挨拶をいれるようなことができそうです。

 1 商品の紹介

 音声合成LSIはATP3011F4で、Atmel社のATmega328マイコンを利用し、音声合成プログラムを搭載した28ピンDIPパッケージのマイコンです。写真は、テストに使う秋月電子通商が販売するATP3011F4-PUです。

AT01_IMG_0977.jpg 商品中身はLSI(マイコン)と1枚のA4用紙です。このA4用紙には会社名やURLの記載がないので秋月電子通商の商品ホームページ(http://akizukidenshi.com/catalog/g/gI-05665/)や下記のメーカURLより情報入手が必要です。

  (株)アクエスト(AQUEST)    製品名:ATP3011F4-PU
  http://www.a-quest.com/products/atp3011f4-pu.html

 このLSIのデータシート(説明書)は、秋月電子通商がリンク掲載しているものより、メーカのホームページのものが新しくなっています(執筆時点)。

 2012-3-22版データシートをみて仕様を紹介します。この音声合成LSIの使い方は外部からローマ字表記の文字列を、UART/I2C/SPIなどのシリアル・インターフェースを介して送るとリアルタイムに女性の声で読み上げます。センサ出力で重要な数値の読み上げも、適切な読みとタグ指定でアクセント設定できます。

 あらかじめ内部メモリにプリセットしたメッセージをスイッチなどの設定で読み上げるスタンドアロンモードもあるので、固定した内容なら単独動作ができます。1回の読み上げメッセージ文字数は127バイトなので、ひらがな1音が2ローマ字とすると50文字(音)程度でしょう。数字などはタグを付けて、そのまま数字で指定、それに対応する数助詞もできます。保存できるメッセージ数は15個、合計で960バイト程度です(専用の書き込みプログラムあり)。
 AVRの書き込みツールで音声合成LSIチップを消去すると使えなくなるので注意が必要です。


2 動作

 実験する回路は説明書に示す基本回路を参考に、ブレッドボードで作ります。

AT02kihon.JPG ・電源は7ピンに、GNDは8ピンだけにします(20,22ピンはオープンでも動く)。
 ・AOUTの12番ピンは抵抗1.2kΩとコンデンサ0.047uFとスピーカ接続
を、実験する基本回路とします。
 1番ピンのリセット端子は特に10kΩ抵抗と0.1uFコンデンサなどを接続するような指示がないのでオープンのままです。また供給する電源電圧は3Vでも5Vでも同じでした。また、この配線ではかなり小さなスピーカ音なので、実際に使うにはオーディオ・アンプの接続が必要となります。

 まず、動作モードは14番ピンPMOD0と15番ピンPMOD1で次の4通りあります。このピンは内部でプルアップになっていますので、0(ゼロ)がGNDに接続した状態です。

2-1 デモ・モード
 PMOD0,1(説明書と逆、ピン番号順)の値が00(両ピンGND)にして電源を入れるとデモ・モードとして、プリセット・メッセージと呼ばれるあらかじめEEPROMメモリに書き込まれたメッセージMSG0~MSG15を順番に繰り返して音声出力します。
 データシートでは出荷時に何が書き込まれているのか記載はありません。公開しない理由が不明なので、今回は再生されるメッセージも省略しておきます。

2-2 スタンドアロン・モード
 PMOD0端子はオープン、PMOD1端子だけをGNDにした、10ならスタンドアロン・モードとなります。電源を入れ、プルアップされたメッセージ選択PC0~PC3端子でメッセージ15このうち、一つを選択します。どれかの端子を1本だけスイッチの代わりに配線でGNDに落とすとあらかじめ書き込まれているプリセットメッセージが1回だけ再生されます。PC0端子だけ選択した時の動作は先頭のMSG0メッセージでなく、MSG14になります。PC1端子だけならMSG13が,そしてPC3端子だけなら途中のMSG7と逆順です。

2-3 セーフモードとコマンド入力モード
 このモードはUART,I2C,SPI通信インターフェースで介し、ホスト側から送られたテキスト・データにより任意の音声メッセージを出力します。PMOD0端子だけをGNDにした01がセーフ・モード、両方オープンの11がコマンド入力モードです。
 この通信インターフェース選択は、4番ピンのSMOD0端子と5番ピンのSMOD1端子で設定します。これも内部でプルアップになっていますので0(ゼロ)はGNDにした状態です。

3 インターフェースUARTで試す


 セーフ・モードとコマンド入力モードは、通信インターフェースをUARTとして詳しく試してみます。転送速度は最初に「?」文字を送って通信速度を決定する自動速度設定機能で決まります。セーフ・モードではこの機能が働かず、必ず9600bpsに固定されます。その他は同じなので、コマンド入力モードでパソコンから制御するようにしてテストしてみます。

 なお、データ通信される文字データは半角英数(ASCII)の1バイト文字ですが、原稿の都合上、すべて全角文字で掲載します。ご了承ください。

 パソコンと接続するためにUSB-シリアル変換のモジュール(FT232RLを使用)を準備します。音声合成LSI側のPMOD0,1そしてSMOD0,1はすべて未接続、オープンにします。USB-シリアル変換側のTXDは2番ピンのRXDへ、RXDは2番ピンのTXDに、GNDはお互いのGND端子にそれぞれ接続します。
 そして、USBシリアル変換側のUSB端子はケーブルでパソコンのUSB端子へ接続します。

AT03_IMG_0979.jpg パソコン側はターミナル・ソフトを起動します。ここではTeraTermソフトを使っています。接続されたCOMポート番号の設定から始まり、受信ではCR+LF付ける、送信では「CR付ける」、ローカル・エコー「する」などを設定します。なお、通信スピードは2400bps~76.8Kbpsの範囲で指定できます。

 動作の最初はターミナルソフトより1バイトの「?」文字を入力すると1バイトの「>」文字が戻ってきます。これでUART端子による通信スピードはターミナル・ソフトで指定した速度に自動設定されました。これ以降は文字入力すると音声が出ることになります。

 基本的には送ったテキストの最後でリターン・キーを押して送信すれば、スピーカから音声が出ます。音声が出終わると「>」文字が戻ってきます。
 このとき音声を出すテキストは基本的には半角英数1バイトの文字をローマ字で示し、音声記号列仕様として記載されていますので参照ください。一般的なローマ字読みとアクセント、区切り、タグがあります。特に数字を読むときのタグ記号があり、数助詞、小数点の読みなど指定できます。ただし、文字入力ミスした場合はその行を諦め、再度最初の1文字目から入力する必要があります。

 時刻を発声する「しゃべる時計」に応用できそうなので、記載された音声記号サンプル例の時刻を発声するサンプル、「16時5分35秒です」で試してみます。下記のようにターミナルソフト画面に入力し、リターンキーを押し、発声させます。

 <NUMK VAL=16 COUNTER=ji>;<NUMK VAL=5 COUNTER=funn>/<NUMK VAL=35 COUNTER=byo->desu.
 
 次の画面はそのターミナルソフト画面です。ただし、説明書の例題記述では「時」の助数詞が仕様と違うので「di」を「ji」に直して実行しています。時刻を出すにはこのようなテキストとキャリッジ・リターンで可能になります。

at04_atp3.JPG これ以外にもいろいろな音声サンプル、実際の音声例はメーカのホームページにあります。1日、2日、20日など、正しい読みを発音してます。

  http://www.a-quest.com/products/atp3011f4-pu.html

 電源OFF/ONを繰り返して、何度かやっているとうまく動かないときがあります。なんとなく電源ONにて自動で行われるであろう、音声合成LSIのリセットに失敗している感じです。マイコンを接続して何かすると面白そうですが、この対策には1)説明書にないリセット端子にリセット回路を追加、2)セーフ・モードにして通信速度を9600bpsに固定、3)SLEEP端子(6番ピン)を使って再設定するなどの対策が必要となりそうです。

 

 先のブレッドボードの実験回路の写真のようにUART以外のI2C/SPI機能のあるPIC16F1822の8ピンマイコン(上側)と大きさを比較すると、この音声合成LSIは大きすぎです。新製品があるかわかりませんが、第2弾としては単にデータを受け取って発声するだけに機能制限した小さなDIPサイズの音声合成LSIが欲しいものです。

 

後田 敏

カテゴリ:

トラックバック

このエントリーのトラックバックURL:
http://www.eleki-jack.com/mt/mt-tb.cgi/6745





おすすめ書籍

会社案内
情報セキュリティおよび個人情報の取り扱いについて

コメントとトラックバックは、spamを予防するために、編集担当が公開の作業をするまで非公開になっています。
コメントはそれぞれ投稿した人のものです。

Powered by
Movable Type 4.1