音声合成について |
名称 |
作者 |
ソフト種類 |
対応言語など |
SAPI (4/5) |
|||||
Adobe Reader 8 読み上げ機能 | Adobe systems Inc. | 付属機能フリーソフト | 日本語/多国語 |
4/5 |
|||||
akJ Speechtools | akj | オープンソース | 日本語/英語 |
独自 |
|||||
ALTAIR | 日本障害リハビリ テーション協会 |
フリーソフト | 日本語/多国語 |
4/5 |
|||||
AquesTalk | 株式会社アクエスト | フリーソフトミドルウエア | 日本語のみ・サンプルアプリケーションあり |
A |
|||||
ClipReader |
Kazusoft |
フリーソフト | 日本語/多国語 | 4/5 | |||||
EasySpeech | EasySpeech.jp | フリーソフト | 日本語/多国語 |
4 |
|||||
eSpeak (TTSAppで) | eSpeak Sourceforge.net | フリーソフト | 日本語/多国語 |
4/5/A/e |
|||||
ESPTAP | 山野敏夫 | フリーソフト | エスペラント語/その他 |
4 |
|||||
Fire Fox 拡張機能 Fire Vox |
Charles L. Chen | 拡張機能フリーソフト | 日本語/多国語 |
4/5 |
|||||
Fire Fox 拡張機能 Click,Speak | Charles L. Chen | 拡張機能フリーソフト | 日本語/多国語 |
4/5
|
|||||
Free NaturalReader 9.0 | NaturalSoft | フリーソフト | 日本語/多国語 高機能有料版もあり |
5/e |
|||||
GalateaTalk | Source Forge.jp |
オープンソース | 日本語 |
独自 |
|||||
Google Chrome拡張機能 Select and Speak |
Chrome Web Store | フリーソフト | 日本語/多国語 |
4/5
|
|||||
Google Chrome拡張機能 SpeakIt! |
Chrome Web Store |
フリーソフト | 日本語/多国語 |
4/5 | |||||
Google翻訳 (ブラウザのサイト上で対応) |
フリーソフト | 日本語/多国語(数十か国語) |
e |
||||||
MOSpeech | Labor Economics.org |
フリーソフト | 日本語/英語 クリップボード読上げのみ |
5/e |
|||||
NVDA(日本語版) 注
1:SR Windows 7 64bit 版ではMSSP の音声がすべて使えない。 |
NVDA
Japanese Users |
フリーソフト | 日本語 |
4/5/M |
|||||
Opera Voice機能 | Opera Software |
付属機能フリーソフト | 英語のみ |
独自 |
|||||
Parole | SIGEYOSI | フリーソフト | 日本語/多国語 |
4 |
|||||
proEdit | Tea & Eyes | フリーソフト | 日本語のみ(ProTALKER必要) |
4 |
|||||
ReadPlease 2003 | ReadPlease Corporation | フリーソフト | 多国語(日本語不可) |
4/5 |
|||||
reporter | 村田組 | フリーソフト | 日本語/英語(MS Agent必 要) |
5 |
|||||
SofTalk | CNCC | フリーソフト | 日本語/多国語 |
A/e/M |
|||||
SofTal WEB | CNCC | フリーソフト | 日本語のみ WEBサイト読上げ可 |
A/e/M |
|||||
spcbght.bat | 電脳太助 | フリーソフト | 日本語/多国語 |
M |
|||||
SpchW | Milord Club | フリーソフト | 日本語/多国語 |
4/e |
|||||
SpeechApp | FREE WING | フリーソフト | 日本語/多国語 |
5/A/e |
|||||
Text To Wav v6.1 | Noah | フリーソフト | 日本語/多国語日英読み分け機能あり |
4/5/e/M |
|||||
Text-to-Speech Controller | まろ | 公開終了 | 日本語/英語など |
独自 |
|||||
TTSAPP/SimpleTTS (DHTML) | Microsoft | フリーソフト | 日本語/多国語 |
4/5/A/e |
|||||
Windowsスクリーン・リーダー 注1:SR | 音楽研究所 | フリーソフト | 日本語 |
4/5 |
|||||
おしゃべりテキスト V.2 | くろだんご | 転載自由フリーソフト | 日本語/多国語 | 4/5/A |
|||||
おしゃべりテキスト V.3 | くろだんご | 転載自由フリーソフト | 日本語/多国語 | 4/5/A/e |
|||||
おしゃべりプレイヤー | マーチン | フリーソフト | 日本語/多国語 |
M |
|||||
簡読★Text | SoftFarm.net | フリーソフト | 日本語/多国語 D&D/クリップボード読上 |
4 |
|||||
ドキュメントトーカーPlusV2.1 Free版 |
クリエートシステム開発株式会社 | フリーソフト | 日本語/英語 AquestTalk付属 |
A |
|||||
「ドキュメントトーカ Plus 2.1
Free版はフリーソフトでエンジンは AquesTalk が付属。 日本語音声合成エンジンを導入すると相当高品位の読み上げが期待できます。 「Win版 歌声合成 面白替え歌 Ver1.1」はフリーソフトで、歌を歌うことができます。 「Win版 歌声合成 ミディで替え歌 Ver1.1」 はフリーソフトで、MIDIファイルより音階を取りだし、入力された歌詞を音声合成で歌うこと ができるもの。 ※注2 |
|||||||||
バイハート | Tokunaga Yoshito(kobo) | 転載禁止フリーソフト | 日本語/多国語(MS Agent必要) |
4 |
|||||
ボイトレ先生 | 楓ソフトウエア研究所 | フリーソフト | 日本語 |
4 |
|||||
棒読みちゃん | みちあき | フリーソフト | 日本語 |
A/M |
|||||
読み上げTool | 西村誠一 | フリーソフト | 英語のみ?(WindowsXP?) |
4 |
|||||
読み上げくん | まぁさ | フリーソフト | 日本語/英語(MS Agent必 要) |
4 |
|||||
楽SpeechS | Free's | フリーソフト | 日本語/多国語 |
4 |
|||||
和太鼓 (MS WORD のみ対応) | 情報支援のお道具箱 | フリーソフト | 日本語 |
M |
|||||
注:上に挙げたソフトのなかには Microsoft Text-to-Speech の
SAPI4・SAPI5対応の各種言語 Engine を使うことができる ものがあり、インストールした Engine により対応言語も変わります。 注: SAPI については下記 【SAPI 4 と SAPI 5 について】 を参照。 注: MSSPについては下記 【MMSSP について】 を参照。 注意: MSSP はWindows Vista 以降の OS でのみ保証 |
名称 |
作者 |
サンプル |
対応言語 |
SAPI |
|
AITalk | 株式会社エーアイ | 試してみる | 日本語、英語、 中国語、韓国語 |
独自 |
|
FineSpeech | 株式会社アニモ | 日本語 |
独自 |
||
FocusTalk Ver2.0 | Skyfish Inc. | 体験版 | 日本語 |
? |
|
ProTALKER 97 | IBM | 営業活動終了 | 日本語 |
--- |
|
SMARTTALK | 沖電気 | 販売終了 | 日本語 |
--- |
|
TextAloud | NextUp.com | Sample Voice | 日本語/多国語 |
4/5 |
|
TextSpeech Pro | Digital Future | Sample Voice | 日本語/多国語 |
4/5 |
|
上の2件、
TextAloud とTextSpeech Pro は数種類の
SAPI4・SAPI5 対応の Speech Engineを使うことがで きます。 これらの Speech Engine は SAPI4・ SAPI5 対応となっていますから上に書いた各ソフトでも使えるものと思われます。 そのなかでも AT&T Natural Voices は 明瞭度、自然な発声などで最高品位。 ただ残念なことに AT&T Natural Voices には日本語がありません。 1ボイス35.00ドル とかなり高価。 |
|||||
Voice Text | HOYAサービス株式会社 | サンプル音声 | 日本語、英語、 中国語、韓国語 |
独自 |
|
VOICEROID 入力文字読上げソフト) | AH-Software | しゃべらせてみよう | 日本語 |
独自 |
|
電子かたりべプレーヤー | 電子かたりべ.com | サンプル音声なし Voice Textか? | 日本語 |
独自 |
|
プレーヤーはフリーソフト。コンテンツは有料。 プ レーヤーを登録しない場合一定期間を過ぎると高品質音声合成サービスが利用できなくなり、Microsoft社の Text-to- Speech Engine か使えません。 ここでいう高品質音声合成サービスは 今時の音声合成ソフトウエア によると、HOYAサービス株式会社 Voice Text を使用している模様。 |
|||||
各ソフトは音質など甲乙付けがたいようですが、Voice Text
は極めて流暢な発音で不自然なところが少なくレベル が高いと思われる。 Voice Text については 今時の音声合成ソフトウエア に詳細な報告が載っています。 AITalk、 FineSpeech はGUI画面を使って好みのアクセントやイントネーションを作り出せ、また特有のアクセントなど も変更することができ、機能的に充実しているものと思われますが、かなり高価。 VOICEROD は感情表現もできるのは面白い。 |
SmartVoice | NEC |
VIA VOICE | IBM |
LaLa Voice | 東芝 |
外国語のサンプルを聞いてみる |
英語 | (男性) |
英語 | (女性) |
英語 | (ささやくこともできます) |
ドイツ語 | (男性) |
フランス語 | (女性) |
イタリア語 | (男性) |
スペイン語 | (男性) |
ロシア語 | (男性) |
中国語 | (男性) |
ロボット | (?) |
SAPI 4 と SAPI 5 について |
Microsoft Agent core components | コアとなる部分( WindowsXP/2000/Meではインストール不要) |
text-to-speech engine | 各国語対応 音声合成エンジン (必要に応じて選択しインストール) |
Microsoft Agent character | エージェント キャラクタ (音声合成だけなら不要) |
SAPI 4 runtime binaries | SAPI 4 ランタイムサポート |
Speech Recognition Engine | 音声認識エンジン(英語のみ) (音声合成だけなら不要) |
などをインストールすると構成されます。SAPI
5 に比べて音声合成で利用できる各国言語は
日本語、英語、フランス語、ドイツ語、イタリア語、スペイン語、
ロシア語、ポルトガル語、ノールウェイ語、フィンランド語、ポルトガル語、韓国語、中国語など
29か国語 に対応し、また音声の種類も男性、女性、老人、若者の声など非常に豊富です。
Speech SDK 5.1 | SpeechSDK51.exe (68.0MB) | 音声合成だけな らこれをインストールします |
5.1 Language Pack | SpeechSDK51LangPack.exe(81.5MB) | 音声認識の機能 も使いたい場合はこれをインストール |
Documentation | sapi.chm (2.3MB) | 使用説明書 |
MSSP (Microsoft Speech Platform) に ついて |
おしゃべりテキストを使ってみる |
以上、《おしゃべりテキスト》 のインストールと使
い方を簡単にご紹介しました。
あとは付属のヘルプ・ファイルを参考に、音声
合成の面白さをお楽しみください。
そのほかのアプリケーションもソフト名をクリックすればそれぞれのホーム
ページにアクセスできますから、ダウンロードしてトライしてみてください。
音声合成エンジンに関する参考事項 |
まとめ |
Speech Engine
はフロントエンドとバックエンドから構成されていて、フロントエンドにアプリケーションから入力された文章を発音記号に変換した配列を出力し、バックエン
ドはフロントエンドから出力された発音記号配列を音声波形に変換します。
もう少し詳しく言うならば、フロントエンドでは文章を解析し、単語、熟語、文節などに分別し、単語、熟語は辞書により【発音記号;ピッチ;持続時間】の組
み合わせに変換し、文節に対しては韻律(イントネーション)の規則にしたがって、【発音記号;ピッチ;持続時間】の組み合わせを時系列に並べた一連の配列
に変換します。
たとえば、入力された漢字混じり文章を、かりに
「昔々、ある所にお爺さんとお婆さんが住んでいました。」
とすると、フロントエンドからは
「ムカ’シムカ’シ、ア’ルトコロニ/オジイ’サント/オバア’サンガ/スン’デ/イマシタ。」
のような記号化された配列を出力します。
この例では、カタカナが発音記号を表し、【’】はアクセントを、句読点や【/】はイントネーションを決める文節の境界を示しています。
この配列を元に【発音記号;ピッチ;持続時間】の要素を時系列的に並べた配列をバックエンドに渡せば、バックエンドは、その配列を音声波形に合成してアプ
リケーションに渡し、アプリケーションがスピーカーを通して音声を発生させます。
音声合成のメカニズムは以上のようなものです。
上に列挙した各種の音声合成ソフト、または読み上げソフトなどのアプリケーションは、実はいわゆるヒューマンインターフェースであって、その中身は
Speech Engine です。
したがってアプリケーション別の分類ではなくて Speech Engine の種類別の説明をすべきであったかもしれません。
文章の読み上げそのものの品質はアプリケーションではなくて、内蔵された Speech Engine に依存します。
Speech Engine によっては疑問文や感嘆文を区別して発声するものがあることは上に書きました。
また、音色は Speech Engine の合成メカニズムに依存し、音声から受ける印象を左右するアクセントは Speech Engine
の登録辞書に依存し、イントネーションは Speech Engine
の韻律性能に依存します。イントネーションに影響をもたらすものとして、音声の速度、ピッチ、抑揚などがあ
りますが、それらを制御できるもの、速度しか制御できないものなどいろいろあります。
また、最近は音声に感情を持たせようと試みる感情音声合成も、大企業、ベンチャー企業、大学、研究所など様々な所で研究、開発Xされています。(以下参
照)
沖 コーパスベース音声合成とその応用
富士通 “アニメ声”で自然にしゃべる音声合成技術、富士通が新開発
富士通 音声合成 先端技術 : 富士通研究所
慶應義塾大学安村研究室 A Study on Corpus-based Speech
Synthesiswith Emotion
慶應義塾大学大学院 感情を含んだ声を作る!−韻律の部分
空間を用いた感情音声の合成−
東京工大小林隆夫研究室 Kobayashi Lab
国際電気通信基礎技術研究所 ニック キャンベル
「表現豊かな発話音声のコンピュータ処理システム」
そのほか、枚挙に暇がないほど多数の報告がインターネット上で見ることができます。
感情音声合成に関する考察と提案は 次のページへ