音声合成 スペクトログラム Audacity

f:id:peroon:20101124021940j:image

音声合成で喋らせるのは大変かも。
50音保存して再生するのなら簡単だが、
サイン波の重ねあわせで発音したい。

母音は第1第2フォルマントの頂上の周波数を
使ったサイン波の重ねあわせで発音できたが、
子音が難しそう。

「かさたな」と私が発音して録音して
スペクトログラム表示したものが上の画像。

横軸が時間で、縦軸が周波数。
赤いほど、その周波数成分が多いです。
子音部には幅広い周波数が含まれていることが確認できます。

「さ」のsの部分とか、ノイズっぽいですし、直感とも合っています。
子音、どうやって実現しましょうかね。。!

4番目の「な」の部分では、赤い部分の先頭が出っ張っていますね。
な行の「鼻で溜める」部分だと思います。
な行の発音は第2フォルマントを使わなければ良さそうにも思えます。
しかし多分「んあ」と発音されます。
「ん」から「あ」への遷移部分も重要そうです。