アカウント名:
パスワード:
たんにromにあるpcmのデータ再生してるだけだよ。
今は、生声を録音した音素片をPCM再生する「波形接続型合成」が主流だけど、
Speek&Spellの時代の音声合成は、たいがいフォンルマント合成だよ。ざっくり言えば、5個程度の異なる周波数の信号の合成で、その周波数の比率でどの音かの認識が変わります。最低限2つの音を合成するだけでも、人は認識できる。
だから、極端に言えば、二つの発信器で適切な周波数比率の音を出すだけで、音声合成可能。ただし、「言葉として認識できる」だけで、品質としては余り良くない。いわゆるロボットボイスってやつです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson
元々音声合成なんてものじゃない (スコア:0)
たんにromにあるpcmのデータ再生してるだけだよ。
Re:元々音声合成なんてものじゃない (スコア:2)
今は、生声を録音した音素片をPCM再生する「波形接続型合成」が主流だけど、
Speek&Spellの時代の音声合成は、たいがいフォンルマント合成だよ。
ざっくり言えば、5個程度の異なる周波数の信号の合成で、その周波数の比率でどの音かの認識が変わります。
最低限2つの音を合成するだけでも、人は認識できる。
だから、極端に言えば、二つの発信器で適切な周波数比率の音を出すだけで、音声合成可能。
ただし、「言葉として認識できる」だけで、品質としては余り良くない。
いわゆるロボットボイスってやつです。