励振と声道パラメータ

音声というのは、肺から送り出された空気の特殊な震えのことです。

肺から送り出された空気は、単なる乱流ですが、
のどのところで、声帯が震えることにより、
周期的な波になったりします(つまり音程ができます)。
(無声音は乱流のままです。)

この周期的な波が、口を通ることによって、
五十音となって口の外へと出て行きます。

つまり、音程はのどの震えの周期によって決まり、
何を言っているのかは、口の中の形によって決まります。
のどの震えのことを「励振」といい、
励振が通ってくるところ(口など)を「声道」といい、
声道の形状を表すパラメータのことを「声道パラメータ」といいます。

励振は周波数領域に「調波構造」(ぎざぎざ)として現れ、
声道パラメータは「包絡」(おおまかな形状)として現れます。

現在の音声認識技術は、
声道パラメータを抽出するところから始まります。
つまり、包絡を数値化するところから始まります。

inserted by FC2 system inserted by FC2 system