Spektrum reprezentuje signál ve frekvenční oblasti.
Spektrální funkce se dá vyjádřit pomocí Fourierovy transformace1), ovšem nedá se spočítat (nekonečná, integrál, …) a v praxi ji dokážeme pouze odhadnout pomocí Fourierovy transformace s diskrétním časem (DTFT)2).
Slouží k vyrovnání frekvenční charakteristiky, protože energie řeči ve vyšších frekvencích klesá.
Implementujeme např. FIR filtrem.
Řečový signál je „náhodný“. Signál se ale lépe zpracovává když je periodický. Takže ho rozsekáme na krátké úseky (rámce) a předpokládáme že v nich periodický je.
Udávají podobnost signálu samého se sebou, pokud ho posuneme o k vzorků (signál vně rámce je nulový).
<m>R(k) = sum{n=0}{N-1-k}{s(n)s(n+k)}</m>
Cepstrum slouží k oddělení buzení a modifikačního ústrojí (artikulační trakt) v řeči, protože buzení nemá žádný význam při rozpoznávaní řeči (je příliš závislé na rečníkovi). Problém je, že buzení je v konvoluci s impulzní odezvou filtru artikulačního traktu (v kmitočtové oblasti v součinu), a ani v jedné z oblastí sa nedají složky od sebe dobře oddělit. Potřebujeme nelinearitu, která převede součin na součet.
signal → [FT → abs → square] → log → [FT → abs → square] → power cepstrum