Uživatelské nástroje

Nástroje pro tento web


pitel:msz:urceni_zakladniho_tonu

Určení základního tónu

Podstata

Základní tón je frekvence kterou kmitají hlasivky. Pohybuje se v rozmezí 50–400 Hz (muži, děti). Mění se jak podle nálady mluvčího tak i během mluvy.

Lag je počet vzorků odpovídajícíh jedné periodě základního tónu.

Použití je typicky při kódování hlasu.

Autokorelace

Autocorrelation

Hledá se podobnost mezi vzorky toho stejného signálu. Jeden rámec se posouvá po celém signálu a hledají se shody. Lag sa určí nalezením indexu maxima.

Normalizovaná cross-korelace

Cross-correlation

Cross-korelace provádí porovnání i s okolím rámce (místo nul).

Problém je když je aktuální rámec tichý a vedlejší hlasitý, pak by vycházela korelace s vedlejším rámcem jako lepší než se současným, to řeší normalizace (asi dělení energií).

Metody zlepšení přesnosti

Mediánový filtr pro nalezení skutečné základní frekvence, protože často nalezneme její polovinu nebo dvojnásobek.

/var/www/wiki/data/pages/pitel/msz/urceni_zakladniho_tonu.txt · Poslední úprava: 30. 12. 2022, 13.43:01 autor: 127.0.0.1