====== Určení základního tónu ====== ===== Podstata ===== **Základní tón** je frekvence kterou kmitají hlasivky. Pohybuje se v rozmezí 50--400 Hz (muži, děti). Mění se jak podle nálady mluvčího tak i během mluvy. **Lag** je počet vzorků odpovídajícíh jedné periodě základního tónu. Použití je typicky při kódování hlasu. ===== Autokorelace ===== [[wp>Autocorrelation]] Hledá se podobnost mezi vzorky toho stejného signálu. Jeden rámec se posouvá po celém signálu a hledají se shody. Lag sa určí nalezením indexu maxima. ===== Normalizovaná cross-korelace ===== [[wp>Cross-correlation]] Cross-korelace provádí porovnání i s okolím rámce (místo nul). Problém je když je aktuální rámec tichý a vedlejší hlasitý, pak by vycházela korelace s vedlejším rámcem jako lepší než se současným, to řeší normalizace (asi dělení energií). ===== Metody zlepšení přesnosti ===== Mediánový filtr pro nalezení skutečné základní frekvence, protože často nalezneme její polovinu nebo dvojnásobek.