====== Haskell – lazy evaluation ====== [[wp>Haskell (programming language)]], [[http://learnyouahaskell.com/chapters|Learn You a Haskell for Great Good!]] ([[http://naucte-se.haskell.cz|CZ]]), [[http://www.fi.muni.cz/~xnovak34/haskellhero|Haskell Hero]] Funkcionální jazyk, který je case-sensitive. Ke všemu má ještě speciální pravidla pro první znaky literálů. Je nutné dodržovat při psaní programu tato pravidla: * Jména typů, typových tříd a datové konstruktory musejí mít velké počáteční písmeno * Ostatní literály musejí mít písmeno malé ===== Datové typy ===== * Primitivní typy * **''Int''** – celá čísla (''45'', ''890'') * **''Char''** – znaky (''%%'a'%%'', ''%%'X'%%'') * **''Bool''** – reprezentace logických hodnot (''True'', ''False'') ... jedná se o datové konstruktory, proto mají hodnoty velké počáteční písmeno * **''Float''** – desetinná čísla (''3.141'', ''234.8'') * Strukturované typy * **//Seznam//** – homogenní datová struktura, která nemá obecně žádné omezení rozměru. Konstruktorem je '':'' a ''[]''. Kdy dvojtečka připojuje prvky do seznamu a závorky značí prázdný seznam. Zápis ''1:2:3:[]'' je tedy konstrukce seznamu o třech prvcích. Alternativním a přirozenějším zápisem je ''[1, 2, 3]''. Toto však není zcela čistý zápis v jazyce Haskell, ale překladač si ji interně přeloží na dříve zmíněnou sekvenci. * **//N-tice//** – heterogení datová struktura. Jejím konstruktorem je '','' ve spojení s párem kulatých závorek. Například dvojice celých čísel ''(1, 2)''. Haskell je silně typovaný jazyk. Změna jednoho typu na druhý je možná pouze zavoláním převodní funkce a každá entita má přesně daný svůj typ. Pro popis typu vstupu a výstupu funkce se používá zápis (příklad konstruktoru seznamu): (:) :: Int -> [Int] -> [Int] Tento zápis říká asi toto: Funkce se jménem ''(:)'' jako jeden vstup bere celé číslo. Druhý vstupní parametr je seznam celých čísel. Poslední část potom říká, že výstupem bude zase seznam celých čísel. Jelikož se jedná o jazyk silně typovaný, tak aby pro každý vstup nemuselo existovat několik definicí stejného operátoru, tak se zavádějí **typové proměnné**. Ty nahrazují skutečné typy a při vyhodnocení jsou nahrazeny skutečnými typy. Zápis vypadá následovně: (:) :: a -> [a] -> [a] Za symbol **''a''** se potom na všechna místa potom přiřadí právě typ **''Int''** nebo třeba **''Float''**. Tento princip umožňuje vytváření seznamů jakéhokoliv typu. ===== Funkce ===== Funkce **''f''** má pro jeden vstupní parametr definován typ jako **''f :: a %%->%% b''**. Tento zápis lze předefinovat a říci buď přesný typ a nebo které typy musejí být stejné, a tak podobně. Funkce součtu dvou prvků a druhé mocniny vypadá následovně: add x y = x + y square x = x * x Práci se seznamem jako parametrem ukazuje funkce, která počítá délku seznamu: length [] = 0 length (x:xs) = 1 + length xs Vyhodnocení funkcí probíhá od shora dolů, proto funkce, které popisují nadmnožinu ostatních případů, musejí být uvedeny jako poslední. První funkce se ztotožní s prázdným seznamem a vrací nulu. Když ne vstupu není prázdný seznam, tak se přistoupí ke druhé funkci. Tam se vzor chápe jako seznam, který má na začátku prvek zastoupený parametrem **''x''** a zbytek seznamu označený **''xs''**. Funkce potom rekurzivně přičte jedničku k délce zbytku seznamu. ==== Pojmenování části vzoru ==== Při spojování dvou seznamů nás nezajímá pouze hlavička a zbytek seznamu. Je potřeba pracovat s jedním parametrem jako celkem, proto si ho můžeme pojmenovat (viz jména **''l1''** a **''l2''**). merge [] l2 = l2 merge l1 [] = l1 merge l1@(x:xs) l2@(y:ys) = if x ==== Anonymní proměnné ==== Funkce vrací hlavičku seznamu. Zbytek nás nezajímá, proto je pouze naznačeno, že by tam mělo něco být, ale nemá to konkrétní název. head (x:_) = x ==== Lokální funkce ==== Jsou definované za klíčovým slovem **''where''**. Je důležité dodržovat odsazení tak jak je vidět. **''where''** je odsazeno od definice funkce a lokální definice by měly být odsazeny v něm. sumsqr x y = xx + yy where sqr a b = a * b xx = sqr x x yy = sqr y y Jinou možností zápisu lokálních funkcí je využití konstrukce '''let in'''. sumsqr x y = let sqr a b = a * b xx = sqr x x yy = sqr y y in xx + yy ===== Líné vyhodnocení ===== [[wp>Lazy evaluation]] Tato strategie vyhodnocení uvádí do absolutní perfekce strategii vyhodnocení označovanou, vyhodnocení v případě potřeby (call-by-need). Tento přístup vyhodnocuje určitý výraz pouze jednou a pouze tehdy, je li potřeba. Hodnota výrazu taky zůstává zachována pro pozdější použití. Příkladem, na kterém se nejčastěji ukazuje tato vlastnost Haskellu, je definice nekonečného seznamu: [1..] Pokud by nebyl Haskell jazyk s líným vyhodnocením, tak kdekoliv by se tato konstrukce vyskytnula, tak by začal generovat pole, dokud by nedošla paměť a program neskončil chybou. Pokud ale máme správně napsaný program v Haskellu, tak není problém s takovýmto polem pracovat. Ve standardní knihovně existuje funkce **''take''**, která jako první parametr bere číslo **''n''** a druhý pole. Výsledkem je prvních **''n''** prvků pole. Vysledek použití je vidět za take 5 [1..] == [1, 2, 3, 4, 5] take 10 [-1, -3..] == [-1, -3, -5, -7, -9, -11, -13, -15, -17, -19] Výsledek líného vyhodnocení může být použit přes výpočtovou sekvenci celé funkce. ===== Rekurze ===== * **Zpětná rekurze** – Pokud po návratu z rekurzivního volání probíhá ještě nějaký výpočet. //f//(//x//) = //e//(//f//(//x//)) * **Dopředná rekurze** – Pokud rekurzivní volání je poslední část výpočtu. //f//(//x//) = //f//(//e//(//x//)) * **Lineární rekurze** – Ve výpočtu rekurze je právě jedno rekurzivní volání funkce. Tento typ rekurze lze převést na cyklus. * **Koncová rekurze** – Dopředně lineární rekurze. Každou takovouto funkci lze převést na efektivní cyklus! Není potřeba uchovávat stav nedokončených výpočtů.