Kontrolní domácí úkoly

Generátorový „reader“ pro formát FASTA [2024-09+]

Ve stejném duchu jako na přednášce zpracujte generátorovou funkci fasta_reader(), kterou pak budete moci použít pro načítání dat z FASTA-souborů ve stylu:

for header, sequence in fasta_reader('01.fa'):
    print(header, sequence, sep='\n', end='\n\n')
    input()

„Vyzobávač“ sekvencí z formátu GenBank [2024-09+]

Napište program gb2fasta (na Windows gb2fasta.py), který dokáže na vstupu z proudu zpracovat GenBank-soubor a na svůj výstup z něj pošle pouze samotnou sekvenci:

        # Linux
        $ cat U49845.gb | gb2fasta > U49845.fa

        # Windows
        > type U49845.gb | gb2fasta.py > U49845.fa

Zalámání ponechte na vstupních šedesáti znacích, ale mezery odstraňte.

PS: Bez přesměrování do souboru vypíše program sekvenci pochopitelně na aktuální výstup (takže terminál).

Základní aplikace metody Monte Carlo [2024-10+]

Kdo nebyl na hodině 2024-10-15 (nebo odešel před odevzdáním příkladů), pošlete řešení příkladů 1 a 2 ze cvičení na náhodu a pravděpodobnost.

Vizualizace zarovnání sekvencí [2024-11+]

Za pomoci kódu pro zobrazení zarovnání řetězců doplňte kód pro zarovnávání sekvencí o zobrazení všech zarovnání s nejlepším ohodnocením.

Implementace hledání vzorů pomocí Gibbs Sampling [2025-01]

Na základě přednášky o Gibbs Sampling implementujte náhodné hledání vzorů v zadaných sekvencích.

PS: Pro odladění použijte sekvence z přednášky. Pokud se vám podaří najít jinou sadu sekvencí s ukrytým vzorem, tím lépe.