Ve stejném duchu jako na přednášce zpracujte generátorovou funkci fasta_reader(), kterou pak budete moci použít pro načítání dat z FASTA-souborů ve stylu:
for header, sequence in fasta_reader('01.fa'): print(header, sequence, sep='\n', end='\n\n') input()
Napište program gb2fasta (na Windows gb2fasta.py), který dokáže na vstupu z proudu zpracovat GenBank-soubor a na svůj výstup z něj pošle pouze samotnou sekvenci:
# Linux $ cat U49845.gb | gb2fasta > U49845.fa # Windows > type U49845.gb | gb2fasta.py > U49845.fa
Zalámání ponechte na vstupních šedesáti znacích, ale mezery odstraňte.
PS: Bez přesměrování do souboru vypíše program sekvenci pochopitelně na aktuální výstup (takže terminál).
Kdo nebyl na hodině 2024-10-15 (nebo odešel před odevzdáním příkladů), pošlete řešení příkladů 1 a 2 ze cvičení na náhodu a pravděpodobnost.
Za pomoci kódu pro zobrazení zarovnání řetězců doplňte kód pro zarovnávání sekvencí o zobrazení všech zarovnání s nejlepším ohodnocením.
Na základě přednášky o Gibbs Sampling implementujte náhodné hledání vzorů v zadaných sekvencích.
PS: Pro odladění použijte sekvence z přednášky. Pokud se vám podaří najít jinou sadu sekvencí s ukrytým vzorem, tím lépe.