Ve stejném duchu jako na přednášce zpracujte generátorovou funkci fasta_reader(), kterou pak budete moci použít pro načítání dat z FASTA-souborů ve stylu:
for header, sequence in fasta_reader('01.fa'): print(header, sequence, sep='\n', end='\n\n') input()
Řešte všechny příklady z cvičení na kontrolu dat ve FASTA-souborech.
Trocha počítání s konečnou přesností:
Řešte příklady 1 a 2 na použití metody Monte Carlo ze cvičení na náhodu a pravděpodobnost.
Doplňte rekurzivní program na zarovnávání sekvencí bází z přednášky o vizualizaci všech nejlepších zarovnání. Najděte vhodné nestejně dlouhé vstupní řetězce a poté prozkoumejte vliv penalizací za mezery – a případně též ohodnocovací matice – na výsledná zarovnání.
PS: Tohle skoro volá po zpracování v Jupyter Notebooku.
Dopočítejte tabulku z přednášky pro změněné hodnoty penalizací za koncové mezery:
A | C | T | G | ||
---|---|---|---|---|---|
-1,hv | -2,h | -3,h | -4,h | -5,h | |
A | -2,v | 0,d | |||
T | -3,v | ||||
G | -4,v |
Ostatní nastavení zůstávají, tj. match +1, mismatch -1, mezera uprostřed -2.
Najděte na internetu vhodou službu nebo program na HMM a vyřešte pomocí nich následující dvě úlohy: