Kontrolní součty pro sekvence ve formátu FASTA

Doplňte hlavičky sekvencí ze souboru fasta-1_orig.fa o kontrolní součty příslušných sekvencí. Například pro algoritmus CRC32 byste měli dostat následující výsledek:

>HKEKW3O01B9HVO length=54 crc32=c841bd15
ACGATGCAGCTGCGAGACGATGACACGCTCGGTGCCGTTGATGACGAACGAGCC
>HKEKW3O01DG7MY length=52 crc32=251c1f9b
ATCCGCAGCTCGGAAGATCGTCTTCGAGAAGGTGCCGACGTACGCGACGAGG
>HKEKW3O01ATTV4 length=162 crc32=ce54cbcd
TTCTGCGCGCTCGCGAACGCGCGCTCGATTCCGGTCGCCGACGCGATCGCCGACGCGCTT
CGTACGATCTCGACCTGCTGCACGACGTCGGCGACATCGACCTGCACATCAGCGGCTGCA
TCAACTCGTGCGGCCATCATCACAGCGGCCACCTCGGCATCC
...

Odřádkování by nemělo být součástí kontrolního součtu! Záměna koncových bajtů je totiž první věc, která se „pokazí“ při přenosu textových souborů mezi různými operačními systémy, a přitom na sekvenci samotnou nemá žádný vliv.

PS: Pokud máte někde schovaný FASTAReader, který vrací sekvence z FASTA-souborů jako generátor, můžete ho doplnit o validaci kontrolních součtů, jeho hodnota tím solidně vzroste ^_~




Zarovnání podle Smithe-Watermana

Použijte následující ohodnocení zarovnání..

match/mismatch mezery
GCAT
G+5-4-4-4
C-4+5-4-4
A-4-4+5-4
T-4-4-4+5
koncové mezery = 0
vložení mezery = -10
rozšíření mezery = -1

..a spočítejte ručně tabulku pro sekvence AAGTTAC a AGACTAGTTAC. (Ideálně tedy asi na papír a poslat mi fotku řešení.)




Viterbiho algoritmus

Najděte si (nebo si nechte umělou inteligencí vygenerovat) nějakou implementaci Viterbiho algoritmu pro skryté Markovovy modely a ověřte pomocí ní řešení úlohy z přednášek. Odevzdejte program, pomocí nějž jste úlohu řešili, včetně příslušným způsobem zadaných dat modelu (tj. i vstupní sekvence GGCACTGAA) a odpovídajícího okomentovaného výstupu. Pokud vám s řešením pomohly nějaké nástroje (třeba automatické načtení dat modelu z obrázku), popište také použitý postup.

PS: Vzorové řešení je na slajdu číslo 13 tamtéž.




Viterbiho učení

Najděte si (nebo si nechte umělou inteligencí vygenerovat) nějakou implementaci Viterbiho učení pro skryté Markovovy modely a ověřte pomocí ní řešení úlohy z přednášek.

Jelikož nám jde o zjištění, jak moc je výsledek Viterbiho učení závislý na počátečním nástřelu vnitřních stavů, až se naučíte používat (nalezený) program, zkuste pomocí něj několikrát zopakovat řešení pro různá počáteční rozložení tranzic.




Hopfieldova neuronová síť a rozpoznávání vzorů

Na hodině jsme naučili Hopfieldovu neuronovou síť o rozměrech 10x10 (tedy s teoretickou kapacitou 13 obrázků) rozeznávat 5 obrázků, a poté jsme zkusili, zda z předloženého vzoru k nějakému z nich dokonvertuje. Nedokonvertovala :-)

Jelikož první tři vzory způsobily pokles energie o stejnou hodnotu, můžeme vyslovit hypotézu, že právě to způsobilo vznik falešných minim. Zkuste pozměnit dva z těchto obrázků, aby dávaly jinou změnu, a poté zkuste znovu rozpoznat vzor. Podařilo se dokonvergovat k nějakému zapamatovanému vzoru?