Praktikum z bioinformatiky I&II (VŠCHT – ZS+LS 2018/2019)
Jiří tečka Znamenáček plus LP12 zavináč gmail tečka com

Pomůcky

Domácí úkoly

Nenechávejte si je na poslední chvíli…

Projekty a cvičení

  1. bioinformatické formáty:
        ~ formáty FASTA, FASTQ
        ~ formát SAM & BAM
        ~ GeneBank, EBML, GFF3…
        ~ …
  2. PS: přibližné výpočty
        ~ počítání s konečnou přesností, přenos a šíření chyb
        ~ metoda Monte Carlo (výpočet čísla π, určité integrály, Brownův pohyb)
        ~ …
  3. zarovnávání sekvencí (jednoduché)
        ~ globální rekurzivně shora dolů
        ~ Needleman–Wunsch-Gotoh (globální dynamickým programováním zdola nahoru)
        ~ Smith–Waterman (lokální zarovnání)
        PS: rekurze, náročnost algoritmů, dynamické programování
    1. úvod
    2. dynamické programování, memoizace [TODO příklady]
    3. příklad – rozměňování mincí (hrubá síla, „hladové“ algoritmy a rekurze)
    4. příklad – zarovnávání řetězců (rekurze s více větvemi)
        ~ dotploty a jejich souvislost s výše uvedenými algoritmy [TODO]
  4. hledání vzorů při známém MSA (deterministické)
        ~ úvod (včetně consensus sequences)
        ~ PSSM a PWM (profile matrices), sekvenční loga, informační obsah
        ~ skórovací matice
           PS: entropie v informatice, informační obsah
        ~ generalized profiles (zobecněné profily nástrojů pftools)
        ~ HMM (hidden Markov models)
           PS: (skryté) Markovovy modely
    1. Markovovy modely
    2. skryté Markovovy modely
    3. Viterbiho algoritmus
    4. „Forward/backward“ algoritmus
  5. hledání vzorů bez existujícího MSA (náhodné)
        ~ zcela náhodné hledání vzorů
        ~ Gibbs sampling aneb „algoritmus MC2“ = Markov chain Monte Carlo
  6. grafy v bioinformatice, genome assembly
        ~ …
        PS: grafy
        PS: komprimace dat
    1. RLErun-length encoding
    2. BWT – transformace Burrowse-Wheelera
  7. sbalování RNA
        ~ maximalizace párů – algoritmus Nusinovové
        ~ započítání energie nejbližších sousedů (Nusinovová a spol.)
        ~ úprava podle Zukera-Stieglera
        ~ kovariance
        ~ …
  8. sbalování bílkovin
        ~ …
  9. PS: neuronové sítě, strojové učení
        ~ …

Užitečné pythoní knihovny

Hodnocení

Předmět bude hodnocen za odevzdané domácí úkoly (polovina bodů při pozdním odevzdání), přednesenou přednášku na přidělené téma a případné přezkoušení.