Zjistěte, jaké různé znaky se vyskytují v kratším textu. Přitom postupně:
-
uvažujte rozdíly mezi malými a velkými písmeny
-
neuvažujte rozdíly mezi malými a velkými písmeny
set('')
Zopakujte si předchozí analýzu na větším textu, ale tentokrát hledejte různá slova. Přitom postupně:
-
uvažujte rozdíly mezi malými a velkými písmeny
-
neuvažujte rozdíly mezi malými a velkými písmeny (tj. Auto = auto apod.)
-
odstraňte interpunkci (tj. auto, = auto apod.)
set('')
import string; string.punctuation
Proveďte předchozí analýzu pro dva různé texty a porovnejte výsledky následujícím způsobem:
-
zjistěte, která slova se vyskytují v obou textech
-
vytvořte množinu všech slov, která je možno v uvedených textech najít
-
najděte slova, která obsahuje pouze první text a která obsahuje pouze druhý text
-
vytvořte množinu slov, která oba texty nemají společná
průnik, sjednocení, rozdíl a rozdíl, symetrický rozdíl
Ještě jednou zanalyzujte text na výskyt slov, tentokrát se ale ptejte po tom, jak různě dlouhá slova se v textu vyskytují.
Ze zadané věty vyextrahujte množinu v ní obsažených slov. Prvky množiny budou n-tice, jejichž prvním prvkem budou jednotlivá slova z textu a druhým počet jejich výskytů v textu.
Srovnejte s řešením příkladu 4 u n-tic.