diff --git a/README.md b/README.md
index 14a02bd0763f18583f4a7a6d7bf0cf0437f87148..ab3fe10cf97d3c37da4fb9c3c4165c4cf5ad5480 100644
--- a/README.md
+++ b/README.md
@@ -1,73 +1,10 @@
+# Information retrieval â€“ VektorovĂ˝ model
 
-# ZADĂNĂŤ
-CĂlem projektu je implementace vektorovĂ©ho systĂ©mu uklĂˇdĂˇnĂ dat (tj. poreprocessing a indexovĂˇnĂ) spolu
-s moĹľnostĂ dotazovĂˇnĂ z GUI.
-## VSTUP
-Dotaz â€“ seznam termĹŻ spolu s vĂˇhami.
-## VĂťSTUP
-Seznam databĂˇzovĂ˝ch dokumentĹŻ odpovĂdajĂcĂ dotazu v klesajĂcĂm poĹ™adĂ podobnosti.
-## INFORMACE/POTĹEBNĂ‰ ZNALOSTI
-VektorovĂ˝ model je jeden ze zpĹŻsobĹŻ jak prohledĂˇvat kolekci dokumentĹŻ adresujĂcĂ nedostatky boolovskĂ©ho
-modelu. Oproti boolovskĂ©mu modelu nenĂ binĂˇrnĂ, tj. pro kaĹľdĂ˝ term neobsahuje informaci o tom, ve kterĂ©m
-dokumentu se danĂ˝ term vyskytuje, nĂ˝brĹľ informaci o tom, jak moc se ve kterĂ©m dokumentu vyskytuje. Dotaz
-je pak tvoĹ™en seznamem termĹŻ a vĂˇhami (dĹŻrazem), kterĂ© uĹľivatel jednotlivĂ˝m termĹŻm pĹ™iĹ™azuje.
+## Struktura projektu
+Projekt se sklĂˇdĂˇ ze tĹ™Ă oddÄ›lenĂ˝ch aplikacĂ.
+1) `preprocessing/` (zĂˇkladnĂ zpracovĂˇnĂ dokumentĹŻ â€“ odstranÄ›nĂ nevĂ˝znamovĂ˝ch slov, lematizace, uloĹľenĂ obsahu jednotlivĂ˝ch dokumentĹŻ do databĂˇze)
+2) `weight_calculation/` (vĂ˝poÄŤet vah termĹŻ v jednotlivĂ˝ch dokumentech)
+3) `querying/` (dotazovĂˇnĂ na podobnost dokumentĹŻ z webovĂ©ho rozhranĂ)
 
-Dotaz je vyhodnocovĂˇn oproti kolekci dokumentĹŻ, tj. kaĹľdĂ˝ dokument lze chĂˇpat jako objekt databĂˇze.
-NejjednoduĹˇĹˇĂ moĹľnostĂ pĹ™Ăstupu k tĂ©to databĂˇzi je prochĂˇzet kaĹľdĂ˝ dokument zvlĂˇĹˇĹĄ a dotazovat se, jak moc je
-danĂ˝ dokument podobnĂ˝ dotazu. S rostoucĂ velikostĂ kolekce je ovĹˇem takovĂ˝to pĹ™Ăstup nevyhovujĂcĂ a proto je
-tĹ™eba uklĂˇdat data ve formÄ› vhodnĂ© pro vyhledĂˇvĂˇnĂ. StejnÄ› jako u boolovskĂ©ho modelu projde kaĹľdĂ˝
-dokument nejdĹ™Ăve fĂˇzĂ preprocesingu, kdy jsou z dokumentu odstranÄ›na nevĂ˝znamovĂˇ slova (tj. slova, kterĂˇ se
-nesou mĂˇlo informace, jako napĹ™. spojky a pĹ™edloĹľky) a vĂ˝znamovĂˇ slova jsou â€śstemmovĂˇnyâ€ť (jednoduĹˇĹˇĂ
-proces) nebo â€ślematizovĂˇnyâ€ť (sofistikovanÄ›jĹˇĂ proces) za ĂşÄŤelem zĂskĂˇnĂ zĂˇkladĹŻ slov.
-
-Po preprocesingu mĂˇme tedy k dispozici kolekci slov, kterou je tĹ™eba uloĹľit takovĂ˝m zpĹŻsobem, aby v nĂ Ĺˇlo
-efektivnÄ› vyhledĂˇvat. U boolovskĂ©ho modelu je kaĹľdĂ˝ dokument uloĹľen jako binĂˇrnĂ vektor, ÄŤĂmĹľ dostĂˇvĂˇme
-tzv. term-by-document matici, kde na i-tĂ©m Ĺ™Ăˇdku v j-tĂ©m sloupci je 1, pĂˇvÄ› tehdy pokud je term i obsaĹľen
-v dokumentu j. TakovĂ˝ pĹ™Ăstup nedokĂˇĹľe rozliĹˇit, jak moc danĂ˝ term vystihuje dokument, v kterĂ©m se nachĂˇzĂ.
-Nelze Ĺ™Ăci, zda se term i vyskytuje v dokumentu pouze okrajovÄ›, nebo je celĂ˝ dokument prĂˇvÄ› o tomto termu.
-Z toho dĹŻvodu jsou v term-by-document matici reĂˇlnĂ© hodnoty v rozmezĂ 0 aĹľ 1, definujĂcĂ vĂˇhu (dĹŻleĹľitost)
-termu pro dokument. UrÄŤovĂˇnĂ vah je typicky zaloĹľeno na frekvenci vĂ˝skytu termu v dokumentu a vĂ˝skytu
-termu pĹ™es celou kolekci. NejznĂˇmÄ›jĹˇĂ schĂ©ma zaloĹľenĂ© na tomto principu se nazĂ˝vĂˇ tf-idf (term frequency -
-inverse document frequency) schĂ©ma. KaĹľdĂ˝ dokument je pak moĹľnĂ© popsat n-dimenionĂˇlnĂm vektorem (n je
-velikost slovnĂku) a tedy lze chĂˇpat jako bod v n-dimenzionĂˇlnĂm prostoru.
-StejnÄ› jako dokument lze reprezentovat i dotaz. Dimenze odpovĂdajĂcĂ termĹŻm, kterĂ© zadal uĹľivatel, majĂ
-hodnoty urÄŤeny dotazem, ostatnĂ dimenze majĂ hodnotu 0. Definujeme-li pak nÄ›jakou vzdĂˇlenost mezi dvÄ›ma
-body v n-dimenzionĂˇlnĂm prostoru (u vektorovĂ©ho modelu je to kosinovĂˇ vzdĂˇlenost), lze podobnost
-dokumentĹŻ chĂˇpat jako pĹ™evrĂˇcenou vzdĂˇlenost bodĹŻ, kterĂ© je reprezentujĂ.
-
-PodobnÄ› jako u boolovskĂ©ho modelu lze pro efektivnĂ implementaci vyuĹľĂt invertovanĂ© seznamy. Tyto slouĹľĂ ve
-vektorovĂ©m modelu k identifikaci dokumentĹŻ obsahujĂcĂch danĂ© termy (jako u boolovskĂ©ho modelu).
-IdentifikovanĂ© dokumenty jsou pak setĹ™ĂdÄ›ny podle podobnosti k dotazu (viz pĹ™edchozĂ odstavec).
-
-VektorovĂ˝ model se tedy sklĂˇdĂˇ z nĂˇsledujĂcĂch ÄŤĂˇstĂ:
-1. Extrakce a preprocesing termĹŻ z dokumentĹŻ.
-2. EfektivnĂ uloĹľenĂ dokumentĹŻ v datovĂ© struktuĹ™e (invertovanĂ˝ seznam).
-3. VyhodnocovacĂ/dotazovacĂ modul vyuĹľĂvajĂcĂ strukturu z pĹ™edchozĂho kroku.
-## STAVBA APLIKACE
-Aplikace by mÄ›la obsahovat:
-* Extrakce termĹŻ.
-* Identifikace nevĂ˝znamovĂ˝ch slov.
-* Stemming/lematizace.
-* VĂ˝poÄŤet vah termĹŻ.
-* Implementace indexovacĂ struktury.
-* VyhodnocenĂ dotazu oproti indexovacĂ struktuĹ™e.
-* WebovĂ˝ interface (zadĂˇnĂ dotazu a vizualizace vĂ˝sledku).
-## POZNĂMKY K ĹEĹ ENĂŤ
-V rĂˇmci projektu je tĹ™eba implementovat jak vektorovĂ˝ model umoĹľĹujĂcĂ neprochĂˇzet celou kolekci
-(invertovanĂ˝ seznam napĹ™Ăklad), tak sekvenÄŤnĂ prĹŻchod, tj. prochĂˇzenĂ kolekce dokumentĹŻ bez vyuĹľitĂ indexu.
-SekvenÄŤnĂ prĹŻchod je pak moĹľnĂ© pouĹľĂt k porovnĂˇnĂ vĂ˝sledkĹŻ vyhledĂˇvĂˇnĂ vzhledem k vektorovĂ©mu modelu.
-
-Lze vyuĹľĂt knihovny na parsovĂˇnĂ dokumentĹŻ, pĹ™Ăp. preprocessing.
-### DATA
-DatovĂˇ sada by mÄ›la obsahovat alespoĹ tolik dokumentĹŻ, aby bylo moĹľnĂ© pozorovat vĂ˝hody pouĹľitĂ
-vektorovĂ©ho modelu oproti sekvenÄŤnĂmu prĹŻchodu. Zdroj dat je libovolnĂ˝ â€“ napĹ™. offline verze nÄ›jakĂ©ho
-webovĂ©ho serveru (novinovĂ© ÄŤlĂˇnky, â€¦).
-### EXPERIMENTY
-V tomto projektu lze mimo jinĂ© provĂˇdÄ›t srovnĂˇnĂ vektorovĂ©ho modelu se sekvenÄŤnĂm prĹŻchodem s ohledem
-na ÄŤas vykonĂˇnĂ dotazu. Lze takĂ© testovat vliv rĹŻznĂ˝ch vnitĹ™nĂch parametrĹŻ na vĂ˝kon algoritmu (napĹ™. rĹŻznĂ©
-nastavenĂ v invertovanĂ©m seznamu) apod.
-##ZDROJE
-1. PĹ™ednĂˇĹˇka VyhledĂˇvĂˇnĂ textu - BooleovskĂ© modely. Implementace.
-1. PĹ™ednĂˇĹˇka VyhledĂˇvĂˇnĂ textu - VektorovĂ© modely. Implementace.
-1. Jaroslav PokornĂ˝, VĂˇclav SnĂˇĹˇel, DuĹˇan HĂşsek. DokumentografickĂ© InformaÄŤnĂ SystĂ©my. Karolinum,
-1998
\ No newline at end of file
+## PoĹľadavky na bÄ›h
+Jsou popsĂˇny u kaĹľdĂ© konkrĂ©tnĂ aplikace v souboru `REQUIREMENTS.md` spolu s informacemi, odkud stĂˇhnout a kam pĹ™ĂpadnÄ› umĂstit knihovny tĹ™etĂch stran.
diff --git a/doc/documentation.docx b/doc/documentation.docx
index 869b16ff66eb79da60b69435e2449c7dbd445592..eed43a733adc4a3219b7cc6885adb045c528190c 100644
Binary files a/doc/documentation.docx and b/doc/documentation.docx differ