Project check 2
Dobrý večer,
opravil som v semestrálnej práci najväčšie problémy, ktoré ste označili pri kontrole (#2 (closed)):
-
Nezrozumiteľnú vizualizáciu embeddingov, ktorá indikovala, že clustre zahŕňajú články z rôznych častí priestoru embeddingov som v reporte nechal, ale do kapitoly 3.3 som pridal zmienku o novo vytvorenej 3D interaktívnej vizuálizácií, ktorá je dostupná v repozitári v súbore visualizations/embeddings.html. V nej sú síce témy stále označené zmätočne, pretože jednoducho neexistuje dostatok odlišných farieb a značiek, aby sa dalo unikátne označiť 500 tém, ale články sa podľa tém dajú zobrazovať a skrývať, sú uvedené aj reprezentatívne slová pre každú tému a každému článku sa po prechode myšou nad jeho embeddingom zobrazí názov. To Vás dúfam presvedčí, že aspoň clustering prebieha správne a iba články, ktoré sa nachádzajú blízko seba sú zaradené do jednej témy.
- Zároveň som pridal vizualizáciu visualizations/topics.html, ktorá ukazuje to, ako sú témy v priestore embeddingov umiestnené, ich vzájomné vzialenosti a počty článkov v každej téme.
-
Do kapitoly 3.2 som pridal príklad toho, ako sa pracuje s triedou na doporučovanie článkov a diskusiu k tomu.
Opravený report je dostupný v repozitári, v zložke report
alebo ho prikladám sem.
Ešte by som chcel spomenúť drobnú reklamáciu ku Grades - po tom, čo ste mi dali za implementáciu a report 28 bodov ste týchto 28 bodov zapísali priamo do kolónky "semestrálka," pričom ste odstránili 10 bodov, ktoré som mal za milestone (viz. #1 (closed)). Mohli by ste mi prosím tie body vrátiť?
Teším sa na Vás v stredu na prezentáciách!