Skip to content
Snippets Groups Projects
README.md 1.42 KiB
Newer Older
  • Learn to ignore specific revisions
  • Tomáš Jungman's avatar
    Tomáš Jungman committed
    **[EN below](#data-cleaning-with-probabilistic-programming)**
    
    # Čištění dat pomocí pravděpodobnostního programování
    
    **Vedoucí** - Mgr. Vojtěch Rybář
    
    **Oponent** - Ing. Daniel Vašata, Ph.D.
    
    **Typ práce** - Bakalářská práce
    
    **Jazyk práce** - Čeština
    
    #### Abstrakt
    
    TODO
    
    #### Klíčová slova
    
    TODO
    
    #### Zadání
    
    Čištění dat je důležitou, ale často opomíjenou součástí správného pracovního postupu v oblasti datových věd. V případě aplikací umělé inteligence ve vysoce rizikových prostředích, jako jsou zdravotnictví a finance, by předpovědi provedené modely trénovanými na problematických datech mohly v reálných aplikacích způsobit značné škody.
    
    PClean je pravděpodobnostní programovací nástroj, který umožňuje využívat znalosti specifické pro danou oblast k čištění a normalizaci problematických datových sad.
    
    V této práci bude podán přehled současných přístupů k čištění dat, vysvětleny principy nástroje PClean, tento nástroj aplikován na datovou sadu z reálného světa a porovnána výkonnost modelů strojového učení natrénovaných na původní datové sadě a datové sadě vyčištěné pomocí PClean.
    
    
    # Data cleaning with probabilistic programming
    
    **Supervisor** - Mgr. Vojtěch Rybář
    
    **Reviewer** - Ing. Daniel Vašata, Ph.D.
    
    **Thesis type** - Bachelor thesis
    
    **Thesis language** - Czech
    
    #### Abstract
    
    TODO
    
    #### Keywords
    
    TODO