Detail of the student project

List
Topic:Vizualizace dat při konstrukci regresních modelů
Department:Katedra kybernetiky
Supervisor:
Announce as:DP
Description:Zadání je externí, zadavatel: Dr.Martin Holena,CSc. - Ústav informatiky AV ČR, Pod vodárenskou věží 2, Praha 8 (e:mail: martin@cs.cas.cz).

Garantem za katedru kybernetiky je: prof.RNDr.Olga Štěpánková,CSc. (e:mail: step@labe.felk.cvut.cz)

(Klíčová slova: VIZUALIZACE DAT, VIZUALIZACE MNOHODIMENZIONÁLNÍCH PROSTORŮ, VIZUALIZACE ROZDĚLENÍ PRAVDĚPODOBNOSTI, NELINEÁRNÍ REGRESNÍ MODELY, VIZUALIZACE SPOJITÝCH FUNKCÍ)

Jedním z důsledků růstu výkonnosti počítačů i kvality jejich periferií je neustálý růst významu vizualizace při analýze dat. Vizualizace umožňuje zprostředkovat větší množství informací současně, a to intuitivním způsobem nevyžadujícím porozuměmí abstraktním konceptům. Většinou je však vizualizace dat pouze přípravnou fází pro modelování zákonitostí, kterými se data řídí, a procesů, které je generovaly. V případě dat, které jsou hodnotami spojitých proměnných, se k tomu obvykle používají regresní modely. Přitom i tyto modely lze vizualizovat, metodami vizualizace spojitých funkcí, které mají podstatně delší tradici než metody vizualizace dat. Dosud však nebyly studovány vztahy mezi metodami používanými pro vizualizaci dat a metodami používanými pro vizualizaci z nich zkonstruovaných regresních modelů, přestože právě tyto vztahy ovlivňují to, zda obě vizualizace působí synergisticky nebo zda se naopak při zprostředkování informací navzájem oslabují. Navrhovaná diplomová práce by měla být pokusem o takovou studii.
Instruction:Student se nejdříve seznámí s metodami vizualizace dat, zejména s metodami vizualizace mnohorozměrných dat. Současně se také seznámí s hlavními regresními metodami a s metodami vizualizace regresních modelů. Na základě studia obou těchto oblastí navrhne několik strategií kombinování metod vizualizace dat a použitých regresních metod, včetně metod vizualizace získaného regresního modelu. Navržené strategie rozpracuje do podoby implementovatelných algoritmů, implementuje je ve vývojovém prostředí Matlab a otestuje na souborech reálných dat poskytnutých vedoucím práce.
Bibliography:•R.D. Cook, S. Weisberg. An Itroduction to Regression Graphics. Wiley, 1994.
•M.C. Minnotte, S.R. Sain, D.W. Scott. Multivariate visualization by density estimation. In Handbook of Data Visualization. Springer, 2008, 389–413.
•B. Schölkopf, A. Smola. Learning with Kernels, kapitoly 1–6, 9, 10. MIT Press, 2002.
•M. Theus. High-dimensional data visulaization. In Handbook of Data Visualization. Springer, 2008, 151–178.
Date:16.10.2009
Responsible person: Petr Pošík