Podrobnosti studentského projektu

Seznam
Téma:Vizualizace dat pro klasifikační a regresních stromy
Katedra:Katedra kybernetiky
Vedoucí:
Vypsáno jako:DP
Popis:Zadání je externí, zadavatel: Dr.Martin Holena,CSc. - Ústav informatiky AV ČR, Pod vodárenskou věží 2, Praha 8 (e:mail: martin@cs.cas.cz).

Garantem za katedru kybernetiky je: prof.RNDr.Olga Štěpánková,CSc. (e:mail: step@labe.felk.cvut.cz)

(Klíčová slova: VIZUALIZACE DAT, VIZUALIZACE MNOHODIMENZIONÁLNÍCH PROSTORŮ, KLASIFIKAČNÍ STROMY, REGRESNÍ STROMY, STROMOVÉ MAPY)

Jedním z důsledků růstu výkonnosti počítačů i kvality jejich periferií je neustálý růst významu vizualizace při analýze dat. Vizualizace umožňuje zprostředkovat větší množství informací současně, a to intuitivním způsobem nevyžadujícím porozumění abstraktním konceptům. Jednou z prvních metod analýzy dat, ve které vizulazace hrála velmi významnou roli, byly klasifikační a regresní stromy. V jejich případě dala právě možnost vizualizace výsledků analýzy pomocí grafů stromového typu metodě jméno. Metody vizualizace používané pro klasifikační a regresní stromy však do značné míry obrážejí úroveň oblasti vizualizace na přelomu 80. a 90. let. S přístupy k vizualizaci, které se začaly používat teprve později, se v případě klasifikačních a regresních stromů v podstatě nesetkáme. Ke změně tohoto stavu by mohla přispět i navrhovaná diplomová práce.
Pokyny:Student se nejdříve seznámí s metodami vizualizace dat, zejména s moderními metodami vizualizace mnohorozměrných dat. Současně se také seznámí s klasifikačními a regresními stromy a s metodami jejich vizualizace. Na základě studia obou těchto oblastí navrhne, jak by bylo možné současné metody vizulizace klasifikačních a regresních stromů zdokonalit s využitím novějších vizualizačních přístupů. Navržené metody rozpracuje do podoby implementovatelných algoritmů, implementuje je ve vývojovém prostředí Matlab a otestuje na souborech reálných dat poskytnutých vedoucím práce.
Literatura:•L. Breiman, J. Friedman, R.A. Ohlsen, C.J. Stone, Classification and Regression Trees. Wadsworth, 1984.
•H. Hofmann. Mosaic plots and their variants. In Handbook of Data Visualization. Springer, 2008, 617–642.
•W.Y. Loh. Regression trees with unbiased variable selsection and interaction detection. Statistica Sinica, 12 (2002) 361–386.
•S. Urbanek. Visualizing trees and forests. In Handbook of Data Visualization. Springer, 2008, 243–264.
•M. Theus. High-dimensional data visulaization. In Handbook of Data Visualization. Springer, 2008, 151–178.
Vypsáno dne:16.10.2009
Za obsah zodpovídá: Petr Pošík