Detail of the student project

List
Topic:Vizualizace dat při vícecestném třídění
Department:Katedra kybernetiky
Supervisor:
Announce as:DP
Description:Zadání je externí, zadavatel: Dr.Martin Holena,CSc. - Ústav informatiky AV ČR, Pod vodárenskou věží 2, Praha 8 (e:mail: martin@cs.cas.cz).

Garantem za katedru kybernetiky je: prof.RNDr.Olga Štěpánková,CSc. (e:mail: step@labe.felk.cvut.cz)

(Klíčová slova: VIZUALIZACE DAT, ANALÝZA ROZPTYLU, VÍCECESTNÉ TŘÍDĚNÍ, PARALELNÍ SOUŘADNICE, STRUKTUROVANÉ MNOŽINY GRAFŮ)

Jedním z důsledků růstu výkonnosti počítačů i kvality jejich periferií je neustálý růst významu vizualizace při analýze dat. Vizualizace umožňuje zprostředkovat větší množství informací současně, a to intuitivním způsobem nevyžadujícím porozuměmí abstraktním konceptům. To je zvláště přínosné v případě mnohodimenzionálních dat, a právě pro ně se vizualizační metody nejvíce rozvíjejí. Většinou je však vizualizace dat pouze přípravnou fází pro modelování zákonitostí, kterými se data řídí, a procesů, které je generovaly. Jednou z důmyslných metod pro zjišťování takových zákonitostí je analýza rozptylu. Napojení vizualizace dat na analýzu rozptylu, zvláště pak na její variantu pro mnohodimenzionální data, tzv. vícecestné třídění, však byla dosud věnována pouze velmi malá pozornost. Navrhovaná diplomová práce by měla být pokusem o nápravu tohoto stavu.
Instruction:Student se nejdříve seznámí s metodami vizualizace dat, zejména s metodami vizualizace mnohodimenzionálních dat. Současně se také seznámí s principy a praktickým prováděním analýzy rozptylu, zejména vícecestného třídění. Na základě studia obou těchto oblastí navrhne několik strategií napojení vícecestného třídění na vizualizaci dat. Navržené strategie rozpracuje do podoby implementovatelných algoritmů, implementuje je ve vývojovém prostředí Matlab a otestuje na souborech reálných dat poskytnutých vedoucím práce.
Bibliography:•R.M. Heiberger, B. Holland. Structured sets of graphs. In Handbook of Data Visualization. Springer, 2008, 415–445.
•A. Inselberg. Parallel coordinates: visualization, exploration and classification of high-dimensional data. In Handbook of Data Visualization. Springer, 2008, 643–680.
•R.M. Mickey. Applied Statistics: Analysis of Varince and Regression. Viley, 2004.
•M. Theus. High-dimensional data visulaization. In Handbook of Data Visualization. Springer, 2008, 151–178.
•H.M. Wu, S.L. Tzeng, C.H. Chen. Matrix Visualization. In Handbook of Data Visualization. Springer, 2008, 681–708.
Date:16.10.2009
Responsible person: Petr Pošík