Podrobnosti studentského projektu

Seznam
Téma:Klasifikace sekvencí pomocí pravidel vytěžených z dat
Katedra:Katedra kybernetiky
Vedoucí:prof. Ing. RNDr. Martin Holeňa, CSc.
Vypsáno jako:Diplomová práce, Semestrální projekt
Popis:Jedním z klíčových směrů vytěžování dat (data mining) je získávat z dat znalosti reprezentované jako pravidla, tj. implikace nějaké formální logiky. Velký význam pravidlové reprezentace spočívá v tom, že je typicky mnohem srozumitelnější člověku než reprezentace numerická, zvláště když uživatelé získaných znalostí jsou z jiné oblasti než analýza dat a matematika. K hlavním typům pravidel patří pravidla klasifikační, v nichž premisou implikace je konjunkce podmínek na klasifikovaný objekt a důsledkem je příslušnost ke konkrétní třídě. Jejich srozumitelnost je zvláště cenná u objektů se složitější strukturou, na které nelze přímočaře použít úspěšné numerické klasifikátory jako umělé neuronové sítě či klasifikátory založené na opěrných vektorech nadrovin (support vector machines). Důležitým typem takových objektů jsou sekvence kombinací kategoriálních a numerických atributů, často se vyskytující v přírodních vědách, ale také např. v síťové bezpečnosti. Právě takovým typem dat se bude zabývat navržená diplomová práce.
Literatura:viz http://www2.cs.cas.cz/~martin/diplomka53.html
Za obsah zodpovídá: Petr Pošík