Detail of the student project

List
Topic:Semi-supervizované učení hlubokých neuronových sítí
Department:Katedra kybernetiky
Supervisor:prof. Ing. RNDr. Martin Holeňa, CSc.
Announce as:Diplomová práce, Semestrální projekt
Description:Semi-supervizované učení označuje učení klasifikačních a regresních modelů, pro které je k dispozici na jedné straně množina oštítkovaných dat, na druhé straně jiná, typicky mnohem větší množina neoštítkovaných dat. Vždy spočívá ve vytvoření určitého spojení mezi jednotlivými neoštítkovanými daty a jedním nebo více oštítkovanými daty. Toto spojeni může být buď ostré nebo fuzzy a vždy spočívá na nějakém druhu podobnosti mezi jednotlivými spojenými daty. Velké množství měr podobnosti, se kterými se setkáváme v tomto kontextu, sahá od vzdáleností založených na normách v eukleidovském prostoru po sémantické podobnosti reprezentované pomocí grafů. Navíc může semi-supervizované učení buď vyjít z oštítkovanýmch dat, které iniciují shlukování neoštítkovaných dat, nebo začít vytvářením shluků neoštítkovaných dat, které jsou následně přizpůsobeny dostupným oštítkovaným datům. Konečně, výzkum semi-supervizovaného učení se vzájemně ovlivňuje s výzkumem aktivního učení, které spočívá ve výběru těch neoštítkovaných dat, jejichž oštítkování je z nějakého hlediska nejužitečnější.
V tomto desetiletí jsou pravděpodobně nejpopulárnějším a nejrychleji se rozvíjejícím druhem klasifikačních i regresních modelů hluboké neuronové sítě. S nimi semi-supervizované učení dosud používalo pouze nejběžnější varianty jak přístupu vycházejícího z oštítkovaných dat, tak i přístupu vycházejícího ze shlukování neoštítkovaných dat, druhý z nich zejména pokud i shlukování je prováděno pomocí hlubokých sítí, konkrétně autoenkoderů. Výzkum důmyslnějších metod semi-supervizovaného učení je v kontextu hlubokých neuronových sítí úplně na začátku. Zvláště žádoucí by bylo využít schopnost hlubokých sítí extrahovat v průběhu učení nové, relevantnější příznaky. Důležitost výzkumu semi-supervizovaného učení hlubokých neuronových sítí je důsledkem skutečnosti, že hluboké učení potřebuje velké množství dat. Tato důležitost je zvláště vysoká v oblastech, kde je obtížné získat oštítkovaná data, buď proto, že musí být získávána experimentálně, nebo protože vyžaduje časově náročné zapojení člověka – experta, jako např. v oblastech analýza sentimentu, detekce proniknutí do sítě či detekce malware. Poslední zmíněná oblast je zamýšlenou oblastí aplikace navrženého výzkumu.
Bibliography:viz http://www.cs.cas.cz/~martin/diplomka51.html
Responsible person: Petr Pošík