List

Bachelor thesis:Implementace fonémového rozpoznávače s nástroji TNet Toolkitu ( PDF )
Author:Fiala Jiří
Supervisor:doc. Ing. Petr Pollák, CSc.
Keywords:
Abstract:Tato bakalářská práce se zabývá aplikací umělých neuronových sítí typu vícevrstvý perceptron (MLP) v úloze rozpoznávání fonémů v řečovém signálu. Implementace těchto sítí byla provedena prostřednictvím balíčku softwarových nástrojů s označením TNet, který umožňuje inicializaci sítě, trénovaní, testovaní a další funkce. Hlavním cílem práce bylo poskytnout informace pro používání tohoto nástroje a demonstrovat jeho schopnosti při paralelním trénování. V konkrétní aplikaci se vstupní vektory pro MLP skládaly z příznaků na bázi dlouhých časových trajektoroií (TRAPs), výstupy sítě odpovídaly aposteriorní pravděpodobnosti přiřazení do jedné z 45 tříd fonémů. Pro zlepšení výsledků klasifikace byly použity skryté Markovovy modely. Předpokládané vlastnosti MLP klasifikátoru potvrdila řada experimentů, provedených se signály z databáze SPEECON. Úspěšnost klasifikace a doba trénování byly analyzovány na základě různých parametrů sítě a v nejlepším případě bylo dosaženo úspěšnosti klasifikace 82 % na úrovni fonémů. Dobu trénování výrazně zkrátila jeho paralelizace, a to přibližně o 50 %. Nejdelší čas trénování pro nejrozsáhlejší síť tvořenou 12 000 skrytými neurony trénovanou na 40000 signálech nepřekročil 13 h.
Submited:May 2014
More info: