List

Bachelor thesis:Implementace rozpoznávače řeči na bázi TANDEM architektury ( PDF )
Author:Brich Aleš
Supervisor:doc. Ing. Petr Pollák, CSc.
Keywords:
Abstract:Tato práce se zabývá implementací jednoduchého rozpoznávače řeči na bázi TANDEM architektury pomocí volně dostupných, široce používaných nástrojů HTK. Cílem je zmapovat, jaké typy příznakových vektorů TANDEM architektury přinášejí zlepšení úspěšnosti klasifikace oproti standartním příznakovým vektorům (například melovským kepstrálním koeficientům). Pro splnění tohoto cíle je nutné nejprve vypočíst mel-spektra akustických signálů. Z nich lze vypočítat jak Melovské kepstrální koeficienty, tak TRAPs příznaky. TRAPs příznaky se dále mapují pomocí umělé neuronové sítě na pravděpodobnosti výskytu jednotlivých fonémů. Tyto pravděpodobnosti se po zlogaritmování a KLT spojí z Melovskými kepstrálním koeficienty v příznakový vektor TANDEM architektury. Těmito příznaky následně přetrénovávají skryté Markovovy modely. Nejvyšší úspěšnosti bylo dosaženo při použití příznakového vektoru KLT Melovských kepstrálních koeficientů s delta a delta-delta příznaky. Méně úspěšný byl příznakový vektor složený z KLT jednotlivých derivací kepstrálních koeficientů a KLT logaritmovaných posteriorů neuronové sítě s průměrnou úspěšností klasifikace 82 %.
Submited:May 2014
More info: