Show simple document record

dc.contributor.advisorRouat, Jeanfr
dc.contributor.authorLoiselle, Stéphanefr
dc.date.accessioned2014-05-15T12:41:25Z
dc.date.available2014-05-15T12:41:25Z
dc.date.created2010fr
dc.date.issued2010fr
dc.identifier.isbn9780494750636fr
dc.identifier.urihttp://savoirs.usherbrooke.ca/handle/11143/1952
dc.description.abstractCette thèse présente un traitement inspiré du fonctionnement du système auditif pour améliorer la reconnaissance vocale. Pour y parvenir, le signal de la parole est filtré par un banc de filtres et compressé pour en produire une représentation auditive. L'innovation de l'approche proposée se situe dans l'extraction des éléments acoustiques (formants, transitions et onsets ) à partir de la représentation obtenue. En effet, une combinaison de détecteurs composés de neurones à décharges permet de révéler la présence de ces éléments et génère ainsi une séquence d'événements pour caractériser le contenu du signal. Dans le but d'évaluer la performance du traitement présenté, la séquence d'événements est adaptée à un système de reconnaissance vocale conventionnel, pour une tâche de reconnaissance de chiffres isolés prononcés en anglais. Pour ces tests, la séquence d'événements agit alors comme une sélection de trames automatique pour la génération des observations (coefficients cepstraux). En comparant les résultats de la reconnaissance du prototype et du système de reconnaissance original, on remarque que les deux systèmes reconnaissent très bien les chiffres prononcés dans des conditions optimales et que le système original est légèrement plus performant. Par contre, la différence observée au niveau des taux de reconnaissance diminue lorsqu'une réverbération vient affecter les données à reconnaître et les performances de l'approche proposée parviennent à dépasser celles du système de référence. De plus, la sélection de trames automatique offre de meilleures performances dans des conditions bruitées. Enfin, l'approche proposée se base sur des caractéristiques dans le temps en fonction de la nature du signal, permet une sélection plus intelligente des données qui se traduit en une parcimonie temporelle, présente un potentiel fort intéressant pour la reconnaissance vocale sous conditions adverses et utilise une détection des caractéristiques qui peut être utilisée comme séquence d'impulsions compatible avec les réseaux de neurones à décharges.fr
dc.language.isofrefr
dc.publisherUniversité de Sherbrookefr
dc.rights© Stéphane Loisellefr
dc.subjectModèles de Markov cachésfr
dc.subjectApproche connectionistefr
dc.subjectSystème auditif biologiquefr
dc.subjectExtraction de caractéristiques phonétiquesfr
dc.subjectReconnaissance vocalefr
dc.subjectIntelligence artificiellefr
dc.titleTraitement bio-inspiré de la parole pour système de reconnaissance vocalefr
dc.typeThèsefr
tme.degree.disciplineGénie électriquefr
tme.degree.grantorFaculté de géniefr
tme.degree.levelDoctoratfr
tme.degree.namePh.D.fr


Files in this document

Thumbnail

This document appears in the following Collection(s)

Show simple document record