Show simple document record

dc.contributor.advisorRouat, Jean
dc.contributor.authorAbdelnour, Jérômefr
dc.date.accessioned2021-09-15T15:08:15Z
dc.date.available2021-09-15T15:08:15Z
dc.date.created2021fr
dc.date.issued2021-09-15
dc.identifier.urihttp://hdl.handle.net/11143/18704
dc.description.abstractLe présent projet introduit la tâche "réponse à des questions à contenu auditif" (Acoustic Question Answering-AQA) dans laquelle un agent intelligent doit répondre à une question sur le contenu d'une scène auditive. Dans un premier temps, une base de donnée (CLEAR) comprenant des scènes auditives ainsi que des paires question-réponse pour chacune d'elles est mise sur pied afin de permettre l'entraînement de systèmes à base de neurones. Cette tâche étant analogue à la tâche "réponse à des questions à contenu visuel" (Visual Question Answering-VQA), une étude préliminaire est réalisé en utilisant un réseau de neurones (FiLM) initialement développé pour la tâche VQA. Les scènes auditives sont d'abord transformées en représentation spectro-temporelle afin d'être traitées comme des images par le réseau FiLM. Cette étude a pour but de quantifier la performance d'un système initialement conçu pour des scènes visuelles dans un contexte acoustique. Dans la même lignée, une étude de l'efficacité de la technique visuelle de cartes de coordonnées convolutives (CoordConv) lorsqu'appliquée dans un contexte acoustique est réalisée. Finalement, un nouveau réseau de neurones adapté au contexte acoustique (NAAQA) est introduit. NAAQA obtient de meilleures performances que FiLM sur la base de donnée CLEAR tout en étant environ 7 fois moins complexe.fr
dc.language.isofrefr
dc.language.isoengfr
dc.publisherUniversité de Sherbrookefr
dc.rights© Jérôme Abdelnourfr
dc.rightsAttribution - Pas d’Utilisation Commerciale - Pas de Modification 2.5 Canada*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/ca/*
dc.subjectRéseau neuronesfr
dc.subjectConvolutionfr
dc.subjectVQAfr
dc.subjectAQAfr
dc.subjectQuestion Réponsefr
dc.subjectAcoustiquefr
dc.subjectFiLMfr
dc.subjectCoordConvfr
dc.titleSystème neuronal pour réponses à des questions de compréhension de scène auditivesfr
dc.typeMémoirefr
tme.degree.disciplineGénie électriquefr
tme.degree.grantorFaculté de géniefr
tme.degree.levelMaîtrisefr
tme.degree.nameM. Sc. A.fr


Files in this document

Thumbnail
Thumbnail

This document appears in the following Collection(s)

Show simple document record

© Jérôme Abdelnour
Except where otherwise noted, this document's license is described as © Jérôme Abdelnour