• Français
    • English
  • Français 
    • Français
    • English
  • Login
View Document 
  •   Savoirs UdeS Home
  • Génie
  • Génie – Mémoires
  • View Document
  •   Savoirs UdeS Home
  • Génie
  • Génie – Mémoires
  • View Document
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

All of Savoirs UdeSDomains & CollectionsBy Issue DateAuthorsTitlesSubjectsDirectorsThis CollectionBy Issue DateAuthorsTitlesSubjectsDirectors

My Account

Login

Statistics

View Usage Statistics

Discrimination parole-musique pour le codage universel de l'audio

Thumbnail
View/Open
Tancerel_Ludovic_MScA_1999.pdf (5.197Mb)
Publication date
1999
Author(s)
Tancerel, Ludovic
Subject
Électroacoustique
 
Codage
 
Sonorisation
Show full document record
Abstract
Le codage large bande de l'audio à bas débit est un enjeu majeur pour les télécommunications. Il est utilisé dans des applications de radio-diffusion sur Internet, de vidéo-conférence, de visio-téléphonie, et sera prochainement utilisé dans les futurs standards de téléphonie mobile. Il n'existe pas de modèles efficaces capables de coder à la fois les signaux de parole et de musique à bas débit, c'est à dire à moins de 1 bit/échantillon. Les codeurs de parole, basés sur la prédiction linéaire et la quantification vectorielle ont une mauvaise qualité pour la musique. Inversement, les codeurs de musique, basés sur un codage par transformée ou en sous-bande ont une mauvaise qualité pour les signaux de parole. Le but de cette maîtrise était de proposer une approche pragmatique pour le codage de l'audio à bas débit pour une application de radio-diffusion. Le système est basé sur une discrimination parole/musique, et un codage bi-modal, utilisant un codeur de musique, et un codeur de parole. Le système a été élaboré de façon à pouvoir utiliser différents modèles de codeurs. La discrimination parole/musique proposée dans ce mémoire s'appuie sur des techniques de reconnaissances de formes. Une analyse long-terme du signal est effectuée pour extraire 5 paramètres, basés sur les propriétés temporelles, fréquentielles et de stationnarité. Trois techniques de classification sont ensuite testées, les mélanges de gaussiennes, les K-plus proches voisins, et un perceptron multi-couches. Les performances de classification obtenues sont satisfaisantes, mais dépendent du délai que l'on se donne sur le signal. Pour éviter les artefacts qui apparaissent lors des transitions entre les codeurs si celles-ci surviennent dans des segments à haute énergie du signal, les transitions sont strictement limitées. Les performances obtenues sont alors meilleures que celles d'un codeur pris individuellement.
URI
http://savoirs.usherbrooke.ca/handle/11143/1179
Collection
  • Génie – Mémoires [2041]

DSpace software [version 5.4 XMLUI], copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback
 

 


DSpace software [version 5.4 XMLUI], copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback