• Français
    • English
  • Français 
    • Français
    • English
  • Se connecter
Visualiser le document 
  •   Accueil de Savoirs UdeS
  • Génie
  • Génie – Mémoires
  • Visualiser le document
  •   Accueil de Savoirs UdeS
  • Génie
  • Génie – Mémoires
  • Visualiser le document
JavaScript is disabled for your browser. Some features of this site may not work without it.

Parcourir

Tout Savoirs UdeSDomaines et collectionsDates de publicationAuteursTitresSujetsDirecteursCette collectionDates de publicationAuteursTitresSujetsDirecteurs

Mon compte

Se connecter

Statistiques

Voir les statistiques d'utilisation

Discrimination parole-musique pour le codage universel de l'audio

Thumbnail
Visualiser/Ouvrir
Tancerel_Ludovic_MScA_1999.pdf (5.197Mb)
Date de publication
1999
Auteur(s)
Tancerel, Ludovic
Sujet(s)
Électroacoustique
 
Codage
 
Sonorisation
Afficher la notice détaillée
Résumé
Le codage large bande de l'audio à bas débit est un enjeu majeur pour les télécommunications. Il est utilisé dans des applications de radio-diffusion sur Internet, de vidéo-conférence, de visio-téléphonie, et sera prochainement utilisé dans les futurs standards de téléphonie mobile. Il n'existe pas de modèles efficaces capables de coder à la fois les signaux de parole et de musique à bas débit, c'est à dire à moins de 1 bit/échantillon. Les codeurs de parole, basés sur la prédiction linéaire et la quantification vectorielle ont une mauvaise qualité pour la musique. Inversement, les codeurs de musique, basés sur un codage par transformée ou en sous-bande ont une mauvaise qualité pour les signaux de parole. Le but de cette maîtrise était de proposer une approche pragmatique pour le codage de l'audio à bas débit pour une application de radio-diffusion. Le système est basé sur une discrimination parole/musique, et un codage bi-modal, utilisant un codeur de musique, et un codeur de parole. Le système a été élaboré de façon à pouvoir utiliser différents modèles de codeurs. La discrimination parole/musique proposée dans ce mémoire s'appuie sur des techniques de reconnaissances de formes. Une analyse long-terme du signal est effectuée pour extraire 5 paramètres, basés sur les propriétés temporelles, fréquentielles et de stationnarité. Trois techniques de classification sont ensuite testées, les mélanges de gaussiennes, les K-plus proches voisins, et un perceptron multi-couches. Les performances de classification obtenues sont satisfaisantes, mais dépendent du délai que l'on se donne sur le signal. Pour éviter les artefacts qui apparaissent lors des transitions entre les codeurs si celles-ci surviennent dans des segments à haute énergie du signal, les transitions sont strictement limitées. Les performances obtenues sont alors meilleures que celles d'un codeur pris individuellement.
URI
http://savoirs.usherbrooke.ca/handle/11143/1179
Collection
  • Génie – Mémoires [2041]

DSpace software [version 5.4 XMLUI], copyright © 2002-2015  DuraSpace
Communiquer avec nous | Envoyer des commentaires
 

 


DSpace software [version 5.4 XMLUI], copyright © 2002-2015  DuraSpace
Communiquer avec nous | Envoyer des commentaires