• Français
    • English
  • Français 
    • Français
    • English
  • Login
View Document 
  •   Savoirs UdeS Home
  • Sciences
  • Sciences – Mémoires
  • View Document
  •   Savoirs UdeS Home
  • Sciences
  • Sciences – Mémoires
  • View Document
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

All of Savoirs UdeSDomains & CollectionsBy Issue DateAuthorsTitlesSubjectsDirectorsThis CollectionBy Issue DateAuthorsTitlesSubjectsDirectors

My Account

Login

Statistics

View Usage Statistics

aliFreeScan: une approche sans alignement pour annoter l’ARN non codant dans des données génomiques à l'aide d'apprentissage machine

Other titre : aliFreeScan : an alignment-free approach to annotate ncRNAS in genomic data using machine learning

Thumbnail
View/Open
Document principal (1.118Mb)
Publication date
2020
Author(s)
Fotouhi, Ali
Subject
Genome annotation
 
Non-coding RNA
 
Machine learning
 
Annotation du génome
 
ARN-non-codants
 
Techniques d'apprentissage
Show full document record
Abstract
Dans ce mémoire, nous essayons de trouver un moyen d'annoter le génome en exploitant uniquement les informations de séquence pour toute famille d'ARN. Nous avons évalué le potentiel des approches d'apprentissage automatique pour l'identification du génome entier des ARN non codants (ARNnc). Nous avons testé plusieurs algorithmes et identifié plusieurs défis pour développer une méthode d'apprentissage automatique précise pour la recherche d'ARNc dans les génomes. L'annotation du génome est l'identification d'éléments de séquence fonctionnels dans le génome d'un organisme. La connaissance de la présence et de la localisation de ces éléments de séquence, associée à la compréhension de leurs rôles fonctionnels, aide à révéler le type de processus biologiques qui se déroulent dans l'organisme ainsi que l'historique de son évolution. Les classes d'éléments de séquence fonctionnels comprennent les gènes codant pour les protéines, les éléments d'ARN non codants, ainsi que d'autres. Les éléments d'ARN fonctionnels sont des ARN qui ne sont pas traduits en protéines, mais remplissent plutôt leur fonction biologique directement en tant qu'ARN. L'annotation des ARN est généralement effectuée à l'aide d'ARN connus en tant que requêtes pour des recherches d'homologie avec le génome entier étudié. Nous présentons les résultats de l'analyse du génome en utilisant uniquement les informations de séquence des ARN sous forme de requêtes de prédiction.
 
Abstract: In this thesis, we try to find a way to annotate the Genome exploiting only the sequence information for any RNA family. We have evaluated the potential of machine learning approaches for whole-genome identification of non-coding RNAs (ncRNAs). We have tested several algorithms and identified several challenges to developing an accurate machine learning method for the search of ncRNAs in genomes. The Genome annotation is the identification of functional elements of the sequence in the genome of an organism. Knowledge of the presence and location of these sequence elements, combined with an understanding of their functional roles, helps to reveal the type of biological processes that take place in the organism as well as the history of its evolution. The classes of these elements include protein-coding genes, non-coding RNA (ncRNA) elements, and others. ncRNAs are RNAs that are not translated into proteins, but rather fulfill their biological function directly as RNA. RNA annotation is typically performed using known RNAs as queries for homology searches against the entire genome being studied. We present the results of the genome analysis using only the RNA sequence information as queries for the prediction of ncRNAs.
 
URI
http://hdl.handle.net/11143/16833
Collection
  • Moissonnage BAC [3822]
  • Sciences – Mémoires [1710]

DSpace software [version 5.4 XMLUI], copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback
 

 


DSpace software [version 5.4 XMLUI], copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback