Show simple document record

Other titre : aliFreeScan : an alignment-free approach to annotate ncRNAS in genomic data using machine learning

dc.contributor.advisorWang, Shengrui
dc.contributor.advisorOuangraoua, Aïda
dc.contributor.authorFotouhi, Alifr
dc.date.accessioned2020-04-17T15:50:16Z
dc.date.available2020-04-17T15:50:16Z
dc.date.created2020fr
dc.date.issued2020-04-17
dc.identifier.urihttp://hdl.handle.net/11143/16833
dc.description.abstractDans ce mémoire, nous essayons de trouver un moyen d'annoter le génome en exploitant uniquement les informations de séquence pour toute famille d'ARN. Nous avons évalué le potentiel des approches d'apprentissage automatique pour l'identification du génome entier des ARN non codants (ARNnc). Nous avons testé plusieurs algorithmes et identifié plusieurs défis pour développer une méthode d'apprentissage automatique précise pour la recherche d'ARNc dans les génomes. L'annotation du génome est l'identification d'éléments de séquence fonctionnels dans le génome d'un organisme. La connaissance de la présence et de la localisation de ces éléments de séquence, associée à la compréhension de leurs rôles fonctionnels, aide à révéler le type de processus biologiques qui se déroulent dans l'organisme ainsi que l'historique de son évolution. Les classes d'éléments de séquence fonctionnels comprennent les gènes codant pour les protéines, les éléments d'ARN non codants, ainsi que d'autres. Les éléments d'ARN fonctionnels sont des ARN qui ne sont pas traduits en protéines, mais remplissent plutôt leur fonction biologique directement en tant qu'ARN. L'annotation des ARN est généralement effectuée à l'aide d'ARN connus en tant que requêtes pour des recherches d'homologie avec le génome entier étudié. Nous présentons les résultats de l'analyse du génome en utilisant uniquement les informations de séquence des ARN sous forme de requêtes de prédiction.fr
dc.description.abstractAbstract: In this thesis, we try to find a way to annotate the Genome exploiting only the sequence information for any RNA family. We have evaluated the potential of machine learning approaches for whole-genome identification of non-coding RNAs (ncRNAs). We have tested several algorithms and identified several challenges to developing an accurate machine learning method for the search of ncRNAs in genomes. The Genome annotation is the identification of functional elements of the sequence in the genome of an organism. Knowledge of the presence and location of these sequence elements, combined with an understanding of their functional roles, helps to reveal the type of biological processes that take place in the organism as well as the history of its evolution. The classes of these elements include protein-coding genes, non-coding RNA (ncRNA) elements, and others. ncRNAs are RNAs that are not translated into proteins, but rather fulfill their biological function directly as RNA. RNA annotation is typically performed using known RNAs as queries for homology searches against the entire genome being studied. We present the results of the genome analysis using only the RNA sequence information as queries for the prediction of ncRNAs.fr
dc.language.isofrefr
dc.language.isoengfr
dc.publisherUniversité de Sherbrookefr
dc.rights© Ali Fotouhifr
dc.subjectGenome annotationfr
dc.subjectNon-coding RNAfr
dc.subjectMachine learningfr
dc.subjectAnnotation du génomefr
dc.subjectARN-non-codantsfr
dc.subjectTechniques d'apprentissagefr
dc.titlealiFreeScan: une approche sans alignement pour annoter l’ARN non codant dans des données génomiques à l'aide d'apprentissage machinefr
dc.title.alternativealiFreeScan : an alignment-free approach to annotate ncRNAS in genomic data using machine learningfr
dc.typeMémoirefr
tme.degree.disciplineInformatiquefr
tme.degree.grantorFaculté des sciencesfr
tme.degree.levelMaîtrisefr
tme.degree.nameM. Sc.fr


Files in this document

Thumbnail

This document appears in the following Collection(s)

Show simple document record