Conception d'un traducteur intelligent de RTF vers XML
Abstract
Les fichiers de textes formatés (.doc ) produits par l'outil Microsoft Word sont omniprésents dans la très grande majorité des ordinateurs. Ils constituent des documents digitaux dont certains sont de nature publique et leurs propriétaires aimeraient bien les publier facilement sur l'Internet. Une solution consiste à traduire, par exemple, ces fichiers en des fichiers dans le format HTML. Ce mémoire présente un nouveau système informatique qui permet de convertir un fichier dans le format RTF, un format proche du format .doc mais universel et lisible par un humain, en un fichier dans un format XML. Dans ce mémoire, le format XML est considéré comme un format intermédiaire puisqu'un fichier dans ce format est à son tour utilisé pour générer un fichier dans un format cible comme HTML, JSP, TeX ou D2E. En plus de présenter l'architecture et des éléments de conception de ce système, ce mémoire porte une attention particulière sur des règles de traduction, des règles de simplification et des règles de préférence mises en oeuvre grâce à des techniques empruntées au domaine de la construction des compilateurs.
Collection
- Sciences – Mémoires [1656]