Les apports et les limites de la Banque de données textuelles de Sherbrooke au regard de la description lexicographique du français en usage au Québec

View/ Open
Publication date
2005Author(s)
Labrecque, Geneviève
Abstract
La présente thèse vise à montrer les apports et les limites de la Banque de données textuelles de Sherbrooke (BDTS) au regard de la description lexicographique du français en usage au Québec (FUQ).La BDTS est un corpus de plus de 52 millions d'occurrences, tirées de textes représentatifs des discours spécialisés, littéraires, journalistiques, didactiques et oraux du FUQ. Cette étude s'appuie sur la pratique d'une linguistique à base de corpus et vise à connaître les avantages que procure l'exploitation de corpus à des fins lexicographiques et les difficultés découlant d'une telle démarche. Dans un premier temps, les apports et les limites de la BDTS ont été mis en lumière au regard de l'élaboration d'une nomenclature d'un ouvrage décrivant le FUQ.La liste des vocables de la BDTS a été comparée avec les nomenclatures de dictionnaires français et québécois. De cette comparaison il est ressorti que, en plus d'actualiser dans le discours les mots déjà relevés dans les ouvrages, la BDTS ajoute bon nombre de mots nouveaux non répertoriés dans les dictionnaires. Un certain nombre de mots consignés dans les ouvrages de référence ne sont par contre pas attestés dans la Banque, ce qui a fait ressortir les limites du corpus. Dans un deuxième temps, les apports et les limites de la BDTS ont été observés au regard de la description lexicographique (sémantique, combinatoire, etc.) d'un échantillon aléatoire de 25 mots de fréquence variée. Les éléments extraits des contextes de la BDTS ont été comparés avec ceux présents dans les articles lexicographiques de dictionnaires français et québécois. Il est ressorti que l'essentiel des informations (acceptions, expressions, etc.) des dictionnaires se trouve dans la BDTS, à l'exception de quelques emplois, souvent spécialisés, vieillis ou peu courants. En plus d'attester les données des ouvrages, la Banque ajoute des données originales, surtout sur le plan des cooccurrents. Enfin, cette recherche s'est conclue par une validation des résultats dans la version mise à jour de la BDTS; il est apparu que le corpus élargi fournit peu de nouvelles données par rapport à ce qui est déjà décrit dans les dictionnaires et déjà attesté dans le corpus de base. Selon cette étude, l'exploitation de la BDTS apparaît comme essentielle à la description lexicographique du FUQ, surtout de la langue générale en synchronie.