La presse comparé le contenu de ses articles avec ceux du quotidien français Le Monde. Même si la plupart des mots sont identiques, chaque journal a quand même ses particularités, qui révèlent les différences entre le français utilisé au Québec et en France.
« Vous dites ? » Les cousins français qui ne comprennent pas notre langue amusent souvent les Québécois. La lexicographe Marie-Éva de Villers a consacré un doctorat entier à ce divertissement.
Pour sa thèse, Mmoi de Villers, qui est surtout connu pour avoir publié le Multidictionnaire de la langue françaisecomparé le texte des articles dans Devoir un toi Monde publié en 1997 afin d’identifier les mots propres à chaque journal.
L’objectif principal de son analyse, achevée en 2005, était notamment d’alimenter le Multidictionnairequi en était déjà à sa quatrième édition. La description du français au Québec a souvent été qualitative, explique-t-elle. «Je voulais tenter une analyse quantitative, quantifiée. »
Un exercice actualisé
Vingt ans plus tard, La presse recommencez l’exercice en comparant Le mondedu côté français, à La pressecette fois, du côté québécois pour l’année 2024 (voir méthodologie, ci-dessous). Marie-Éva de Villers se dit « ravie » de l’initiative et indique que « les résultats sont très stables par rapport à ceux [qu’elle a] obtenu à l’époque.
En 2005, la linguiste confiait avoir eu une surprise : « Je pensais que ce seraient les archaïsmes qui caractérisaient le français québécois », dit-elle. Parmi ces mots anciens que les Québécois ont conservés, de différentes régions de France, on compte par exemple et toi et pull-over. Les Français préfèrent désormais bonnet et tirer.
« Mais ce sont les mots que nous avons créés pour nommer nos réalités » qui distinguent la langue parlée ici, dit-elle. « Ce sont les mots qui sont de loin les plus courants. » Les meilleurs exemples sont motoneige ou motomarine et chips. Parmi les termes les plus récents, identifiés par l’exercice de La pressenous comptons baladoqui est apparu 264 fois cette année.
Notons également téléavertisseurutilisé 34 fois par La presse en 2024 en raison des explosions simultanées de dizaines de ces appareils de communication, tuant une douzaine de responsables du Hezbollah au Liban en septembre. Le monde plutôt écrit bip (23 occurrences).
Des Québécois innovants
Tous ces nouveaux mots ont fait l’objet de recommandations de l’Office québécois de la langue française (ou de son prédécesseur, l’OLF). «La réceptivité des Québécois, des journalistes et des rédacteurs aussi, est beaucoup plus grande au Québec qu’en France», explique Marie-Éva de Villers.
Cependant, une commission d’enrichissement linguistique existe en France. « Mais pour la plupart des Français, ce n’est pas à l’État de dire quels mots utiliser. Alors, ils boycottent les recommandations”, déplore M.moi de Villers, tandis qu’au Québec, ceux de l’OQLF font autorité.
Visitez le site FranceTerme, qui regroupe la Commission pour l’enrichissement de la langue française
Ce qui est surprenant, quand on analyse les mots trouvés uniquement dans Le mondeest de noter la grande quantité d’emprunts à l’anglais, comme téléphone intelligent (utilisé 161 fois), directeur (94 fois) ou parrainer (80 fois, dont parrainage).
Celui qui irrite le plus Mmoi de Villers est bulletin (468 occurrences, probablement pour inviter les lecteurs à s’abonner) : « Ça m’énerve toujours, la newsletter, même si une newsletter, c’est tellement pratique ! »
Près de 90 % de lexique commun
Nos données révèlent qu’environ 90 000 mots différents ont été utilisés par chaque journal, ce qui indique une richesse de vocabulaire à peu près égale.
Si l’on ne retient que les mots qui ont été utilisés cinq fois ou plus chacun et supprime les noms propres, on obtient environ 52 600 dans les deux publications.
De ce nombre, 45 600 sont communs (87 %) ; 3800 sont spécifiques à La presse (7%) et 3200 à Monde (6 %).
Régionalismes
La plupart des différences observées entre les deux corpus peuvent s’expliquer par des différences régionales. La géographie signifie qu’il n’y a que La presse qui parle de Résidents de Laval (28 fois) ou Gaspésiens (27 fois) et ça Le monde qui écrit sur Ile-de-France residents (104 fois) ou Brestois (50 fois).
La faune et la flore nous donnent 116 caribou et 59 pissenlits sur les écrans de La presse. Les pages philatéliques et numismatiques du Monde produire de leur côté 94 vermillon (pour le franc vermillon) 82 déchiqueté et 43 bistres.
La politique explique que La presse mentionné le mot 416 fois caquiste et ça Le monde mentionné 104 fois macronie ou le Macroniens.
Les différences sont également liées à l’administration, qui donne cégep (455 cas, dont sur un ordinateur d’entreprise) et sous-ministre (91 cas), mots uniques La presseou même cours (102 cas) et vice-ministre (26 cas) spécifiques à Monde.
Il est également surprenant que francisation n’a été trouvé que dans La pressequi a publié ce mot 221 fois en 2024.
Une analyse utile
Mmoi de Villers intitulé La forte envie de durer l’œuvre qu’elle a tirée de sa thèse, titre inspiré du poète Paul Éluard. « Il m’a semblé bien caractériser l’histoire du français en Amérique, dit-elle, l’histoire des francophones dont la fidélité à leur langue, la ténacité sans faille et la détermination sont remarquables. »
L’auteur (un mot que l’on retrouve dans les deux journaux) travaille à la huitième édition de son Multidictionnaire. Elle confie que l’analyse de La presse lui a permis de repérer quelques mots qui n’étaient pas encore là, comme abordabilité, principal, à tort, au minimum et webdiffusionentre autres.
Méthodologie
Pierre Meslin, de l’équipe business intelligence de La pressefourni pour la première fois tous les articles que nous avons publiés en 2024 (du 1est janvier au 30 novembre). Nous avons également récolté tous les articles du Monde pour la même période avec l’autorisation du journal.
Nous n’avons conservé que les articles rédigés par des artisans de chaque publication ou des collaborateurs externes, hors articles d’agence, textes d’opinion et textes de commande. Plus de 15 000 articles sont restés La presse et près de 21 000 Monde. Comme plusieurs articles du quotidien français sont réservés aux abonnés et que nous n’avons pu capter que les premiers paragraphes, notre corpus nous a finalement donné 7,1 millions de mots pour Le monde et 10,1 millions pour La presse.
La division des deux corpus en unités lexicales a été réalisée à l’aide d’un modèle de langage open source inclus dans la bibliothèque logicielle spaCy.