Aller au contenu principal
Il y a présentement des items dans votre panier d'achat.
92e Congrès de l'Acfas
Auteur et co-auteurs
Adel Jebali
Université Concordia
5a. Résumé

Il existe plusieurs outils de correction pour le français, tels qu'Antidote et Le Bon Patron, pour ne citer que ces deux-là. Cependant, ces systèmes, basés sur des règles, peinent à saisir les spécificités des écrits en langue seconde, souvent déviants des normes (Affes et al., 2023), ce qui provoque un échec d'analyse. Cette approche rend difficile la détection d'erreurs pour les apprenants de français langue seconde. Une solution plus adaptée serait d’utiliser des modèles linguistiques de grande envergure (LLM), qui nécessitent cependant d'importantes quantités de données parallèles, souvent rares pour le français. Les systèmes commerciaux ont tendance à surcorriger, dépassant parfois la correction grammaticale traditionnelle et interprétant mal certaines phrases. Les corpus publics, comme Lang-8, sont inadéquats sans adaptation, et d'autres corpus générés artificiellement produisent des erreurs non représentatives de la compétence réelle des apprenants. Notre projet vise à créer un corpus de 25 000 exemples, corrigés et annotés, ainsi qu'un modèle logiciel ouvert (open source), basé sur Llama 3.1, nommé Le Grammairien, surpassant les correcteurs actuels dans les tâches de correction automatique des productions écrites des apprenants du français langue seconde.