Notre travail se situe dans le cadre du traitement automatique du langage naturel (TAL) pour l'apprentissage d'une deuxième langue. En particulier, nous étudions l'évolution de la structure de discours des apprenants au fur et à mesure qu'ils progressent dans leur niveau de connaissance d'une deuxième langue.
Pour atteindre notre but, nous utilisons ICNALE, un corpus de textes d'élèves asiatiques apprenant l'anglais, et des analyseurs de discours automatiques du domaine public. Pour nous assurer de la qualité de l’analyse automatique, nous utilisons des approches complémentaires pour étiqueter les relations discursives. Les deux principales approches sont celles du Penn Discourse TreeBank (PDTB) et de la Rhetorical Structure Theory (RST).
Les résultats préliminaires montrent que la distribution de certaines relations discursives diffère de façon significative chez les débutants d'une langue par rapport aux locuteurs courants d'une deuxième langue, alors que d’autres relations semblent être utilisées de façon équivalente. Une analyse plus profonde de ces différences est en cours.
Les résultats de notre recherche sont intéressants en eux-mêmes, car ils peuvent permettre de guider les enseignants et les apprenants pour peaufiner leur maitrise d'une langue seconde; mais aussi, peuvent être utiles à des modèles d'apprentissage automatique pour le TAL pour augmenter leur performance pour la reconnaissance automatique du niveau de langue d'un texte.
Connexion requise
Pour ajouter un commentaire, vous devez être connecté.