Plusieurs disciplines scientifiques ont recours aux fréquences d’utilisation des mots afin de répondre à leurs questions de recherche. Les fréquences lexicales sont notamment utilisées en éducation afin de guider l’enseignement du vocabulaire ou en psychologie dans les tâches de décisions lexicales. Puisqu’il existe des distinctions propres au français québécois, il s’avère crucial de développer une liste de fréquences lexicales du français parlé au Québec afin que les études abordant le sujet reflètent bien le phénomène. Bien que des listes de fréquences lexicales du français parlé québécois existent, elles sont basées sur un nombre restreint de mots et peuvent donc être limitées quant à leur contenu. Notre objectif est de présenter un nouveau répertoire de la fréquence lexicale du français parlé au Québec, Lexiqc. Nous avons recueilli les sous-titres de films et de séries télévisées produits au Québec depuis les années 2000, pour un total de près de dix millions de mots. Les fichiers de sous-titres ont été lemmatisés et la fréquence d’utilisation de chaque mot a été calculée pour plus de 65 000 mots uniques. Nous avons comparé nos résultats à ceux du Corpus du français parlé québécois, une liste déjà établie. Des analyses de corrélation indiquent un degré d’accord élevé entre les deux listes. Les fréquences lexicales ont aussi été comparées à celles de Lexique 3, une liste française, afin de faire ressortir les mots utilisés plus fréquemment à l’oral au Québec qu’en France.
Connexion requise
Pour ajouter un commentaire, vous devez être connecté.