POLYmarMOTS : un outil pédagogique pour l'apprentissage du vocabulaire du français à l'école primaire
Nuria GALA, LIF-CNRS, Aix Marseille Université
Véronique REY, SHADYC-CNRS, Aix Marseille Université

Introduction

POLYmarMOTS est un projet de ressource lexicale conçue à partir de deux ressources existantes :

Cette ressource contient 4.221 mots (mots en commun POLYMOTS / NOVLEX) ainsi que leurs descriptions associées provenant des deux ressources à l'origine. Les mots sont également visibles en contexte (corpus de 92.802 mots composé, à ce jour, de contes de Grimm et de fables de La Fontaine).

L'objectif d'une telle ressource est fondamentalement pédagogique : apprentissage du vocabulaire et de l'orthographe du français en milieu scolaire

Caractérisation linguistique

Polymots organise les mots en familles. Chaque famille a une base qui est de type (1) transparente, si elle existe en tant que mot dans la langue (par exemple, 'bras' dans la famille 'brassard', 'brasser', 'bracelet', etc.) ou (2) opaque, si la base n'existe pas de façon autonome en tant qu'unité lexicale (par exemple, 'abon' dans la famille 'abonner', 'abonnement', 'abonnable', etc.). Les informations extraites de cette ressource comprennent aussi les affixes ainsi que les alternances vocaliques dans la famille.

Le tableau suivant montre les informations obtenues de POLYMOTS pour le mot 'volontaire':


type base mot prefixes sufixes alternance
2 voul/vol volontaire - ont-aire [u/o]

Les informations obtenues de NOVLEX pour le même mot 'volontaire' sont les suivantes:


mot fréquence nblettres phon nbphon syll nbsyll struct. syll gram genre
volontaire 5712 10 volôtèR 7 vo-lô-tèR 3 CV-CV-CVC N h

Les informations obtenues de NOVLEX concernent plusieurs champs: forme graphique, fréquence d'apparition, nombre de lettres, représentation phonétique, nombre de phonèmes, décomposition syllabique, nombre de syllabes, structure vocalique (voyelle/consonne/semi-consonne), catégorie morpho-syntaxique (étiquette grammaticale) et genre (masculin, féminin, pas de différence de genre).

Dans POLYmarMOTS la fréquence est une étiquette explicite en fonction des seuils suivants (la fréquence dans NOVLEX est calculée par rapport à un corpus de 417.000 mots provenant de manuels scolaires):'rare' = , 'peu fréquent' = , 'fréquent' = , 'très fréquent' = .

Outil informatique

POLYmarMOTS se présente sous forme d'une base de données accessible par téléchargement (en construction).

Pour un mot donné, l'utilisateur accède à toutes les informations le concernant: des informations phonologiques, statistiques et gramaticales de NOVLEX; des informations morpho-phonologiques provenant de Polymots. Grâce à cette dernière ressource, pour un mot donné l'utilisateur peut identifier un ensemble de mots appartenant à la même famille.

La recherche dans POLYmarMOTS peut également se faire en sélectionnant des filtres, par exemple, mots avec 3 syllabes, mots avec 3 syllabes et rares, etc. Le résultat de la requête est une nouvelle fenêtre avec tous les mots satisfaisant les critères de recherche. En en sélectionnant un, l'utilisateur accède aux différentes informations concernant le mot choisi. Enfin, tout mot peut être visualisé en contexte (contes de Grimm et fables de La Fontaine).


polymarmots_v02
Dernière mise à jour : 07/07/10