Tous les mois, la BU met en avant une thèse en Open Access – diffusée sous forme numérique et gratuitement – , ainsi que des ressources en Open Access liées à cette thèse.
Comment la machine peut-elle comprendre le sens des termes polysémiques ? Comment cela peut-il s’appliquer aux spécificités de la langue coréenne, notamment aux marqueurs ?
Seongmin Mun, docteur en sciences du langage de l’Université Paris Nanterre, explore ces questions dans sa thèse soutenue en 2021 : La résolution de la polysémie à l’aide de modèles de vecteur de mots et la visualisation des données : le cas des postpositions adverbiales –ey, -eyse, et –(u)lo en coréen, réalisée au sein du laboratoire Modèles, Dynamique, Corpus.
La langue coréenne fonctionne selon la structure Sujet-Objet-Verbe et fait l’usage de postpositions dédiées ajoutant une signification grammaticale à un mot ou contenu auquel il est attaché. Une postposition, impliquant des correspondances de forme et de fonction, est de ce fait polysémique. Le fait que la signification d’un mot soit étroitement liée aux mots voisins (contexte) est un point d’entrée pour l’apprentissage automatique de la langue, basé sur la répétition et l’association de termes. En s’appuyant sur le corpus de Sejong, l’auteur identifie les fonctions spécifiques d’un lot de postpositions adverbiales et crée des modèles de classification/visualisation afin d’évaluer les performances de modèles de traitement automatique de la polysémie.
EN BONUS (et en open access !)
- Un article de revue publié aux débuts de l’automatisation syntaxique du coréen
- Une thèse soutenue à l’UPN qui met en application le TAL pour l’analyse de corpus
- Un ouvrage sur les enjeux linguistiques de la polysémie
Victorri, Bernard, et Catherine Fuchs. La polysémie – construction dynamique du sens. Hermès, 1996. halshs.archives-ouvertes.fr, .
- L’enregistrement d’une conférence sur le traitement automatique des langues des signes
Modélisation et Traitement Automatique des Langues des Signes – Tour d’horizon | Canal U.