La THÈSE DU MOIS en Open Access (26) – Résoudre informatiquement la polysémie

You are currently viewing <strong>La THÈSE DU MOIS en Open Access (26) – Résoudre informatiquement la polysémie</strong>
Jared Tarbell, Le hangeul sur des journaux coréens à Insadong, Séoul, Corée (2006). Source : https://www.flickr.com/photos/generated/296522152/

Tous les mois, la BU met en avant une thèse en Open Access – diffusée sous forme numérique et gratuitement , ainsi que des ressources en Open Access liées à cette thèse.

Comment la machine peut-elle comprendre le sens des termes polysémiques ? Comment cela peut-il s’appliquer aux spécificités de la langue coréenne, notamment aux marqueurs ?

Seongmin Mun, docteur en sciences du langage de l’Université Paris Nanterre, explore ces questions dans sa thèse soutenue en 2021 : La résolution de la polysémie à l’aide de modèles de vecteur de mots et la visualisation des données : le cas des postpositions adverbiales –ey, -eyse, et –(u)lo en coréen, réalisée au sein du laboratoire Modèles, Dynamique, Corpus.

La langue coréenne fonctionne selon la structure Sujet-Objet-Verbe et fait l’usage de postpositions dédiées ajoutant une signification grammaticale à un mot ou contenu auquel il est attaché.  Une postposition, impliquant des correspondances de forme et de fonction, est de ce fait polysémique. Le fait que la signification d’un mot soit étroitement liée aux mots voisins (contexte) est un point d’entrée pour l’apprentissage automatique de la langue, basé sur la répétition et l’association de termes. En s’appuyant sur le corpus de Sejong, l’auteur identifie les fonctions spécifiques d’un lot de postpositions adverbiales et crée des modèles de classification/visualisation afin d’évaluer les performances de modèles de traitement automatique de la polysémie.

EN BONUS (et en open access !)

  • Un article de revue publié aux débuts de l’automatisation syntaxique du coréen

Nam, Jee-Sun. « Lexique-grammaire des adjectifs coréens et analyse syntaxique automatique ». Langages, vol. 31, no 126, 1997, p. 105‑23.

  • Une thèse soutenue à l’UPN qui met en application le TAL pour l’analyse de corpus

Kang, Hyun Jung. Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus. Paris Nanterre, 28 janvier 2021.

  • Un ouvrage sur les enjeux linguistiques de la polysémie

Victorri, Bernard, et Catherine Fuchs. La polysémie – construction dynamique du sens. Hermès, 1996. halshs.archives-ouvertes.fr, .

  • L’enregistrement d’une conférence sur le traitement automatique des langues des signes

Modélisation et Traitement Automatique des Langues des Signes – Tour d’horizon | Canal U.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.