La THÈSE DU MOIS en Open Access (26) – Résoudre informatiquement la polysémie

Université Paris Nanterre | Service commun de Documentation

La THÈSE DU MOIS en Open Access (26) – Résoudre informatiquement la polysémie

Jared Tarbell, Le hangeul sur des journaux coréens à Insadong, Séoul, Corée (2006). Source : https://www.flickr.com/photos/generated/296522152/

Étiquettes: Ressource numérique, Science ouverte, Thèse du mois

Publication publiée :novembre 10, 2022
Commentaires de la publication :0 commentaire

Tous les mois, la BU met en avant une thèse en Open Access – diffusée sous forme numérique et gratuitement – , ainsi que des ressources en Open Access liées à cette thèse.

Comment la machine peut-elle comprendre le sens des termes polysémiques ? Comment cela peut-il s’appliquer aux spécificités de la langue coréenne, notamment aux marqueurs ?

Seongmin Mun, docteur en sciences du langage de l’Université Paris Nanterre, explore ces questions dans sa thèse soutenue en 2021 : La résolution de la polysémie à l’aide de modèles de vecteur de mots et la visualisation des données : le cas des postpositions adverbiales –ey, -eyse, et –(u)lo en coréen, réalisée au sein du laboratoire Modèles, Dynamique, Corpus.

La langue coréenne fonctionne selon la structure Sujet-Objet-Verbe et fait l’usage de postpositions dédiées ajoutant une signification grammaticale à un mot ou contenu auquel il est attaché. Une postposition, impliquant des correspondances de forme et de fonction, est de ce fait polysémique. Le fait que la signification d’un mot soit étroitement liée aux mots voisins (contexte) est un point d’entrée pour l’apprentissage automatique de la langue, basé sur la répétition et l’association de termes. En s’appuyant sur le corpus de Sejong, l’auteur identifie les fonctions spécifiques d’un lot de postpositions adverbiales et crée des modèles de classification/visualisation afin d’évaluer les performances de modèles de traitement automatique de la polysémie.

EN BONUS (et en open access !)

Un article de revue publié aux débuts de l’automatisation syntaxique du coréen

Nam, Jee-Sun. « Lexique-grammaire des adjectifs coréens et analyse syntaxique automatique ». Langages, vol. 31, n^o 126, 1997, p. 105‑23.

Une thèse soutenue à l’UPN qui met en application le TAL pour l’analyse de corpus

Kang, Hyun Jung. Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus. Paris Nanterre, 28 janvier 2021.

Un ouvrage sur les enjeux linguistiques de la polysémie

Victorri, Bernard, et Catherine Fuchs. La polysémie – construction dynamique du sens. Hermès, 1996. halshs.archives-ouvertes.fr, .

L’enregistrement d’une conférence sur le traitement automatique des langues des signes

Modélisation et Traitement Automatique des Langues des Signes – Tour d’horizon | Canal U.

Laisser un commentaire Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

EN BONUS (et en open access !)

Partager cet article Partager ce contenu

Vous devriez également aimer

La THÈSE DU MOIS en Open Access (18) – Ce que la taille de pierre nous dit des modes de vie préhistoriques

La THÈSE DU MOIS en Open Access (27) – Ce que j’ai encore raconté à mon chat

La THÈSE DU MOIS en Open Access (29) – Le vol comme échappatoire à l’effondrement psychique

Laisser un commentaire Annuler la réponse

Partager ce contenu