Un exemple d’annotation sur corpus écrit : Coref   

Un exemple d’annotation sur corpus écrit : référence et chaînes de référence (Groupe de recherche Coref) --> Passer en haute qualité (HD)

Frédéric Landragin - Lattice (CNRS, Ens, Paris 3 Sorbonne Nouvelle)

Nous présentons une étude en cours sur la référence à des personnes et à des groupes de personnes, étude dont l’objectif principal est d’analyser les chaînes de coréférence dans un corpus écrit et de mettre en œuvre une méthodologie d’annotation des phénomènes référentiels et coréférentiels. Le but de cette présentation est de soulever les questions et les problèmes rencontrés lors de cette étude, afin de mettre en avant les spécificités de l'annotation de phénomènes qui vont au-delà des aspects morphosyntaxiques : • Compte tenu de la nature sémantique et pragmatique des phénomènes étudiés, comment adapter les procédures d’annotation classiques pour qu’elles tiennent compte des biais interprétatifs, des ambiguïtés et des cas de sous-détermination ? • Comment intégrer dans les annotations les identifiants des référents humains et leur appartenance stricte ou floue à divers groupes, collectifs et institutions dont il peut être question, directement ou indirectement, dans le texte ? • Comment annoter les éléments non référentiels qui participent à la coréférence, notamment certains sujets zéro, certaines constructions pronominales, et certaines constructions attributives ? • Comment séparer ce qui relève nécessairement d’une annotation manuelle de ce qui peut être déduit automatiquement d’annotations effectuées (à la main ou à l’aide d’un analyseur morphosyntaxique), notamment quand on s’intéresse à des notions comme la saillance des référents et les types de transitions référentielles ? • Comment matérialiser les points précédents, premièrement avec le développement d’un outil adapté à l’annotation de chaînes de coréférence, et deuxièmement avec un schéma et un manuel d’annotation adaptés ?

Retour à la page "Vidéos et matériel pédagogique"

Modyco UMR CNRS - PARIS OUEST Nanterre
ADYLOC GDR CNRS Paris 8 SFL UMR CNRS Lattice UMR CNRS