Atelier 4 AS

Atelier sur les Avancées en AMR et en Analyse Sémantiques

Programme

  • 9h00 — 9h05: Introduction de l’Atelier
  • 9h05 — 9h50:  Présentation invitée: Jury Optiz • Abstract Meaning Representation — Tales from a PhD journey, and beyond
    • In this talk, I will give an overview of the findings of my PhD thesis, as well as some recent work in the AMR domain. Finally, I will offer an outlook, outlining open challenges and opportunities for MR research, taking into account this era that is marked by LLM developments.
  • 9h50 — 10h10: Connor MacLean and Denis Cavallucci: Prétraitement syntaxique pour enrichir le Bag of Words en Topic Modeling
  • 10h10 — 10h30: Amandine Decker and Maxime Amblard: L’essentiel est invisible pour les représentations sémantiques
  • ==== Pause café ====
  • 11h00 — 11h20: Ahana Chattopadhyay: Ressources lexicales pour la sémantique : WordNet, BabelNet, PropBank, FrameNet, DBpedia et SUMO
  • 11h20 — 12h30: Discussion

Description de l’atelier

L’atelier se déroulera en tant qu’événement satellite de TALN 2025 à Marseille.
Il se déroulera sur une demi-journée le 30 juin.

Beaucoup de chercheurs et chercheuses ont rêvé de créer une intelligence artificielle générale et pour cela ont imaginé d’exploiter la sémantique du langage (parsing et génération). Aujourd’hui nous nous rapprochons de cette possibilité quand nous voyons la capacité des modèles à appréhender des problèmes complexes. Mais, aucun de ces systèmes n’exploite véritablement l’analyse sémantique qui reste un terrain de recherche fertile du point de vue des formalismes, des architectures/modèles et des publications. Bien qu’imparfait, un formalisme tentant de faire le lien entre ces différentes problématiques, les AMR, a concentré beaucoup d’efforts.

Cet atelier vise à réunir les différentes équipes qui s’intéressent à la sémantique du langage avec trois objectifs.

  • Faire le point sur les différentes approches d’exploitation de la sémantique du langage, ses différents formalismes (DRS, AMR, Yarn, …) et leurs usages (modèles d’IA plus frugale, répondre à des problèmes où la sémantique a des avantages clairs par rapport des LLMs, …). Un focus sera fait sur l’AMR, ses forces, faiblesses, ses successeurs potentiels et évolutions à venir.
  • Identifier et positionner les différentes ressources utiles à l’analyse sémantique. Si le développement d’un Propbank en français n’apparaît pas comme une stratégie gagnante, porter le développement d’un alignement des mots du français vers Propbank, dans la ligné de VerbNet et Semlink serait intéressant. La question des corpus annotés est aussi largement ouverte.
  • Echanger les différents points de vue sur l’intérêt de poursuivre cette recherche face aux capacités des très grands modèles de langue (LLM), la meilleure façon de structurer cette recherche (projets collaboratifs par exemple) et de communiquer auprès d’un vaste public.

L’atelier sollicite des communications qui abordent un ou plusieurs des thèmes suivants :

  • Interface syntaxe-sémantique ;
  • Les ressources pour la sémantique
  • Expansion ou couplage de ressources sémantiques avec des LLM ;
  • Conception et annotation des représentations sémantiques ;
  • Comparaison des framework de représentations sémantiques ;
  • Génération automatique de textes à partir de représentations de sens ;
  • Forces et faiblesses des représentations sémantiques existantes ;
  • Utilisation des représentations sémantique dans des applications réelles ;
  • Application des représentations sémantiques et multilinguismes ;
  • multimodalité dans les représentations du sens ;
  • La relation entre les représentations symboliques du sens et les représentations sémantiques distribuées ;
  • Propriétés formelles des représentations de sens ;

Soumission

La longueur attendue des soumissions est de 4 pages, augmentée d’une page pour les versions camera ready.

Les soumissions doivent être rédigées selon la feuille de style ci-dessous et être soumises sous forme de fichiers PDF via le système EasyChair. 

Système de soumission est une track 4AS sur le site easychair de la conférence principale : https://easychair.org/my/conference?conf=coriataln2025

Les feuilles de style sont communes à TALN, CORIA, RECITAL et RJCRI.

Les traductions de soumissions précédemment acceptées dans des conférences de plus grande envergure sont acceptées.

Un modèle Overleaf est disponible ici : Feuilles de style CORIA-TALN 2025

Une archive contenant les feuilles de style LaTeX est disponible ici.

Une archive contenant les feuilles de style Word / LibreOffice est disponible ici.

Dates

  • Date limite de soumission : 22 avril 27 avril 2025 (anywhere on earth)
  • Notification : 7 Mai 2025 (anywhere on earth)
  • Camera Ready version : 14 Mai 2025 (anywhere on earth)

En intégrant les contraintes de calendrier, aucune extension ne sera possible.

Organisateurices

  • Maxime Amblard (Loria, Université de Lorraine)
  • Maria Boritchev (Telecom Paris Tech)
  • Bruno Guillaume (Inria)
  • Johannes Heinecke (Orange)
  • Frédéric Herledan (Orange)