L’équipe-projet MARIANNE mène des recherches à fort impact en Intelligence Artificielle, avec un accent particulier sur les données et modèles pour l’argumentation computationnelle en langage naturel. MARIANNE est une équipe-projet commune entre Inria, le laboratoire I3S (Informatique) de l’Université Côte d’Azur et le CNRS. L’équipe est composée d’informaticien·ne·s, tout en affichant une forte dimension interdisciplinaire, notamment avec la linguistique, la philosophie, la sociologie et le droit. MARIANNE développe des méthodes innovantes en traitement automatique du langage naturel (TAL), à la fois théoriquement fondées et explicables, appliquées à des problématiques concrètes. L’équipe travaille sur des thématiques telles que la fouille d’arguments, la génération d’arguments et de contre-arguments, l’évaluation de la qualité des arguments, l’explicabilité basée sur l’argumentation, la dynamique argumentative, ainsi que les modèles neuro-symboliques centrés sur l’argumentation. Les principaux cas d’application étudiés concernent les débats politiques (propagande), la santé, le droit et les réseaux sociaux en ligne (discours haineux, désinformation). L’équipe accorde également une attention particulière à l’innovation et au transfert. Son programme scientifique s’inscrit dans l’axe « Éléments fondamentaux de l’IA » du 3IA Côte d’Azur.
Domaine Inria : Perception, Cognition, Interaction
Thématique Inria : Langage, Parole et Audio
Institut CNRS : Sciences Informatiques
Département I3S : SPARKS (Scalable and Pervasive softwARe and Knowledge Systems)
Axes de recherche
L’équipe MARIANNE développe des méthodes et algorithmes en TAL pour l’argumentation en langage naturel, selon trois grands axes :
Axe A – Fouille d’arguments
Le premier axe vise à développer des modèles et algorithmes pour extraire des arguments en langage naturel à partir de textes. Jusqu’à présent, la communauté scientifique en Argument Mining (AM) s’est concentrée sur deux tâches principales : la détection des composantes argumentatives (preuves, revendications) et la prédiction des relations de support et d’attaque entre elles. Bien que fondamentaux, ces éléments produisent des structures argumentatives encore trop simples au regard des besoins spécifiques des cas d’usage ciblés par l’équipe. L’objectif est donc d’améliorer l’extraction de structures argumentatives compréhensibles par machine, permettant un raisonnement sur des arguments complexes issus du monde réel, avec un focus sur les langues anglaise, française, italienne, espagnole et allemande.
Axe B – Évaluation de la qualité des arguments
Le deuxième axe concerne la définition de méthodes computationnelles pour évaluer automatiquement la qualité d’arguments en langage naturel. Bien que quelques approches existent, ce domaine reste peu exploré. Il s’agit d’une part d’évaluer la qualité des arguments extraits, par exemple pour choisir les plus pertinents dans un débat, et d’autre part, de s’assurer que les arguments générés respectent des critères qualitatifs (ex. : un contre-argument face à une fausse information doit être concis et non redondant). La qualité peut également être caractérisée par des propriétés formelles du graphe argumentatif, telles que la force, les préférences ou l’acceptabilité des arguments.
Axe C – Génération d’arguments en langage naturel
Le troisième axe vise à développer de nouvelles méthodes (génératives ou non) pour la génération d’arguments en langage naturel, avec un premier focus sur le français et l’anglais. Ce processus, incrémental, commence par la génération de composantes argumentatives isolées et se prolonge jusqu’à la création d’arguments entiers dans le cadre de dialogues interactifs avec les utilisateur·rice·s. Ces dialogues sont adaptés à différents cas d’usage (explication, contre-argumentation). Les arguments générés reposent sur un schéma de raisonnement abductif, fondé sur un ensemble de questions critiques et de réponses raisonnées nécessaires à la compréhension par l’utilisateur.
Relations industrielles et internationales
Les membres de MARIANNE entretiennent de nombreuses collaborations, tant au niveau national qu’international. Ils et elles sont également fortement impliqué·e·s dans la communauté scientifique, occupant des rôles dans des sociétés savantes, agences ou comités éditoriaux.
Parmi les collaborations internationales, on peut citer celles avec Columbia University (États-Unis), FBK (Italie), Imperial College London (Royaume-Uni), Leibniz University Hannover (Allemagne), Università della Svizzera italiana (Suisse) et EURECOM sur l’évaluation de la qualité argumentative ; avec l’Université Nova de Lisbonne (Portugal) et l’Université du Pays basque (Espagne) sur les explications argumentatives ; avec les universités de Cordoba (Argentine), de Turin (Italie) et de Luxembourg sur l’argumentation juridique ; et avec l’Université de São Paulo (Brésil) et l’Universidad Nacional del Sur (Argentine) sur le raisonnement argumentatif en langage naturel. L’équipe (responsable : Victor David) a également obtenu la création d’une équipe associée, EXPLAINER (EXPLaining textual Argument Implicitness with Neuro-symbolic Extraction and Reasoning methods), avec University College London (Prof. Anthony Hunter), portant sur le traitement automatique des arguments implicites.
L’équipe collabore également avec des entreprises locales et nationales, notamment via des projets ANR. On peut citer : Buster.Ai (projet ANR ATTENTION coordonné par Serena Villata, contre-argumentation contre la désinformation), l’AFP (projet ANR ATTENTION), ScoolUp (détection de contenus violents sur les réseaux sociaux). Enfin, l’équipe collabore activement avec des institutions publiques telles que la CNIL (extraction d’informations dans les documents juridiques), le SGDSN (modélisation de sujets dans les dépêches AFP), l’École de l’Air et de l’Espace (projet ANR CIGAIA), ou encore la DGFip, où Serena Villata siège au comité scientifique.