Corpus DinG

DinG — Dialogues in Games est un corpus de transcriptions manuelles de multilogues oraux spontanés entre joueurs francophones de Catane (Copyright ©2017 CATAN Studio, Inc. et CATAN GmbH, tous droits réservés). Catane est un jeu de plateau pour trois à quatre joueurs dans lequel l’objectif principal de chaque participant est de faire prospérer et croître sa colonie, en utilisant des ressources, qui sont rares. La négociation de ces ressources est une partie importante du jeu et constitue le cœur des données de DinG. Ce corpus a été conçu en partie pour servir de démonstration au corpus SLAM.

Les dialogues de DinG sont non-contraints, car les joueurs n’ont pas à suivre de règle ou de ligne directrice spécifique, mis à part jouer au jeu. Comme la négociation des ressources fait partie du jeu, les joueurs doivent parler pour jouer, et les dialogues sont donc ceux qui se produisent naturellement dans ce cadre particulier. Comme les joueurs doivent parler pour jouer, ils ne discutent pas de sujets personnels en dehors du cadre du jeu, ce qui permet d’anonymiser complètement le corpus en supprimant les noms des joueurs (dé-identification).

Le corpus est disponible sur Gitlab : https://gitlab.inria.fr/semagramme-public-projects/resources/ding/. Il est distribué sous la licence Attribution ShareAlike Creative Commons (CC BY-SA 4.0).

Publications :

A Multi-Party Dialogue Ressource in French, Maria Boritchev, Maxime Amblard, to appear in The Thirteenth International Conference on Language Resources and Evaluation (LREC 2022), Juin 2022, Marseille, France.

DinG — a corpus of transcriptions of real-life, oral, spontaneous multi-party dialogues between French-speaking players of Catan, Maria Boritchev, Maxime Amblard, Journées LIFT 2021 – Linguistique informatique, formelle et de terrain, GDR LIFT, Déc 2021, Grenoble, France. Lien PDF HAL. Lien BIBtex HAL.

Les commentaires sont clos.