PhD defense of Maxime Buron on Oct 7 at 2pm

Bonjour,

(English version below:)

J’ai le plaisir de vous inviter à ma soutenance de thèse intitulée :
“Raisonnements efficaces sur de larges graphes hétérogènes”.

Elle se déroulera le mercredi 7 octobre 2020 à l’Inria Saclay-Île-de-France,
dans l’amphithéâtre Gilles Kahn du batiment Turing,
1 rue Honoré d’Estienne d’Orves,
91120 Palaiseau.
Pour réserver une place, vous êtes prié(e) de m’informer par mail de
votre venue, puisque pour des raisons liées à la situation sanitaire, le
nombre de place est limité à 40. La soutenance sera aussi retransmise en
ligne, voir les détails sur cette page :
https://pages.saclay.inria.fr/maxime.buron/defense.html

L’exposé sera en anglais. Les membres du jury sont :
– Marie-Christine Rousset – professeur, université de Grenoble (rapporteuse)
– Maurizio Lenzerini – professeur, université de Rome (rapporteur)
– Alin Deutsch – professeur, université de Californie, San Diego (examinateur)
– Meghyn Bienvenu – chargé de recherche, CNRS (examinatrice)
– Ioana Manolescu – directeur de recherche, Inria et Institut Polytechnique de Paris, (directrice de thèse)
– Marie-Laure Mugnier – professeur, université de Montpellier (co-directrice de thèse)

François Goasdoué est co-directeur de thèse (professeur à l’université
de Rennes 1), il sera présent en tant qu’invité pour des raisons
administratives.

Résumé :

Dans cette thèse, nous étudions des méthodes d’interrogation
centralisées des bases de connaissance construites en utilisant
plusieurs sources de données hétérogènes. Ces travaux se placent dans le
cadre du Web sémantique, où les connaissances sont représentées sous
forme de graphe, ce qui permet de facilement intégrer l’hétérogénéité
des sources, et où l’interrogation des connaissances est valorisée par
la possibilité de raisonner sur ces dernières. Nous avons développé des
méthodes d’interrogation efficaces, qui visent à maximiser
l’expressivité offerte par les standards du Web sémantique.

La première partie est dédiée à des méthodes de réponse à des requêtes
sur une base de connaissances, représentée par un graphe RDF sous des
contraintes ontologiques RDFS. Ces contraintes induisent des
connaissances implicites suivant le raisonnement défini par un ensemble
de règles de déduction. Les connaissances explicites et implicites
doivent être prises en compte pour répondre correctement aux requêtes.
En premier lieu, nous présentons un algorithme de reformulation de
requêtes BGP (Basic Graph Pattern), qui exploite une partition des
règles de déduction. Puis, nous introduisons une nouvelle disposition du
stokage des graphes RDF, qui combine deux dispositions connues. Pour ces
deux contributions, des expériences évaluent nos résultats théoriques et
algorithmiques.

Dans la deuxième partie, nous considérons le problème d’interrogation
par des requêtes BGP, de sources de données hétérogènes intégrées en un
graphe RDF. Nous introduisons un cadre d’intégration de données sous des
contraintes ontologiques RDFS, utilisant une spécification d’intégration
dites Global-Local-As-View, rarement considérée dans la littérature et
qui permet de représenter des connaissances incomplètes. Nous présentons
plusieurs stratégies de réponses à des requêtes, qui, soit matérialisent
les données en un graphe RDF, soit le laissent virtuel et diffèrent sur
quand et comment le raisonnement est supporté. Nous avons implémenté ces
stratégies dans une plate-forme pour mener des expériences, qui
démontrent l’intérêt particulier d’une des stratégies basée sur la
saturation de la spécification d’intégration. Finalement, nous montrons
que cette dernière saturation peut être étendue pour le raisonnement
défini par un sous-ensemble des règles existentielles plus expressif que
celui défini pour les contraintes RDFS.

Cordialement,

Maxime Buron

— English —

Dear all,

I am very pleased to invite you to the defence of my PhD thesis entitled:
“Efficient Reasoning on Large and Heterogeneous Graphs”,
which will be held on Wenesday, October 7th 2020 at 14:00, in the
amphitheatre Gilles Kahn, on the ground floor of the Alan Turing
Building; and also available in videoconference, see details at
:https://pages.saclay.inria.fr/maxime.buron/defense.html

The committee consists of:
– Marie-Christine Rousset – professor, University of Grenoble (reporter)
– Maurizio Lenzerini – professor, University of Rome (reporter)
– Alin Deutsch – professor, University of California San Diego (examiner)
– Meghyn Bienvenu – CNRS researcher (examiner)
– Ioana Manolescu – senior researcher, Inria and Institut Polytechnique de Paris  (supervisor)
– Marie-Laure Mugnier – professor, University of Montpellier (co-supervisor)

François Goasdoué is co-supervisor (professor at University of Rennes 1), he is invited as a guest for administrative reasons.

Abstract:

In this thesis, we study centralized query answering methods of
knowledge bases built using several heterogeneous data sources. These
works follow the paradigm of Semantic Web, where the knowledge is
represented by graphs. It allows to easily integrate the heterogeneity
of the sources. Moreover, interrogating the knowledge is empowered by
the ability to reason on it. We introduce efficient query answering
methods, which aim for maximizing the expressivity offered by the
standards of the Semantic Web.

The first part is devoted to query answering techniques on a knowledge
base, represented by an RDF graph subject to RDFS ontological
constraints. These constraints induce implicite knowledge following the
reasoning defined by a set of entailment rules. Explicit and implicit
knowledge has to be taken into account to correctly answer a query.
First, we present a sound and complete query reformulation algorithm for
Basic Graph Pattern queries, which exploits a partition of RDFS
entailment rules. Second, we introduce a novel RDF storage layout, which
combines two well-known layouts. For both contributions, our experiments
assess our theoretical and algorithmic results.

The second part considers the issue of querying heterogeneous data
sources integrated into an RDF graph, using BGP queries. Following the
Ontology-Based Data Access paradigm, we introduce a framework of data
integration under an RDFS ontology, using the Global-Local-As-View
mappings, rarely considered in the literature, and which allow to
represent incomplete knowledge bases. We present several query answering
strategies, which may materialize the integrated RDF graph or leave it
virtual, and differ on how and when reasoning is handled. We implement
these strategies in a platform, in order to conduct experiments, which
demonstrate the particular interest of one of the strategies based on
mapping saturation. Finally, we show that mapping saturation can be
extended to reasoning defined by a subset of existential rules.

Best,

Maxime

Comments are closed.