Soutenance de thèse de Laurent Pellegrino // PhD defence

Jeudi 3 Avril à 13h30 salle Euler Violet de l’INRIA Sophia Antipolis.

Titre : Un intergiciel gérant des événements pour permettre l’émergence
d’interactions dynamiques et ubiquitaires dans l’Internet des services.

Le jury est composé de :
Ioana MANOLESCU, Inria Saclay – Île-de-France (rapporteur)
Etienne RIVIÈRE, Université de Neuchâtel (rapporteur)
Johan MONTAGNAT, CNRS (examinateur)
Ester PACITTI, Université de Montpellier 2 (examinateur)
Vivien QUÉMA, Grenoble INP (examinateur)
Françoise BAUDE, Université de Nice-Sophia Antipolis (directeur)
Fabrice HUET, Université de Nice-Sophia Antipolis (co-encadrant)

Résumé :
Resource Description Framework (RDF) est devenu un modèle de données pertinent
afin de décrire et de modéliser les informations qui sont partagées sur le Web.
Cependant, fournir une solution permettant de stocker et de récupérer ces
données de manière efficace tout en passant à l’échelle reste un défi majeur.
Dans le contexte de cette thèse nous proposons un intergiciel dévoué au
stockage, à la récupération synchrone mais aussi à la dissémination sélective
et asynchrone en quasi temps réel des informations de type RDF dans un
environnement complètement distribué. L’objectif est de pouvoir tirer parti des
informations du passé comme de celles filtrées en quasi temps réel. Dans ce
but, nous avons construit notre système sur une version légèrement modifiée du
réseau Pair-à-Pair CAN à 4-dimensions afin de refléter la structure d’un
n-uplet RDF. Contrairement à une grande majorité de solutions existantes, nous
avons avons fait le choix d’éviter le hachage pour indexer les données ce qui
nous permet de traiter les requêtes à intervalles de manière efficace mais
aussi de soulever des défis techniques intéressants. Le filtrage des
informations en quasi temps réel est permis par l’expression des intérêts à
l’aide de souscriptions basées sur le contenu des évènements futurs. Les
souscriptions sont traitées par une couche publier/souscrire conçue sur
l’architecture CAN. Nous avons proposé deux algorithmes qui permettent de
vérifier la concordance des évènements RDF avec les souscriptions enregistrées
et de les transférer vers les entités intéressées lorsque la correspondance se
vérifie. Les deux algorithmes ont été testés expérimentalement en termes de
débit d’évènements par seconde et de passage à l’échelle. Bien que l’un permet
de meilleures performances que l’autre, ils restent complémentaires pour
s’assurer que tout évènement soit notifié s’il doit l’être. En sus de la
récupération synchrone et de la diffusion asynchrone d’évènements, nous nous
sommes intéressés à améliorer, avec notre système, la répartition des données
RDF qui souffrent de dissymétrie. Finalement, nous avons consacré un effort non
négligeable à rendre notre intergiciel modulaire. Cela a permis d’améliorer sa
maintenance et sa réutilisabilité puisque l’architecture modulaire réduit le
couplage entre les différents composants qui le constitue.

=================================================================

Title: Pushing dynamic and ubiquitous event-based interaction in the Internet
of services: a middleware for event clouds.

The jury is composed of the following people:
Ioana MANOLESCU, Inria Saclay – Île-de-France (reviewer)
Etienne RIVIERE, Université de Neuchâtel (reviewer)
Johan MONTAGNAT, CNRS (examiner)
Ester PACITTI, Université de Montpellier 2 (examiner)
Vivien QUÉMA, Grenoble INP (examiner)
Françoise BAUDE, Université de Nice-Sophia Antipolis (advisor)
Fabrice HUET, Université de Nice-Sophia Antipolis (co-advisor)

Abstract:
RDF has become a relevant data model for describing and modeling information on
the Web but providing scalable solutions to store and retrieve RDF data in a
responsive manner is still challenging. Within the context of this thesis we
propose a middleware devoted to storing, retrieving synchronously but also
disseminating selectively and asynchronously RDF data in a fully distributed
environment. Its purposes is to allow to leverage historical information and
filter data near real-time. To this aims we have built our system atop a
slightly modified version of a 4-dimensional Content Addressable Network (CAN)
overlay network reflecting the structure of an RDF tuple. Unlike many existing
solutions we made the choice to avoid hashing for indexing data, thus allowing
efficient range queries resolution and raising interesting technical
challenges. Near realtime filtering is enabled by expressing information
preferences in advance through content-based subscriptions handled by a
publish/subscribe layer designed atop the CAN architecture. We have proposed
two algorithms to check RDF data or events satisfaction with subscriptions but
also to forward solutions to interested parties. Both algorithms have been
experimentally tested for throughput and scalability. Although one performs
better than the other, they remain complementary to ensure correctness. Along
with information retrieval and dissemination, we have proposed a solution to
enhance RDF data distribution on our revised CAN network since RDF information
suffers from skewness. Finally, to improve maintainability and reusability some
efforts were also dedicated to provide a modular middleware reducing the
coupling between its underlying software artifacts.

Leave a Reply