Apr 16

Soutenance de thèse : Mehdi Ahmed Nacer

« Méthodologie d’évaluation pour les types de données répliqués ». La soutenance aura lieu le Mardi 5 mai 2015 à 14h00 dans la salle C005 du LORIA.

Composition du jury:
Rapporteurs :

–  Achour Mostefaoui, Professeur, Université de Nantes
–  Benoit Baudry, Chargé de Recherche, Inria, IRISA
Examinateurs :
– Marc Shapiro Directeur de Recherche, Inria, LIP6
– Yannick Toussaint, Chargé de Recherche, Inria, LORIA
Directeurs de Thèse:
– François Charoy, Professeur, Université de Lorraine
– Pascal Urso, Maître de Conférences, Université de Lorraine
Résumé:

Pour fournir une disponibilité permanente des données et réduire la latence réseau, les systèmes de partage de données se basent sur la réplication optimiste. Dans ce paradigme, il existe plusieurs copies de l’objet partagé dite répliques stockées sur des sites. Ces répliques peuvent être modifiées librement et à tout moment. Les modifications sont exécutées en local puis propagées aux autres sites pour y être appliquées. Les algorithmes de réplication optimiste sont chargés de gérer les modifications parallèles. L’objectif de cette thèse est de proposer une méthodologie d’évaluation pour les algorithmes de réplication optimiste. Le contexte de notre étude est l’édition collaborative. Nous allons concevoir pour cela un outil d’évaluation qui intègre un mécanisme de génération de corpus et un simulateur d’édition collaborative. À travers cet outil, nous allons dérouler plusieurs expériences sur deux types de corpus: synchrone et asynchrone. Dans le cas d’une édition collaborative synchrone, nous évaluerons les performances des différents algorithmes de réplication sur différents critères tels que le temps  d’exécution, l’occupation mémoire, la taille des messages, etc. Nous proposerons ensuite quelques améliorations. En plus, dans le cas d’une édition collaborative asynchrone, lorsque deux répliques se synchronisent, les conflits sont plus nombreux à apparaître. Le système peut bloquer la fusion des modifications jusqu’à ce que l’utilisateur résolut les conflits. Pour réduire le nombre de ces conflits et l’effort des utilisateurs,  nous proposerons une métrique d’évaluation et nous évaluerons les différents  algorithmes sur cette métrique. Nous analyserons le résultat pour comprendre le comportement des utilisateurs et nous proposerons ensuite des algorithmes pour résoudre les conflits les plus important et réduire ainsi l’effort des développeurs. Enfin, nous proposerons une nouvelle architecture hybride basée  sur deux types d’algorithmes de réplication. Contrairement aux architectures  actuelles, l’architecture proposée est simple, limite les ressources sur les dispositifs clients et ne nécessite pas de consensus entre les centres de données.

Title: Evaluation methodology for replicated data types
Abstract: To provide a high availability from any where, at any time, with low latency, data is  optimistically replicated. This model allows any replica to apply updates locally, while the operations are later sent to all the others. In this way, all replicas eventually apply all updates, possibly even in different order. Optimistic replication algorithms are responsible for managing the  concurrent modifications and ensure the consistency of the shared object. In this thesis, we present an evaluation methodology for optimistic replication algorithms. The context of our study is collaborative editing. We designed a tool that implements our methodology. This tool integrates a mechanism to generate a corpus and a simulator to simulate sessions of collaborative editing. Through this tool, we made several experiments on two different corpus: synchronous and asynchronous. In synchronous collaboration, we evaluate the performance of optimistic replication algorithms following several criteria such as execution time, memory occupation, message’s size, etc. After analysis, some improvements were proposed. In addition, in asynchronous collaboration, when replicas synchronize their modifications, more conflicts can appear in the document. In this case, the system cannot merge the modifications until a user resolves them. In order to reduce the conflicts and the user’s effort, we propose an evaluation metric and we evaluate the different algorithms on this metric. Afterward, we analyze the quality of the merge to understand the behavior of the users and the collaboration cases that create conflicts. Then, we propose algorithms for resolving the most important conflicts, therefore reducing the user’s effort. Finally, we propose a new architecture for supporting cloud-based collaborative editing system. This architecture is based on two optimistic replication algorithms. Unlike current architectures, the proposed one removes the problems of the centralization and consensus between data centers, is simple and accessible for any developers.

Keywords: Optimistic replication, Replicated data types, Evaluation methodology.