14:00, Room N107 (Parc Club)
Abstract
Tout les jours, de vastes volumes de données sont traités, copiés, et transformés. Le développement et la vérification sémantique de telles transformations de données est, pour l’instant, souvent une tâche manuelle qui ne suit pas une systématique précise. De plus, une transformation de données doit souvent être modifiée au fil du temps en réponse à de nouvelles exigences. Ceci est par exemple le cas lors de l’intégration de données hétérogènes, distribuées, et autonomes sur le Web ou les sources peuvent changer et la transformation intégrante doit s’adapter. Là encore, le travail à effectuer (changer la transformation et tester que la nouvelle version fonctionne correctement et n’a pas d’effets imprévus) se fait souvent sans assistance informatique appropriée. Les étapes de vérification sémantique, de modification, et de tests s’enchaînent en général, ce qui nous amène à parler du cycle de vie d’une transformation.
Le but de la gestion du cycle de vie d’une transformation (transformation lifecycle management, TLM) est la systématisation et l’assistance semi-automatique des trois étapes de ce cycle. Après l’introduction de ces trois étapes ainsi que du système Nautilus implémentant nos méthodes de TLM (http://www.nautilus-system.org), la présentation se concentrera sur l’étape de la vérification sémantique, ou je présenterai l’algorithme Artemis, qui utilise la provenance de données manquantes pour aider lors de cette étape. La présentation se poursuivra par un aperçu d’un algorithme suggérant des modification de transformation et aboutira dans la discussion de futures directions de recherche.