Les grands volumes de données du Web Sémantique et en particulier les données ouvertes (Open Data) créent un besoin d’outils analytiques à même de fournir une image précise et informative de ces données afin
d’identifier leurs usages.
Ce problème est difficile car de telles données sont très hétérogènes, souvent créées en isolation par des organisations ou individus différents; de plus, elles sont caractérisées par une sémantique spécifiée à l’aide d’un langage de représentation de connaissances tels que RDF/S ou OWL, qui doit être pris en compte aussi pour
l’analyse.
Le sujet du stage consiste à concevoir des modèles et des algorithmes afin de développer des outils d’analyse conceptuelle de données dans un environnement distribué, permettant des traitements massivement
parallèles. L’intérêt de la distribution est de permettre le passage à l’échelle pour de grands volumes de données.
Contact: Ioana.Manolescu@inria.fr