Thesis defence (in French) – Molka Tounsi Dhouib – 26 Mars 2021
Knowledge engineering in the sourcing domain for the recommendation of providers / Ingénierie de la connaissance dans le domaine du sourcing pour la recommandation de prestataires
Jury:
- Fabien Gandon, Directeur de Recherche, INRIA (Président de Jury)
- Nathalie Pernelle, Professeure, Université Sorbonne Paris Nord (Rapporteur)
- Marie-Christine Rousset, Professeure, Université de Grenoble Alpes (Rapporteur)
- Sylvie Despres, Professeure, Université Sorbonne Paris Nord (Examinateur)
- Petko Valtchev, Professeur Adjoint, Université de Montréal (Examinateur)
- Nicolas Bridey, Co-fondateur, Silex (Invité)
- Catherine Faron Zucker, Maître de conférences, Université Côte d’Azur (Directrice de Thèse)
- Andrea Tettamanzi, Professeur, Université Côte d’Azur (Directeur de Thèse)
Abstract : This CIFRE doctoral thesis is part of a collaborative research project between the I3S laboratory of the University of Côte d’Azur and the Silex company, and addresses the field of recommendation systems.
Silex is a start-up that develops a Software-as-a-Service sourcing tool that allows companies to provide a description of their professional activities, their offers and/or the services they are looking for in natural language (currently French). In this context, the objective of this thesis is to propose a decision support system by exploiting the semantic knowledge that are extracted from the textual descriptions of requests for services and providers, in order to recommend relevant providers for a service request. The contributions of this thesis are
the following. First, we proposed a vocabulary for the sourcing field by reusing and integrating existing vocabularies, in order to semantically annotate the textual descriptions of providers and requests for services. Second, we proposed an automatic alignment method to establish the correspondence between different concepts of the considered vocabularies. This approach is based on rules exploiting embedding space and measurements on groups of labels to discover the relationships between concepts. Third, we proposed an algorithm for extracting named entities from the textual descriptions of service requests and providers, and an algorithm for semantic annotation of these descriptions, based on the linking of the extracted entities with the concepts of the defined vocabulary. Fourth, we proposed a provider recommendation algorithm that exploits these knowledges extracted. Finally, we studied the contribution of using ontological knowledge to improve our decision support system for the sourcing domain in order to recommend relevant providers for a service request.
Résumé: Cette thèse de doctorat CIFRE s’inscrit dans le cadre d’un projet de recherche collaboratif entre le laboratoire I3S de l’Université Côte d’Azur et la société Silex et aborde le domaine des systèmes de recommandation. Silex est une start-up qui développe un outil de sourcing Software-as-a-Service permettant aux entreprises de fournir une description de leurs activités professionnelles, de leurs offres et/ou des services qu’elles recherchent en langue naturelle (actuellement le français). Dans ce contexte, l’objectif de cette thèse est de proposer un système d’aide à la décision en exploitant les connaissances sémantiques extraites à partir des descriptions textuelles des demandes de prestation et des prestataires, afin de recommander des prestataires pertinents pour une demande de prestation. Les contributions de cette thèse sont les suivantes. Premièrement, nous avons proposé un vocabulaire pour le domaine du sourcing afin d’annoter sémantiquement les descriptions textuelles des prestataires et des demandes de prestation. Ce vocabulaire a été construit en réutilisant et en intégrant des vocabulaires existants. Deuxièmement, nous avons proposé une méthode d’alignement automatique afin d’établir la correspondance entre différents concepts des vocabulaires considérés. Cette approche se base sur des règles exploitant l’espace des plongements lexicaux et des mesures sur des groupes d’étiquettes pour découvrir les relations entre concepts. Troisièmement, nous avons proposé un algorithme d’extraction des entités nommées à partir des descriptions textuelles des demandes de prestation et des prestataires et un algorithme d’annotation sémantique de ces descriptions, basé sur le liage des entités extraites avec les concepts du vocabulaire défini. Quatrièmement, nous avons proposé un algorithme de recommandation de prestataires qui exploite ces annotations sémantiques. Finalement, nous avons étudié l’apport de l’utilisation de connaissances ontologiques afin d’améliorer notre système d’aide à décision pour le domaine du sourcing.