Contact
QUINIOU René, Rene.Quiniou@inria.fr
Mots-clés
fouille de données, Extraction de motifs séquentiels, self-scanning
Description
La fouille de données concerne l’analyse de grandes masses de données dans le but de découvrir des connaissances intéressantes [1, 2, 3]. L’un des premiers succès de la fouille fut l’analyse de paniers de supermarché avec comme résultat principal la caractérisation de comportement de clients par des règles d’association, par exemple lorsqu’un client achète de la liqueur de cassis, il achète souvent du cidre en même temps. Ces résultats sont ensuite utilisés par les services marketing, pour la délivrance ciblée de coupons ou l’agencement de magasins, par exemple.
Avec l’arrivée des scannettes, il est devenu .possible d’avoir une « radiographie » très précise du comportement du client dans le magasin. Chaque scan enregistre un produit et l’heure du dépôt de ce produit dans le panier. Il est ainsi possible de reconstituer le parcours du client dans le magasin, le temps qu’il a passé en rayon et hors rayon, les articles qu’il a pris puis remis… L’étude du parcours en particulier permet de savoir si le client est allé directement aux produits qui l’intéressent ou s’il s’est « perdu » dans le magasin en effectuant ses achats. Ce dernier cas étant bien sûr plus intéressant d’un point de vue commercial : un client qui parcourt plus de distance voit plus de rayons et peut donc être plus facilement tenté ! Les données temporelles et spatiales des scannettes sont donc inestimables pour comprendre au mieux les clients et optimiser l’organisation d’un supermarché.
Le stage est basé sur la mise à disposition par une enseigne de la grande distribution d’un corpus de données de scannettes, des données qui sont très rarement accessibles aux académiques. Le but du stage sera de proposer de nouveaux algorithmes de fouille de motifs séquentiels spatio-temporels adaptés à ces données. Le but applicatif de ces motifs sera de mieux comprendre le comportement des clients grâce à ces motifs, et de fournir des éléments pour optimiser l’organisation du magasin.
Ce stage sera effectué dans le cadre d’un nouveau partenariat entre l’équipe DREAM et une enseigne de la grande distribution. Depuis plusieurs années, l’équipe DREAM s’intéresse à la fouille de motifs séquentiels et temporels [2] et les méthodes déjà développées pourront servir de point de départ à ce projet. Le partenaire industriel fournira un corpus significatif de données réelles à analyser et aidera à l’interprétation des résultats.
Le candidat devra avoir un solide bagage algorithmique et une bonne maîtrise de la programmation en Java, C++ et/ou Python. Un intérêt pour les techniques de visualisation des résultats obtenus (par exemple avec D3.js) sera également apprécié.