Release of the new book:
Data-Intensive Workflow Management: For Clouds and Data-Intensive and Scalable Computing Environments.
Synthesis Lectures on Data Management
May 2019, 179 pages, Morgan&Claypool Publishers.
Permanent link to this article: https://team.inria.fr/zenith/new-book-on-data-intensive-workflow-management-may-2019/
Permanent link to this article: https://team.inria.fr/zenith/seminar-by-patrick-valduriez-at-inria-lille-the-case-for-hybrid-transaction-analytical-processing-17-may-2019/
Permanent link to this article: https://team.inria.fr/zenith/zenith-seminar-herve-bredin-neural-speaker-diarization-13-may-2019/
Permanent link to this article: https://team.inria.fr/zenith/zenith-seminar-dennis-shasha-nyu-bounce-blockchain-a-secure-energy-efficient-permission-less-blockchain-27-may-2019/
Permanent link to this article: https://team.inria.fr/zenith/seminar-by-patrick-valduriez-at-ibm-research-rio-de-janeiro-brazil-the-case-for-hybrid-transaction-analytical-processing-25-april-2019/
Mar 12
Postdoc Database Engineer: query optimization
LeanXcale, Madrid, Spain
LeanXcale is a NewSQL company developing a scalable Hybrid Transactional Analytics Processing (HTAP) DBMS for both OLTP and OLAP workloads.
You will work with the R&D team in one or more of the different subsystems of LeanXcale database (storage engine, transactional engine, SQL query engine). Depending on the candidate background, the focus of the work will be one or more of the following:
Skills and profile:
Environment, salary, duration: The postdoc will be supervised by LeanXcale and Inria, while being located in the LeanXcale facilities in Madrid, Spain.
Net salary: up to 3300 Euros net/month depending on your experience.
Duration: 1 Year
Starting date: flexible but ideally as soon as possible
Contact:rjimenez@leanxcale.comor Patrick.valduriez@inria.fr
Permanent link to this article: https://team.inria.fr/zenith/postdoc-database-engineer-2019/
Permanent link to this article: https://team.inria.fr/zenith/zenith-seminar-youcef-djenouri-urban-traffic-outlier-detection-14-feb-2019/
Jan 24
Thèse CIFRE Ina et Inria : “Apprentissage profond (Deep Learning) à large échelle pour la création de bases de connaissances et la valorisation d’archives”
Sujet
L’accroissement du nombre de programmes audiovisuels à archiver impose de nouvelles contraintes de productivité sur la documentation. Le développement d’outils automatiques et semi-automatiques pour assister le travail des documentalistes est désormais indispensable pour exploiter au mieux la très grande quantité d’informations disponibles. Ces dernières années, sont ainsi apparues des techniques d’indexation et d’analyse de contenu visuel ou sonore, permettant la modélisation d’information de haut niveau, comme par exemple : des visages, des locuteurs, des monuments, des logos, des décors, des noms de chansons, etc. La modélisation consiste à construire des représentations visuelles des entités avec lesquelles on désire annoter des archives multimédias. Les processus de modélisation sont basés sur des méthodes d’apprentissage non-supervisées, supervisées, ou parfois pauvrement supervisées.
Avec l’essor des réseaux de neurones convolutionnels durant ces dernières années, les représentations visuelles ad-hoc (“hand-crafted”) sont progressivement remplacées par des représentations à base de Deep Learning apprises à partir de données d’apprentissage dédiées à la tâche d’annotation visée. Ces stratégies d’apprentissage supervisées allant du signal (pixels) jusqu’aux classes ou entités dans un même formalisme ont permis d’atteindre des performances très importantes pour la reconnaissance d’objets dans les images.
Ces méthodes ont toutefois deux limitations majeures pour envisager une exploitation dans le contexte de la documentation professionnelle à large échelle. Premièrement, elles fonctionnent en monde fermé c’est à-dire avec un nombre fixe de classes préalablement connues. Dans le cadre de l’Ina, il est essentiel de fonctionner en monde ouvert car à chaque instant :
Deuxièmement, à jour ces méthodes ne permettent être envisagées efficacement dans des processus d’apprentissage actif et incrémentaux du type bouclage de pertinence ou propagation d’annotation. Hors ces modes de fonctionnement dynamiques et interactifs sont indispensables à une mise en oeuvre métier. Il y au sein de l’Ina des dizaines de documentalistes qui ont pour mission d’annoter les documents vidéo. Il est essentiel que ces documentalistes puissent interagir avec le système de reconnaissance et que celui-ci soit suffisamment réactif.
Plus formellement, le coeur de la thèse sera de s’attaquer aux problèmes d’apprentissage actif multi-label et de détection de la nouveauté dans le contexte de l’apprentissage profond de représentations visuelles. Cela nécessitera de résoudre des verrous liés au passage à l’échelle des méthodes à base de modèles profonds.
Encadrement et contexte
L’encadrement de la thèse sera assuré par Alexis Joly (HDR, Inria, https://scholar.google.fr/citations?user=kbpkTGgAAAAJ&hl=fr&oi=ao) et Olivier Buisson (Dr, Ina, https://scholar.google.fr/citations?user=rWunhTEAAAAJ&hl=fr). Elle s’inscrit dans la continuité de plus de 10 ans de collaboration. Deux thèses CIFRE ont notamment déjà été soutenues en 2013 et 2016 sous leur co-supervision. Par ailleurs, une plateforme de R&D nommée Snoop a été co-développée. Celle-ci est en cours d’expérimentation au sein de l’Ina mais aussi utilisée pour l’application de reconnaissance des plantes PlantNet (http://identify.plantnet-project.org).
Les acteurs institutionnels de cette thèse, l’équipe Zénith de l’Inria et l’Ina ont une expérience solide dans l’analyse de données multimédia et le passage à l’échelle et apporteront des compétences complémentaires sur le sujet. Les travaux de Zenith s’articulent autour de la gestion, l’analyse et de la recherche d’informations dans des données hétérogènes de très grandes tailles. Au sein de l’Ina, le doctorant rejoindra le département de la Recherche et d’Innovation qui s’intéresse à tous les sujets de recherche en lien avec l’archivage audiovisuel.
Candidature
Envoyez par email et en PDF à l’adresse thcand@ina.fr, les documents suivants :
Informations sur le poste
Début : courant 2019, dès l’acceptation du dossier Cifre par l’ANRT.
Salaire : 36 000€ bruts sur 13 mois.
Lieu : Ina (Institut national de l’audiovisuel) à Bry-sur-Marne.
Permanent link to this article: https://team.inria.fr/zenith/these-cifre-ina-et-inria-apprentissage-profond-deep-learning-a-large-echelle-pour-la-creation-de-bases-de-connaissances-et-la-valorisation-darchives/
Permanent link to this article: https://team.inria.fr/zenith/zenith-seminar-renan-souza-15-jan-2019/
Nov 26
Amadeus ( https://amadeus.com/en ) and the Zenith team of Inria ( https://team.inria.fr/zenith/ ) are seeking a postdoctoral fellow in A/B testing, clustering and time series analytics.
Title: A/B testing guided clustering
Description:
The post-doc position takes place in a new partnership between Amadeus and Inria. It is linked to Amadeus’ developments in implementation of intelligent and evolving flight recommendation search means for online travel agencies (OTAs). The general principle is to choose recommendations by optimizing several criteria simultaneously (price, duration of the trip, number of stops, etc.). Each flight recommendation is associated with a score defined as a linear combination of criteria and weight. Weights therefore define how important each criterion is. To be able to adapt the importance of the criteria according to the profile of the user, user queries are segmented by means of unsupervised classification (or clustering). Weight values are optimized independently on each segment by maximizing the estimated reservation probability of returned flight recommendations. Thus, a set of weights is associated with each of the user profiles, called segments. During the weight creation process, large volumes of data are used, especially during the segmentation phase. The ability of the flight recommendation search system to increase the conversion rate is evaluated using A / B test campaigns.
The expected work in this postdoc position is comprised of two complementary topics:
1. optimizing the planning of A / B test campaigns,
2. developing incremental methods of adaptation of flight search segmentation from the results of A / B tests.
The objective of the first point is to improve the use of A / B tests in order to draw conclusions as quickly and as safely as possible, as well as to be able to know at each stage the uncertainty about the results of the A / B test.
The second topic is directly related to the first, since it is a question of using the results of A / B test obtained on each segment to improve the segmentation. The initial idea is to develop an incremental clustering algorithm in which phases of search segmentation and A / B test follow one another.
About Amadeus
Amadeus builds the critical solutions that help airlines and airports, hotels and railways, search engines, travel agencies, tour operators and other travel players to run their operations and improve the travel experience, billions of times a year, all over the world.
About Zenith
The Zenith project-team, headed by Patrick Valduriez, aims to propose new solutions related to scientific data and activities. Our research topics incorporate the management and analysis of massive and complex data, such as uncertain data, in highly distributed environments.
Skills and profile:
– Background in data mining / data analytics
– A Ph.D. in computer science or mathematics
Environment, salary, duration:
The postdoc will be supervised by Amadeus and Inria, while being located in the Amadeus facilities of Sophia Antipolis.
Net salary: up to 3300 Euros net/month depending on your experience.
Duration: 1 Year
Starting date: flexible but ideally as soon as possible.
Contact:
Nicolas Maillot ( nicolas.maillot@amadeus.com )
Florent Masseglia ( florent.masseglia@inria.fr )
Permanent link to this article: https://team.inria.fr/zenith/post-doc-position-a-b-testing-guided-clustering/