Publications

 

Publications HAL du labo/EPI SequeL

2022

Conference papers

titre
On the role of population heterogeneity in emergent communication
auteur
Mathieu Rita, Florian Strub, Jean-Bastien Grill, Olivier Pietquin, Emmanuel Dupoux
article
ICLP 2022 – Tenth International Conference on Learning Representations, Apr 2022, Los Angeles, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03830500/file/2204.12982.pdf BibTex

2020

Journal articles

titre
Temperature Decreases Spread Parameters of the New Covid-19 Case Dynamics
auteur
Jacques Demongeot, Yannis Flet-Berliac, Hervé Seligmann
article
Biology, 2020, 9 (5), pp.94. ⟨10.3390/biology9050094⟩
Accès au bibtex
BibTex
titre
Machine learning applications in drug development
auteur
Clémence Réda, Emilie Kaufmann, Andrée Delahaye-Duriez
article
Computational and Structural Biotechnology Journal, 2020, 18, pp.241-252. ⟨10.1016/j.csbj.2019.12.006⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02533303/file/RKD20_CSBJ.pdf BibTex

Conference papers

titre
Robust-Adaptive Interval Predictive Control for Linear Uncertain Systems
auteur
Edouard Leurent, Denis Efimov, Odalric-Ambrym Maillard
article
CDC 2020 – 59th IEEE Conference on Decision and Control, Dec 2020, Jeju Island / Virtual, South Korea
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02942414/file/CDC20_Edouard.pdf BibTex
titre
Robust-Adaptive Control of Linear Systems: beyond Quadratic Costs
auteur
Edouard Leurent, Denis Efimov, Odalric-Ambrym Maillard
article
NeurIPS 2020 – 34th Conference on Neural Information Processing Systems, Dec 2020, Vancouver / Virtual, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03004060/file/main.pdf BibTex
titre
Monte-Carlo Graph Search: the Value of Merging Similar States
auteur
Edouard Leurent, Odalric-Ambrym Maillard
article
ACML 2020 – 12th Asian Conference on Machine Learning, Nov 2020, Bangkok / Virtual, Thailand. pp.577 – 602
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03004124/file/main.pdf BibTex
titre
A Machine of Few Words Interactive Speaker Recognition with Reinforcement Learning
auteur
Mathieu Seurin, Florian Strub, Philippe Preux, Olivier Pietquin
article
Conference of the International Speech Communication Association (INTERSPEECH), Oct 2020, Shanghai, China. ⟨10.21437/Interspeech.2020-2892⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03123999/file/Interspeech_2020.pdf BibTex
titre
A Practical Algorithm for Multiplayer Bandits when Arm Means Vary Among Players
auteur
Etienne Boursier, Emilie Kaufmann, Abbas Mehrabian, Vianney Perchet
article
AISTATS 2020 – 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo, Italy
Accès au texte intégral et bibtex
https://hal.science/hal-02006069/file/aistats20.pdf BibTex
titre
Gamification of pure exploration for linear bandits
auteur
Rémy Degenne, Pierre Ménard, Xuedong Shang, Michal Valko
article
ICML 2020 – International Conference on Machine Learning, Aug 2020, Vienna / Virtual, Austria
Accès au texte intégral et bibtex
https://hal.science/hal-02884330/file/supp.pdf BibTex
titre
I’m sorry Dave, I’m afraid I can’t do that” Deep Q-Learning From Forbidden Actions
auteur
Mathieu Seurin, Philippe Preux, Olivier Pietquin
article
Internationnal Joint Conference on Neural Networks, Jul 2020, Glasgow, United Kingdom
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02387419/file/Dave_IJCNN.pdf BibTex
titre
Only Relevant Information Matters: Filtering Out Noisy Samples to Boost RL
auteur
Yannis Flet-Berliac, Philippe Preux
article
IJCAI 2020 – International Joint Conference on Artificial Intelligence, Jul 2020, Yokohama, Japan. ⟨10.24963/ijcai.2020/376⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02091547/file/sauna_ijcai_camera_ready.pdf BibTex
titre
The Influence of Shape Constraints on the Thresholding Bandit Problem
auteur
James Cheshire, Pierre Ménard, Alexandra Carpentier
article
COLT 2020 – Thirty Third Conference on Learning Theory, Jul 2020, Graz / Virtual, Austria. pp.1228-1275
Accès au texte intégral et bibtex
https://hal.science/hal-03001947/file/COLT2020.pdf BibTex
titre
Tightening Exploration in Upper Confidence Reinforcement Learning
auteur
Hippolyte Bourel, Odalric-Ambrym Maillard, Mohammad Sadegh Talebi
article
International Conference on Machine Learning, Jul 2020, Vienna, Austria
Accès au texte intégral et bibtex
https://hal.science/hal-03000664/file/ICML2020_UCRL3_FinalVersion.pdf BibTex
titre
Solving Bernoulli Rank-One Bandits with Unimodal Thompson Sampling
auteur
Cindy Trinh, Emilie Kaufmann, Claire Vernade, Richard Combes
article
ALT 2020 – 31st International Conference on Algorithmic Learning Theory, Feb 2020, San Diego, United States. pp.1 – 28
Accès au texte intégral et bibtex
https://hal.science/hal-02396943/file/Trinh20.pdf BibTex
titre
Covariance-adapting algorithm for semi-bandits with application to sparse outcomes
auteur
Pierre Perrault, Vianney Perchet, Michal Valko
article
Conference on Learning Theory, 2020, Graz, Austria
Accès au texte intégral et bibtex
https://hal.science/hal-02876102/file/colt.pdf BibTex
titre
Fixed-confidence guarantees for Bayesian best-arm identification
auteur
Xuedong Shang, Rianne de Heide, Emilie Kaufmann, Pierre Ménard, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, 2020, Palermo, Italy
Accès au texte intégral et bibtex
https://hal.science/hal-02330187/file/main.pdf BibTex
titre
Budgeted online influence maximization
auteur
Pierre Perrault, Jennifer Healey, Zheng Wen, Michal Valko
article
International Conference on Machine Learning, 2020, Vienna, Austria
Accès au texte intégral et bibtex
https://hal.science/hal-02904278/file/icml2020_boim__Version_2293_.pdf BibTex

Theses

titre
Safe and Efficient Reinforcement Learning for Behavioural Planning in Autonomous Driving
auteur
Edouard Leurent
article
Computer Science [cs]. Université de Lille, 2020. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://inria.hal.science/tel-03035705/file/PhD_thesis__Edouard_Leurent.pdf BibTex
titre
Multimodal and Interactive Models for Visually Grounded Language Learning
auteur
Florian Strub
article
Neural and Evolutionary Computing [cs.NE]. Université de Lille; École doctorale, ED SPI 074 : Sciences pour l’Ingénieur, 2020. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-03018038/file/Thesis_hal.pdf BibTex

Preprints, Working Papers, …

titre
Adversarial Attacks on Linear Contextual Bandits
auteur
Evrard Garcelon, Baptiste Roziere, Laurent Meunier, Jean Tarbouriech, Olivier Teytaud, Alessandro Lazaric, Matteo Pirotta
article
2020
Accès au bibtex
https://arxiv.org/pdf/2002.03839 BibTex
titre
Stochastic bandits with vector losses: Minimizing $\ell^\infty$-norm of relative losses
auteur
Xuedong Shang, Han Shao, Jian Qian
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02968536/file/shang2020vector.pdf BibTex
titre
Fictitious Play for Mean Field Games: Continuous Time Analysis and Applications
auteur
Sarah Perrin, Julien Pérolat, Mathieu Laurière, Matthieu Geist, Romuald Elie, Olivier Pietquin
article
2020
Accès au bibtex
https://arxiv.org/pdf/2007.03458 BibTex
titre
Optimal Strategies for Graph-Structured Bandits
auteur
Hassan Saber, Pierre Ménard, Odalric-Ambrym Maillard
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02891139/file/Optimal%20Strategies%20for%20Graph-Structured%20Bandits.pdf BibTex
titre
Forced-exploration free Strategies for Unimodal Bandits
auteur
Hassan Saber, Pierre Ménard, Odalric-Ambrym Maillard
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02883907/file/Forced-exploration%20free%20Strategies%20for%20Unimodal%20Bandits.pdf BibTex

2019

Journal articles

titre
Asymptotically Optimal Algorithms for Budgeted Multiple Play Bandits
auteur
Alexander Luedtke, Emilie Kaufmann, Antoine Chambaz
article
Machine Learning, 2019, 108 (11), pp.1919-1949. ⟨10.1007/s10994-019-05799-x⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01338733/file/LKC19_HaL.pdf BibTex
titre
Accurate reconstruction of EBSD datasets by a multimodal data approach using an evolutionary algorithm
auteur
Marie-Agathe Charpagne, Florian Strub, Tresa M. Pollock
article
Materials Characterization, 2019, 150, pp.184-198. ⟨10.1016/j.matchar.2019.01.033⟩
Accès au bibtex
https://arxiv.org/pdf/1903.02988 BibTex
titre
DPPy: Sampling Determinantal Point Processes with Python
auteur
Guillaume Gautier, Rémi Bardenet, Michal Valko
article
Journal of Machine Learning Research, 2019
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01879424/file/gautier2018dppy.pdf BibTex

Conference papers

titre
MERL: Multi-Head Reinforcement Learning
auteur
Yannis Flet-Berliac, Philippe Preux
article
Deep Reinforcement Learning Workshop, NeurIPS, Dec 2019, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02305105/file/main.pdf BibTex
titre
Learning Multiple Markov Chains via Adaptive Allocation
auteur
Mohammad Sadegh Talebi, Odalric-Ambrym Maillard
article
Advances in Neural Information Processing Systems 32 (NIPS 2019), Dec 2019, Vancouver, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-02387345/file/AL_MC_HAL.pdf BibTex
titre
Budgeted Reinforcement Learning in Continuous State Space
auteur
Nicolas Carrara, Edouard Leurent, Romain Laroche, Tanguy Urvoy, Odalric-Ambrym Maillard, Olivier Pietquin
article
Conference on Neural Information Processing Systems, Dec 2019, Vancouver, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-02375727/file/9128-budgeted-reinforcement-learning-in-continuous-state-space.pdf BibTex
titre
Regret Bounds for Learning State Representations in Reinforcement Learning
auteur
Ronald Ortner, Matteo Pirotta, Ronan Fruit, Alessandro Lazaric, Odalric-Ambrym Maillard
article
Conference on Neural Information Processing Systems, Dec 2019, Vancouver, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-02375715/file/9435-regret-bounds-for-learning-state-representations-in-reinforcement-learning.pdf BibTex
titre
Model-Based Reinforcement Learning Exploiting State-Action Equivalence
auteur
Mahsa Asadi, Mohammad Sadegh Talebi, Hippolyte Bourel, Odalric-Ambrym Maillard
article
ACML 2019, Proceedings of Machine Learning Research, Nov 2019, Nagoya, Japan. pp.204 – 219
Accès au texte intégral et bibtex
https://hal.science/hal-02378887/file/2019%20-%20Model-based%20Reinforcement%20Learning%20Exploiting%20State-Action%20Equivalence.pdf BibTex
titre
Energy Management for Microgrids: a Reinforcement Learning Approach
auteur
Tanguy Levent, Philippe Preux, Erwan Le Pennec, Jordi Badosa, Gonzague Henri, Yvan Bonnassieux
article
ISGT-Europe 2019 – IEEE PES Innovative Smart Grid Technologies Europe, Sep 2019, Bucharest, France. pp.1-5, ⟨10.1109/ISGTEurope.2019.8905538⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02382232/file/Paper_Draft2.pdf BibTex
titre
Practical Open-Loop Optimistic Planning
auteur
Edouard Leurent, Odalric-Ambrym Maillard
article
European Conference on Machine Learning, Sep 2019, Würzburg, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-02375697/file/407.pdf BibTex
titre
Non-asymptotic analysis of a sequential rupture detection test and its application to non-stationary bandits
auteur
Lilian Besson, Emilie Kaufmann
article
GRETSI 2019 – XXVIIème Colloque francophone de traitement du signal et des images, Aug 2019, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02152243/file/GRESTI__2019__Paper__Lilian_Besson__03-19.pdf BibTex
titre
On two ways to use determinantal point processes for Monte Carlo integration — Long version
auteur
Guillaume Gautier, Rémi Bardenet, Michal Valko
article
NeurIPS 2019 – Thirty-third Conference on Neural Information Processing Systems, Jun 2019, Vancouver, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-02277739/file/neurips_paper.pdf BibTex
titre
A simple dynamic bandit algorithm for hyper-parameter tuning
auteur
Xuedong Shang, Emilie Kaufmann, Michal Valko
article
Workshop on Automated Machine Learning at International Conference on Machine Learning, AutoML@ICML 2019 – 6th ICML Workshop on Automated Machine Learning, Jun 2019, Long Beach, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02145200/file/shang2019simple.pdf BibTex
titre
On two ways to use determinantal point processes for Monte Carlo integration
auteur
Guillaume Gautier, R. Bardenet, Michal Valko
article
NEGDEPML 2019 – ICML Workshop on Negative Dependence in ML, Jun 2019, Long Beach, CA, United States
Accès au texte intégral et bibtex
https://hal.science/hal-02160382/file/icml_camera_ready.pdf BibTex
titre
Decentralized Spectrum Learning for IoT Wireless Networks Collision Mitigation
auteur
Christophe Moy, Lilian Besson
article
ISIoT 2019 – 1st International Workshop on Intelligent Systems for the Internet of Things, May 2019, Santorin, Greece
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02144465/file/MB__ISIoT_2019.pdf BibTex
titre
Finding the bandit in a graph: Sequential search-and-stop
auteur
Pierre Perrault, Vianney Perchet, Michal Valko
article
22nd International Conference on Artificial Intelligence and Statistics (AISTATS 2019), Apr 2019, Okinawa, Japan
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02387465/file/perrault2019finding.pdf BibTex
titre
GNU Radio Implementation of MALIN: “Multi-Armed bandits Learning for Internet-of-things Networks
auteur
Lilian Besson, Remi Bonnefoi, Christophe Moy
article
IEEE WCNC 2019 – IEEE Wireless Communications and Networking Conference, Apr 2019, Marrakech, Morocco. ⟨10.1109/WCNC.2019.8885841⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02006825/file/BBM__IEEE_WCNC_2019.pdf BibTex
titre
Upper-Confidence Bound for Channel Selection in LPWA Networks with Retransmissions
auteur
Remi Bonnefoi, Lilian Besson, Julio Manco-Vasquez, Christophe Moy
article
The 1st International Workshop on Mathematical Tools and technologies for IoT and mMTC Networks Modeling, Philippe Mary, Samir Perlaza, Petar Popovski, Apr 2019, Marrakech, Morocco
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02049824/file/IEEE_WCNC__2019__Paper__BMBM.pdf BibTex
titre
Planning in entropy-regularized Markov decision processes and games
auteur
Jean-Bastien Grill, Omar D Domingues, Pierre Ménard, Rémi Munos, Michal Valko
article
Neural Information Processing Systems, 2019, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02387515/file/smoothcruiser2019.pdf BibTex
titre
Scale-free adaptive planning for deterministic dynamics & discounted rewards
auteur
Peter Bartlett, Victor Gabillon, Jennifer Healey, Michal Valko
article
International Conference on Machine Learning, 2019, Long Beach, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02387484/file/icml2019platypoos.pdf BibTex
titre
Active multiple matrix completion with adaptive confidence sets
auteur
Andrea Locatelli, Alexandra Carpentier, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, 2019, Okinawa, Japan
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02387468/file/Active_block_matrix_completion_with_adaptive_confidence_sets.pdf BibTex
titre
A simple parameter-free and adaptive approach to optimization under a minimal local smoothness assumption
auteur
Peter Bartlett, Victor Gabillon, Michal Valko
article
Algorithmic Learning Theory, 2019, Chicago, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01885368/file/bartlett2019simple.pdf BibTex
titre
Sequential change-point detection: Laplace concentration of scan statistics and non-asymptotic delay bounds
auteur
Odalric-Ambrym Maillard
article
Algorithmic Learning Theory, 2019, Chicago, United States. pp.1 – 23
Accès au texte intégral et bibtex
https://hal.science/hal-02351665/file/maillard19.pdf BibTex
titre
Exploiting structure of uncertainty for efficient matroid semi-bandits
auteur
Pierre Perrault, Vianney Perchet, Michal Valko
article
International Conference on Machine Learning, 2019, Long Beach, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02387478/file/supplementary.pdf BibTex
titre
Gaussian process optimization with adaptive sketching: Scalable and no regret
auteur
Daniele Calandriello, Luigi Carratino, Alessandro Lazaric, Michal Valko, Lorenzo Rosasco
article
Conference on Learning Theory, 2019, Phoenix, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02144311/file/calandriello2019gaussian.pdf BibTex
titre
Rotting bandits are not harder than stochastic ones
auteur
Julien Seznec, Andrea Locatelli, Alexandra Carpentier, Alessandro Lazaric, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, 2019, Naha, Japan
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01936894/file/seznec2019rotting.pdf BibTex
titre
General parallel optimization without a metric
auteur
Xuedong Shang, Emilie Kaufmann, Michal Valko
article
Algorithmic Learning Theory, 2019, Chicago, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02047225/file/shang2019general.pdf BibTex

Theses

titre
Tree search applied to optimization and planning
auteur
Jean-Bastien Grill
article
Computer Science [cs]. Lille 1, 2019. English. ⟨NNT : ⟩
Accès au bibtex
BibTex
titre
Reinforcement learning for Dialogue Systems optimization with user adaptation.
auteur
Nicolas Carrara
article
Artificial Intelligence [cs.AI]. Ecole Doctoral Science pour l’Ingénieur Université Lille Nord-de-France, 2019. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-02422691/file/thesis-nicolas-carrara.pdf BibTex
titre
Exploration-exploitation dilemma in Reinforcement Learning under various form of prior knowledge
auteur
Ronan Fruit
article
Artificial Intelligence [cs.AI]. Université de Lille 1, Sciences et Technologies; CRIStAL UMR 9189, 2019. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-02388395/file/main.pdf BibTex

Preprints, Working Papers, …

titre
Non-Asymptotic Pure Exploration by Solving Games
auteur
Rémy Degenne, Wouter M. Koolen, Pierre Ménard
article
2019
Accès au texte intégral et bibtex
https://hal.science/hal-02402665/file/main.pdf BibTex
titre
High-Dimensional Control Using Generalized Auxiliary Tasks
auteur
Yannis Flet-Berliac, Philippe Preux
article
2019
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02295705/file/main.pdf BibTex
titre
Self-Educated Language Agent With Hindsight Experience Replay For Instruction Following
auteur
Geoffrey Cideron, Mathieu Seurin, Florian Strub, Olivier Pietquin
article
2019
Accès au bibtex
https://arxiv.org/pdf/1910.09451 BibTex
titre
Social Attention for Autonomous Decision-Making in Dense Traffic
auteur
Edouard Leurent, Jean Mercat
article
2019
Accès au texte intégral et bibtex
https://hal.science/hal-02383940/file/social_attention.pdf BibTex
titre
Active Roll-outs in MDP with Irreversible Dynamics
auteur
Odalric-Ambrym Maillard, Timothy Mann, Ronald Ortner, Shie Mannor
article
2019
Accès au texte intégral et bibtex
https://hal.science/hal-02177808/file/maillard16a.pdf BibTex
titre
Accurate reconstruction of EBSD datasets by a multimodal data approach using an evolutionary algorithm
auteur
Florian Strub, Marie-Agathe Charpagne, Tresa M. Pollock
article
2019
Accès au bibtex
https://arxiv.org/pdf/1903.02988 BibTex

2018

Journal articles

titre
A Spectral Algorithm with Additive Clustering for the Recovery of Overlapping Communities in Networks
auteur
Emilie Kaufmann, Thomas Bonald, Marc Lelarge
article
Theoretical Computer Science, 2018, 742, pp.3-26. ⟨10.1016/j.tcs.2017.12.028⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01163147/file/KBL17.pdf BibTex
titre
Correctness Attraction: A Study of Stability of Software Behavior Under Runtime Perturbation
auteur
Benjamin Danglot, Philippe Preux, Benoit Baudry, Martin Monperrus
article
Empirical Software Engineering, 2018, 23 (4), pp.2086-2119. ⟨10.1007/s10664-017-9571-8⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01378523/file/article.pdf BibTex
titre
Feature-wise transformations
auteur
Vincent Dumoulin, Ethan Perez, Harm Vries, Florian Strub, Nathan Schucher, Aaron Courville, Yoshua Bengio
article
Distill, 2018, 3 (7), ⟨10.23915/distill.00011⟩
Accès au bibtex
BibTex
titre
Variance-Aware Regret Bounds for Undiscounted Reinforcement Learning in MDPs
auteur
Mohammad Sadegh Talebi, Odalric-Ambrym Maillard
article
Journal of Machine Learning Research, In press, pp.1-36
Accès au texte intégral et bibtex
https://hal.science/hal-01737142/file/ALT18_CameraReady.pdf BibTex
titre
On Bayesian index policies for sequential resource allocation
auteur
Emilie Kaufmann
article
Annals of Statistics, 2018, 46 (2), pp.842-865. ⟨10.1214/17-AOS1569⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01251606/file/KaufmannSupplement.pdf BibTex
titre
Streaming kernel regression with provably adaptive mean, variance, and regularization
auteur
Audrey Durand, Odalric-Ambrym Maillard, Joelle Pineau
article
Journal of Machine Learning Research, 2018, 1, pp.1 – 48
Accès au texte intégral et bibtex
https://hal.science/hal-01927007/file/1708.00768.pdf BibTex
titre
Boundary Crossing Probabilities for General Exponential Families
auteur
Odalric-Ambrym Maillard
article
Mathematical Methods of Statistics, 2018, 27, pp.1-31. ⟨10.3103/S1066530718010015⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01737150/file/BoundaryCrossingForExponentialFamilies_RevisedVersion.pdf BibTex

Conference papers

titre
Approximate Robust Control of Uncertain Dynamical Systems
auteur
Edouard Leurent, Yann Blanco, Denis Efimov, Odalric-Ambrym Maillard
article
Proc. MLITS Workshop at NeurIPS, Dec 2018, Montreal, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-01931744/file/robust_control.pdf BibTex
titre
Sequential Test for the Lowest Mean: From Thompson to Murphy Sampling
auteur
Emilie Kaufmann, Wouter Koolen, Aurélien Garivier
article
Advances in Neural Information Processing Systems (NIPS), Dec 2018, Montréal, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-01804581/file/arXiv.pdf BibTex
titre
Optimistic optimization of a Brownian
auteur
Jean-Bastien Grill, Michal Valko, Rémi Munos
article
NeurIPS 2018 – Thirty-second Conference on Neural Information Processing Systems, Dec 2018, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01906601/file/grill2018optimistic.pdf BibTex
titre
Fighting Boredom in Recommender Systems with Linear Reinforcement Learning
auteur
Romain Warlop, Alessandro Lazaric, Jérémie Mary
article
Neural Information Processing Systems, Dec 2018, Montreal, Canada. ⟨10.5555/3326943.3327105⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01915468/file/WARLOP-NIPS18.pdf BibTex
titre
Near Optimal Exploration-Exploitation in Non-Communicating Markov Decision Processes
auteur
Ronan Fruit, Matteo Pirotta, Alessandro Lazaric
article
32nd Conference on Neural Information Processing Systems, Dec 2018, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01941220/file/tucrl.pdf BibTex
titre
Safe transfer learning for dialogue applications
auteur
Nicolas Carrara, Romain Laroche, Jean-Léon Bouraoui, Tanguy Urvoy, Olivier Pietquin
article
SLSP 2018 – 6th International Conference on Statistical Language and Speech Processing, Oct 2018, Mons, Belgium
Accès au texte intégral et bibtex
https://hal.science/hal-01928102/file/ncarrara__SLSP_2018%20%281%29.pdf BibTex
titre
Adaptive black-box optimization got easier: HCT only needs local smoothness
auteur
Xuedong Shang, Emilie Kaufmann, Michal Valko
article
European Workshop on Reinforcement Learning, Oct 2018, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01874637/file/shang2018adaptive.pdf BibTex
titre
A Fitted-Q Algorithm for Budgeted MDPs
auteur
Nicolas Carrara, Romain Laroche, Jean-Léon Bouraoui, Tanguy Urvoy, Olivier Pietquin
article
EWRL 2018 – 14th European workshop on Reinforcement Learning, Oct 2018, Lille, France
Accès au texte intégral et bibtex
https://hal.science/hal-01928092/file/ewrl_14_2018_paper_67.pdf BibTex
titre
Compressing the Input for CNNs with the First-Order Scattering Transform
auteur
Edouard Oyallon, Eugene Belilovsky, Sergey Zagoruyko, Michal Valko
article
ECCV 2018 – European Conference on Computer Vision, Sep 2018, Munich, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01850921/file/ECCV2018.pdf BibTex
titre
Visual Reasoning with Multi-hop Feature Modulation
auteur
Florian Strub, Mathieu Seurin, Ethan Perez, Harm de Vries, Jérémie Mary, Philippe Preux, Aaron Courville, Olivier Pietquin
article
ECCV 2018 – 15th European Conference on Computer Vision, Sep 2018, Munich, Germany. pp.808-831
Accès au texte intégral et bibtex
https://hal.science/hal-01927811/file/1808.04446.pdf BibTex
titre
Importance Weighted Transfer of Samples in Reinforcement Learning
auteur
Andrea Tirinzoni, Andrea Sessa, Matteo Pirotta, Marcello Restelli
article
ICML 2018 – The 35th International Conference on Machine Learning, Jul 2018, Stockholm, Sweden. pp.4936-4945
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01941213/file/tirinzoni2018.pdf BibTex
titre
Improved large-scale graph learning through ridge spectral sparsification
auteur
Daniele Calandriello, Ioannis Koutis, Alessandro Lazaric, Michal Valko
article
International Conference on Machine Learning, Jul 2018, Stockholm, Sweden
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01810980/file/calandriello2018improved.pdf BibTex
titre
Training Dialogue Systems With Human Advice
auteur
Merwan Barlier, Romain Laroche, Olivier Pietquin
article
AAMAS 2018 – the 17th International Conference on Autonomous Agents and Multiagent Systems, Jul 2018, Stockholm, Sweden. pp.9
Accès au texte intégral et bibtex
https://hal.science/hal-01945831/file/1-4-4-AAMAS-Training-Dialogue-Systems-with-Human-Advice.pdf BibTex
titre
Stochastic Variance-Reduced Policy Gradient
auteur
Matteo Papini, Damiano Binaghi, Giuseppe Canonaco, Matteo Pirotta, Marcello Restelli
article
ICML 2018 – 35th International Conference on Machine Learning, Jul 2018, Stockholm, Sweden. pp.4026-4035
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01940394/file/supplementary.pdf BibTex
titre
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning
auteur
Ronan Fruit, Matteo Pirotta, Alessandro Lazaric, Ronald Ortner
article
ICML 2018 – The 35th International Conference on Machine Learning, Jul 2018, Stockholm, Sweden. pp.1578-1586
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01941206/file/fruit18a-supp.pdf BibTex
titre
i-RevNet: Deep Invertible Networks
auteur
Jörn-Henrik Jacobsen, Arnold Smeulders, Edouard Oyallon
article
ICLR 2018 – International Conference on Learning Representations, Apr 2018, Vancouver, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-01712808/file/iclr2018_conference_final_submitted.pdf BibTex
titre
End-to-End Automatic Speech Translation of Audiobooks
auteur
Alexandre Bérard, Laurent Besacier, Ali Can Kocabiyikoglu, Olivier Pietquin
article
ICASSP 2018 – IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2018, Calgary, Alberta, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-01709586/file/main.pdf BibTex
titre
Aggregation of Multi-Armed Bandits Learning Algorithms for Opportunistic Spectrum Access
auteur
Lilian Besson, Emilie Kaufmann, Christophe Moy
article
IEEE WCNC – IEEE Wireless Communications and Networking Conference, Apr 2018, Barcelona, Spain. ⟨10.1109/wcnc.2018.8377070⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01705292/file/IEEE_WCNC__2018__Paper__Lilian_Besson__07-17.pdf BibTex
titre
Actor-Critic Fictitious Play in Simultaneous Move Multistage Games
auteur
Julien Pérolat, Bilal Piot, Olivier Pietquin
article
AISTATS 2018 – 21st International Conference on Artificial Intelligence and Statistics, Apr 2018, Playa Blanca, Lanzarote, Canary Islands, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01724227/file/AISTATS2018%20%2813%29.pdf BibTex
titre
Corrupt Bandits for Preserving Local Privacy
auteur
Pratik Gajane, Tanguy Urvoy, Emilie Kaufmann
article
ALT 2018 – Algorithmic Learning Theory, Apr 2018, Lanzarote, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-01757297/file/Gajane18.pdf BibTex
titre
Multi-Player Bandits Revisited
auteur
Lilian Besson, Emilie Kaufmann
article
Algorithmic Learning Theory, Mehryar Mohri; Karthik Sridharan, Apr 2018, Lanzarote, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01629733/file/BK__ALT_2018.pdf BibTex
titre
Pure Exploration in Infinitely-Armed Bandit Models with Fixed-Confidence
auteur
Maryam Aziz, Jesse Anderton, Emilie Kaufmann, Javed Aslam
article
ALT 2018 – Algorithmic Learning Theory, Apr 2018, Lanzarote, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-01729969/file/aziz18.pdf BibTex
titre
FiLM: Visual Reasoning with a General Conditioning Layer
auteur
Ethan Perez, Florian Strub, Harm de Vries, Vincent Dumoulin, Aaron Courville
article
AAAI Conference on Artificial Intelligence, Feb 2018, New Orleans, United States
Accès au bibtex
https://arxiv.org/pdf/1707.03017 BibTex
titre
Best of both worlds: Stochastic & adversarial best-arm identification
auteur
Yasin Abbasi-Yadkori, Peter Bartlett, Victor Gabillon, Alan Malek, Michal Valko
article
Conference on Learning Theory, 2018, Stockholm, Sweden
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01808948/file/bob_best_arm_correction2023.pdf BibTex

Other publications

titre
A Fitted-Q Algorithm for Budgeted MDPs
auteur
Nicolas Carrara, Romain Laroche, Jean-Léon Bouraoui, Tanguy Urvoy, Olivier Pietquin
article
2018
Accès au texte intégral et bibtex
https://hal.science/hal-01867353/file/ncarrara-saferl-uai-2018.pdf BibTex

Poster communications

titre
Memory Bandits: Towards the Switching Bandit Problem Best Resolution
auteur
Réda Alami, Odalric-Ambrym Maillard, Raphaël Féraud
article
MLSS 2018 – Machine Learning Summer School, Aug 2018, Madrid, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-01879251/file/conference_poster_4.pdf BibTex
titre
Multi-Armed bandit Learning in Iot Networks (MALIN)
auteur
Remi Bonnefoi, Lilian Besson, Christophe Moy
article
ICT 2018 – 25th International Conference on Telecommunications, Jun 2018, Saint-Malo, France.
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02013866/file/MALIN_poster.pdf BibTex
titre
Multi-Player Bandits Revisited
auteur
Lilian Besson
article
Séminaire « IETR : Interagir Evaluer Transmettre Réunir », Jun 2018, Vannes, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02013847/file/Poster_JdD__Lilian_Besson__Multi-Player_Bandits.en.pdf BibTex

Notes de synthèse

titre
A Note on the Ei Function and a Useful Sum-Inequality
auteur
Lilian Besson
article
2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01847480/file/A_note_on_the_Ei_function.pdf BibTex

Theses

titre
On the role of the human being in human/machine dialogue
auteur
Merwan Barlier
article
Informatique [cs]. Université de lille, 2018. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-04458324/file/these-Barlier.pdf BibTex
titre
Novel Learning and Exploration-Exploitation Methods for Effective Recommender Systems
auteur
Romain Warlop
article
Artificial Intelligence [cs.AI]. Lille1, 2018. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01915499/file/Rapport%20de%20th%C3%A8se%20-%20VF%20-%20Romain%20WARLOP.pdf BibTex
titre
Neural Machine Translation Architectures and Applications
auteur
Alexandre Bérard
article
Computer Science [cs]. Université de lille, 2018. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-04458315/file/these-berard.pdf BibTex

Preprints, Working Papers, …

titre
Calibrated Fairness in Bandits
auteur
Yang Liu, Goran Radanovic, Christos Dimitrakakis, Debmalya Mandal, David C Parkes
article
2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01953314/file/1707.01875.pdf BibTex
titre
Deep Reinforcement Learning and the Deadly Triad
auteur
Hado van Hasselt, Yotam Doron, Florian Strub, Matteo Hessel, Nicolas Sonnerat, Joseph Modayil
article
2018
Accès au bibtex
https://arxiv.org/pdf/1812.02648 BibTex
titre
Upper Confidence Reinforcement Learning exploiting state-action equivalence
auteur
Odalric-Ambrym Maillard, Mahsa Asadi
article
2018
Accès au texte intégral et bibtex
https://hal.science/hal-01945034/file/UCRL_Classes_HAL.pdf BibTex
titre
A Survey of State-Action Representations for Autonomous Driving
auteur
Edouard Leurent
article
2018
Accès au texte intégral et bibtex
https://hal.science/hal-01908175/file/main.pdf BibTex
titre
Recurrent Neural Networks for Long and Short-Term Sequential Recommendation
auteur
Kiewan Villatel, Elena Smirnova, Jérémie Mary, Philippe Preux
article
2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01847127/file/recurrent-neural-networks-long-short-term-recommendation.pdf BibTex
titre
SMPyBandits: an Experimental Framework for Single and Multi-Players Multi-Arms Bandits Algorithms in Python
auteur
Lilian Besson
article
2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01840022/file/SMPyBandits_presentation_paper__for_JMLR_MLOSS__Lilian_Besson__16-07-18.pdf BibTex
titre
What Doubling Tricks Can and Can’t Do for Multi-Armed Bandits
auteur
Lilian Besson, Emilie Kaufmann
article
2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01736357/file/BK__COLT_2018.pdf BibTex

2017

Journal articles

titre
DUCT: An Upper Confidence Bound Approach to Distributed Constraint Optimisation Problems *
auteur
Brammert Ottens, Christos Dimitrakakis, Boi Faltings
article
ACM Transactions on Intelligent Systems and Technology, In press, 8 (5), pp.1 – 27. ⟨10.1145/3066156⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01593215/file/DUCT-hal.pdf BibTex
titre
A Large-scale Study of Call Graph-based Impact Prediction using Mutation Testing
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
Software Quality Journal, 2017, 25 (3), pp.921-950. ⟨10.1007/s11219-016-9332-8⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01346046/file/papersqj.pdf BibTex
titre
Bridging the Gap Between Imitation Learning and Inverse Reinforcement Learning
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
IEEE Transactions on Neural Networks and Learning Systems, 2017, 28 (8), pp.1814 – 1826. ⟨10.1109/TNNLS.2016.2543000⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01629654/file/TNNLS_2016_BPMGOP.pdf BibTex
titre
Differential Privacy for Bayesian Inference through Posterior Sampling
auteur
Christos Dimitrakakis, Blaine Nelson, Zuhe Zhang, Aikateirni Mitrokotsa, Benjamin I P Rubinstein
article
Journal of Machine Learning Research, 2017, 18 (11), pp.1−39
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01500302/file/15-257.pdf BibTex
titre
Learning the distribution with largest mean: two bandit frameworks
auteur
Emilie Kaufmann, Aurélien Garivier
article
ESAIM: Proceedings and Surveys, 2017, 60, pp.114 – 131. ⟨10.1051/proc/201760114⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01449822/file/ESAIM17KG.pdf BibTex

Conference papers

titre
Unwritten Languages Demand Attention Too! Word Discovery with Encoder-Decoder Models
auteur
Marcely Zanon Boito, Alexandre Bérard, Aline Villavicencio, Laurent Besacier
article
IEEE Automatic Speech Recognition and Understanding (ASRU), Dec 2017, Okinawa, Japan
Accès au texte intégral et bibtex
https://hal.science/hal-01592091/file/Template.pdf BibTex
titre
HoME: a Household Multimodal Environment
auteur
Simon Brodeur, Ethan Perez, Ankesh Anand, Florian Golemo, Luca Celotti, Florian Strub, Jean Rouat, Hugo Larochelle, Aaron Courville
article
NIPS 2017’s Visually-Grounded Interaction and Language Workshop, Dec 2017, Long Beach, United States
Accès au bibtex
https://arxiv.org/pdf/1711.11017 BibTex
titre
Modulating early visual processing by language
auteur
Harm de Vries, Florian Strub, Jérémie Mary, Hugo Larochelle, Olivier Pietquin, Aaron Courville
article
NIPS 2017 – Conference on Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-14
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01648683/file/modulating-early-visual.pdf BibTex
titre
Is the Bellman residual a bad proxy?
auteur
Matthieu Geist, Bilal Piot, Olivier Pietquin
article
NIPS 2017 – Advances in Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-13
Accès au texte intégral et bibtex
https://hal.science/hal-01629739/file/rps_nips17_cr_full.pdf BibTex
titre
Regret Minimization in MDPs with Options without Prior Knowledge
auteur
Ronan Fruit, Matteo Pirotta, Alessandro Lazaric, Emma Brunskill
article
NIPS 2017 – Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-36
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01649082/file/supplementary.pdf BibTex
titre
Adaptive Batch Size for Safe Policy Gradients
auteur
Matteo Papini, Matteo Pirotta, Marcello Restelli
article
The Thirty-first Annual Conference on Neural Information Processing Systems (NIPS), Dec 2017, Long Beach, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01653330/file/6950-adaptive-batch-size-for-safe-policy-gradients.pdf BibTex
titre
Memory Bandits: a Bayesian approach for the Switching Bandit Problem
auteur
Réda Alami, Odalric Maillard, Raphael Féraud
article
NIPS 2017 – 31st Conference on Neural Information Processing Systems, Dec 2017, Long Beach, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01811697/file/MemoryBandits_FinalVersion.pdf BibTex
titre
Online influence maximization under independent cascade model with semi-bandit feedback
auteur
Zheng Wen, Branislav Kveton, Michal Valko, Sharan Vaswani
article
Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-24
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01643976/file/wen2017online.pdf BibTex
titre
Compatible Reward Inverse Reinforcement Learning
auteur
Alberto Maria Metelli, Matteo Pirotta, Marcello Restelli
article
The Thirty-first Annual Conference on Neural Information Processing Systems – NIPS 2017, Dec 2017, Long Beach, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01653328/file/6800-compatible-reward-inverse-reinforcement-learning.pdf BibTex
titre
Independence clustering (without a matrix)
auteur
Daniil Ryabko
article
NIPS 2017 – Thirty-first Annual Conference on Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-14
Accès au bibtex
https://arxiv.org/pdf/1703.06700 BibTex
titre
Monte-Carlo Tree Search by Best Arm Identification
auteur
Emilie Kaufmann, Wouter M. Koolen
article
NIPS 2017 – 31st Annual Conference on Neural Information Processing Systems, Dec 2017, Long Beach, United States. pp.1-23
Accès au texte intégral et bibtex
https://hal.science/hal-01535907/file/KK17arXiv.pdf BibTex
titre
A generative model for sparse, evolving digraphs
auteur
Georgios Papoudakis, Philippe Preux, Martin Monperrus
article
6th International Conference on Complex Networks and their Applications, Nov 2017, Lyon, France. pp.531-542, ⟨10.1007/978-3-319-72150-7_43⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01617851/file/analysis-pa-model.pdf BibTex
titre
Universality of Bayesian mixture predictors
auteur
Daniil Ryabko
article
ALT 2017 – 28th International Conference on Algorithmic Learning Theory, Oct 2017, Kyoto, Japan. pp.1-13
Accès au bibtex
https://arxiv.org/pdf/1610.08249 BibTex
titre
Hypotheses testing on infinite random graphs
auteur
Daniil Ryabko
article
ALT 2017 – 28th International Conference on Algorithmic Learning Theory, Oct 2017, kyoto, Japan. pp.1-12
Accès au bibtex
https://arxiv.org/pdf/1708.03131 BibTex
titre
Efficient tracking of a growing number of experts
auteur
Jaouad Mourtada, Odalric-Ambrym Maillard
article
Algorithmic Learning Theory, Oct 2017, Tokyo, Japan. pp.1 – 23
Accès au texte intégral et bibtex
https://hal.science/hal-01615424/file/paper-growing.pdf BibTex
titre
Boundary Crossing for General Exponential Families
auteur
Odalric-Ambrym Maillard
article
Algorithmic Learning Theory, Oct 2017, Kyoto, Japan. pp.1 – 34
Accès au texte intégral et bibtex
https://hal.science/hal-01615427/file/15.pdf BibTex
titre
Multi-Armed Bandit Learning in IoT Networks: Learning helps even in non-stationary settings
auteur
Rémi Bonnefoi, Lilian Besson, Christophe Moy, Emilie Kaufmann, Jacques Palicot
article
CROWNCOM 2017 – 12th EAI International Conference on Cognitive Radio Oriented Wireless Networks, Sep 2017, Lisbon, Portugal. pp.173-185, ⟨10.1007/978-3-319-76207-4_15⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01575419/file/BBMKP_CROWNCOM_2017.pdf BibTex
titre
Bayesian Inference for Least Squares Temporal Difference Regularization
auteur
Nikolaos Tziortziotis, Christos Dimitrakakis
article
ECML 2017 – European Conference on Machine Learning, 2017-09-22, Sep 2017, Skopje, Macedonia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01593212/file/BLSTD.pdf BibTex
titre
LIG-CRIStAL System for the WMT17 Automatic Post-Editing Task
auteur
Alexandre Bérard, Olivier Pietquin, Laurent Besacier
article
Second conference on machine translation (WMT17) during EMNLP 2017, Sep 2017, Copenhague, Denmark
Accès au texte intégral et bibtex
https://hal.science/hal-01580881/file/main.pdf BibTex
titre
End-to-end optimization of goal-driven and visually grounded dialogue systems Harm de Vries
auteur
Florian Strub, Harm de Vries, Jeremie Mary, Bilal Piot, Aaron Courville, Olivier Pietquin
article
International Joint Conference on Artificial Intelligence, Aug 2017, Melbourne, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01549642/file/1703.05423.pdf BibTex
titre
Online learning and transfer for user adaptation in dialogue systems
auteur
Nicolas Carrara, Romain Laroche, Olivier Pietquin
article
SIGDIAL/SEMDIAL joint special session on negotiation dialog 2017, Aug 2017, Saarbrücken, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-01557775/file/camera-ready.pdf BibTex
titre
Learning Visual Reasoning Without Strong Priors
auteur
Ethan Perez, Harm de Vries, Florian Strub, Vincent Dumoulin, Aaron Courville
article
ICML 2017’s Machine Learning in Speech and Language Processing Workshop, Aug 2017, Sidney, France
Accès au bibtex
https://arxiv.org/pdf/1709.07871 BibTex
titre
Active Learning for Accurate Estimation of Linear Models
auteur
Carlos Riquelme, Mohammad Ghavamzadeh, Alessandro Lazaric
article
ICML 2017 – 34th International Conference on Machine Learning, Aug 2017, Sydney, Australia. pp.36
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01538762/file/active_learning_accurate_estimation_linear_models_supplementary.pdf BibTex
titre
Boosted Fitted Q-Iteration
auteur
Samuele Tosatto, Matteo Pirotta, Carlo d’Eramo, Marcello Restelli
article
34th International Conference on Machine Learning (ICML), Aug 2017, Sydney, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01653332/file/tosatto17a.pdf BibTex
titre
GuessWhat?! Visual object discovery through multi-modal dialogue
auteur
Harm de Vries, Florian Strub, Sarath Chandar, Olivier Pietquin, Hugo Larochelle, Aaron Courville
article
Conference on Computer Vision and Pattern Recognition, Jul 2017, Honolulu, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01549641/file/1611.08481.pdf BibTex
titre
A Multi-Armed Bandit Model Selection for Cold-Start User Recommendation
auteur
Crícia Z Felício, Klérisson V R Paixão, Celia a Z Barcelos, Philippe Preux
article
25th ACM Conference on User Modelling, Adaptation and Personalization (UMAP), Jul 2017, Bratislava, Slovakia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01517967/file/umap2017.4hal.pdf BibTex
titre
Faut-il minimiser le résidu de Bellman ou maximiser la valeur moyenne ?
auteur
Matthieu Geist, Bilal Piot, Olivier Pietquin
article
Journées Francophones sur la Planification, la Décision et l’Apprentissage pour la conduite de systèmes (JFPDA 2017), Jul 2017, Caen, France
Accès au bibtex
BibTex
titre
Spectral Learning from a Single Trajectory under Finite-State Policies
auteur
Borja Balle, Odalric-Ambrym Maillard
article
International conference on Machine Learning, Jul 2017, Sidney, France
Accès au texte intégral et bibtex
https://hal.science/hal-01590940/file/cr_ICML_HankelMatrices2.pdf BibTex
titre
Thompson Sampling for Linear-Quadratic Control Problems
auteur
Marc Abeille, Alessandro Lazaric
article
AISTATS 2017 – 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01493564/file/main.pdf BibTex
titre
Learning Nash Equilibrium for General-Sum Markov Games from Batch Data
auteur
Julien Pérolat, Florian Strub, Bilal Piot, Olivier Pietquin
article
AISTATS 2017 – The 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States. pp.1-14
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01648489/file/bellman-residual-aistats2016%285%29.pdf BibTex
titre
Linear Thompson Sampling Revisited
auteur
Marc Abeille, Alessandro Lazaric
article
AISTATS 2017 – 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01493561/file/main.pdf BibTex
titre
Exploration–Exploitation in MDPs with Options
auteur
Ronan Fruit, Alessandro Lazaric
article
AISTATS 2017 – 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01493567/file/main.pdf BibTex
titre
Transfer Reinforcement Learning with Shared Dynamics
auteur
Romain Laroche, Merwan Barlier
article
AAAI-17 – Thirty-First AAAI Conference on Artificial Intelligence, Feb 2017, San Francisco, United States. pp.7
Accès au texte intégral et bibtex
https://hal.science/hal-01548649/file/aaai-multi-task%281%29.pdf BibTex
titre
Parallel Higher Order Alternating Least Square for Tensor Recommender System
auteur
Romain Warlop, Alessandro Lazaric, Jérémie Mary
article
AAAI 2017 – Thirty-First AAAI Conference on Artificial Intelligence, Feb 2017, San Francisco, United States
Accès au bibtex
BibTex
titre
Efficient second-order online kernel learning with adaptive embedding
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Neural Information Processing Systems, 2017, Long Beach, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01643961/file/calandriello2017efficient.pdf BibTex
titre
Second-Order Kernel Online Convex Optimization with Adaptive Sketching
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
International Conference on Machine Learning, 2017, Sydney, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01537799/file/calandriello2017second-order.pdf BibTex
titre
Zonotope hit-and-run for efficient sampling from projection DPPs
auteur
Guillaume Gautier, Rémi Bardenet, Michal Valko
article
International Conference on Machine Learning, 2017, Sydney, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01526577/file/gautier2017zonotope.pdf BibTex
titre
Distributed adaptive sampling for kernel matrix approximation
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01482760/file/calandriello2017distributed.pdf BibTex
titre
Trading off rewards and errors in multi-armed bandits
auteur
Akram Erraqabi, Alessandro Lazaric, Michal Valko, Emma Brunskill, Yun-En Liu
article
International Conference on Artificial Intelligence and Statistics, 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01482765/file/erraqabi2017trading.pdf BibTex

Lectures

titre
Basic Concentration Properties of Real-Valued Distributions
auteur
Odalric-Ambrym Maillard
article
Doctoral. France. 2017
Accès au texte intégral et bibtex
https://hal.science/cel-01632228/file/Lecture1-IntroductionToBasicConcentration.pdf BibTex

Poster communications

titre
Multi-Armed Bandit Learning in IoT Networks
auteur
Remi Bonnefoi, Lilian Besson
article
Journée des Doctorants de l’IETR, Jul 2017, Rennes, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02013839/file/Poster_JdD__Remi_Bonnefoi_and_Lilian_Besson__IoT_slotted.en.pdf BibTex

Theses

titre
Efficient Sequential Learning in Structured and Constrained Environments
auteur
Daniele Calandriello
article
Machine Learning [cs.LG]. Inria Lille Nord Europe – Laboratoire CRIStAL – Université de Lille, 2017. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01816904/file/main.pdf BibTex
titre
Reinforcement Learning: The Multi-Player Case
auteur
Julien Pérolat
article
Artificial Intelligence [cs.AI]. Université de Lille 1 – Sciences et Technologies, 2017. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01820700/file/phd_perolat.pdf BibTex
titre
Exploration-Exploitation with Thompson Sampling in Linear Systems
auteur
Marc Abeille
article
Mathematics [math]. Université de Lille 1, 2017. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01816069/file/These_Marc_Abeille.pdf BibTex
titre
Bandits Multi-bras avec retour d’information non-conventionnelle
auteur
Pratik Gajane
article
Artificial Intelligence [cs.AI]. Université de Lille, 2017. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01706640/file/phd-gajane.pdf BibTex

Preprints, Working Papers, …

titre
Difference of Convex Functions Programming Applied to Control with Expert Data
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
2017
Accès au texte intégral et bibtex
https://hal.science/hal-01629653/file/1606.01128.pdf BibTex
titre
Subjective Fairness
auteur
Christos Dimitrakakis, Yang Liu, David Parkes, Goran Radanovic
article
2017
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01531849/file/1706.00119.pdf BibTex
titre
Multi-view Sequential Games: The Helper-Agent Problem
auteur
Christos Dimitrakakis, Firas Jarboui, David Parkes, Lior Seeman
article
2017
Accès au texte intégral et bibtex
https://hal.science/hal-01408294/file/GeneralMarkovGamesHAL.pdf BibTex

2016

Journal articles

titre
Exploiting Social Information in Pairwise Preference Recommender System
auteur
Crícia Z Felício, Klérisson V R Paixão, Guilherme Alves, Sandra de Amo, Philippe Preux
article
Journal of Information and Data Management, 2016, 7 (2), pp.16
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01462200/file/1596-10577-1-PB.pdf BibTex
titre
Importance Weighting Without Importance Weights: An Efficient Algorithm for Combinatorial Semi-Bandits
auteur
Gergely Neu, Bartók Gábor
article
Journal of Machine Learning Research, 2016, 17 (154), pp.1 – 21
Accès au texte intégral et bibtex
https://hal.science/hal-01380278/file/15-091.pdf BibTex
titre
Bayesian Policy Gradient and Actor-Critic Algorithms
auteur
Mohammad Ghavamzadeh, Yaakov Engel, Michal Valko
article
Journal of Machine Learning Research, 2016, 17 (66), pp.1-53
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00776608/file/jmlr-BPG-BAC.pdf BibTex
titre
On the Complexity of Best Arm Identification in Multi-Armed Bandit Models
auteur
Emilie Kaufmann, Olivier Cappé, Aurélien Garivier
article
Journal of Machine Learning Research, 2016, 17, pp.1-42
Accès au texte intégral et bibtex
https://hal.science/hal-01024894/file/kaufman15a.pdf BibTex
titre
Consistent Algorithms for Clustering Time Series
auteur
Azadeh Khaleghi, Daniil Ryabko, Jérémie Mary, Philippe Preux
article
Journal of Machine Learning Research, 2016, 17 (3), pp.1 – 32
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01399613/file/khaleghi16a.pdf BibTex
titre
Nonparametric multiple change point estimation in highly dependent time series
auteur
Azadeh Khaleghi, Daniil Ryabko
article
Theoretical Computer Science, 2016, 620, pp.119-133. ⟨10.1016/j.tcs.2015.10.041⟩
Accès au bibtex
BibTex
titre
Analysis of Classification-based Policy Iteration Algorithms
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos
article
Journal of Machine Learning Research, 2016, 17, pp.1 – 30
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01401513/file/10-364.pdf BibTex
titre
Operator-valued Kernels for Learning from Functional Response Data
auteur
Hachem Kadri, Emmanuel Duflos, Philippe Preux, Stéphane Canu, Alain Rakotomamonjy, Julien Audiffren
article
Journal of Machine Learning Research, 2016, 17 (20), pp.1-54
Accès au texte intégral et bibtex
https://hal.science/hal-01221329/file/kadri15a.pdf BibTex

Conference papers

titre
Learning Dialogue Dynamics with the Method of Moments
auteur
Merwan Barlier, Romain Laroche, Olivier Pietquin
article
Workshop on Spoken Language Technologie (SLT 2016), Dec 2016, San Diego, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406904/file/SLT_2016_MBRLOP.pdf BibTex
titre
Word2Vec vs DBnary: Augmenting METEOR using Vector Representations or Lexical Resources?
auteur
Christophe Servan, Alexandre Bérard, Zied Elloumi, Hervé Blanchon, Laurent Besacier
article
COLING 2016, ANLP & ICCL, Dec 2016, Osaka, Japan
Accès au texte intégral et bibtex
https://hal.science/hal-01376948/file/metrics_enhanced_COLING2016.pdf BibTex
titre
Listen and Translate: A Proof of Concept for End-to-End Speech-to-Text Translation
auteur
Alexandre Bérard, Olivier Pietquin, Laurent Besacier, Christophe Servan
article
NIPS Workshop on end-to-end learning for speech and audio processing, Dec 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-01408086/file/listen_and_translate_nips_2016_final.pdf BibTex
titre
Blazing the trails before beating the path: Sample-efficient Monte-Carlo planning
auteur
Jean-Bastien Grill, Michal Valko, Rémi Munos
article
Neural Information Processing Systems, Dec 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01389107/file/grill2016blazing.pdf BibTex
titre
On Explore-Then-Commit Strategies
auteur
Aurélien Garivier, Emilie Kaufmann, Tor Lattimore
article
NIPS, Dec 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-01322906/file/nips_final.pdf BibTex
titre
Preference-like Score to Cope with Cold-Start User in Recommender Systems
auteur
Crícia Z Felício, Klérisson V R Paixão, Celia a Z Barcelos, Philippe Preux
article
28th International Conference on Tools with Artificial Intelligence (ICTAI), Nov 2016, San Jose, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01390762/file/preference-score-cope.pdf BibTex
titre
Sequential Collaborative Ranking Using (No-)Click Implicit Feedback
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
The 23rd International Conference on Neural Information Processing (ICONIP’16), Oct 2016, Kyoto, Japan. pp.288 – 296, ⟨10.1007/978-3-319-46672-9_33⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406338/file/main.pdf BibTex
titre
Mutation-Based Graph Inference for Fault Localization
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
International Working Conference on Source Code Analysis and Manipulation, Oct 2016, Raleigh, United States. ⟨10.1109/SCAM.2016.24⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01350515/file/scam16.pdf BibTex
titre
Things Bayes can’t do
auteur
Daniil Ryabko
article
Proceedings of the 27th International Conference on Algorithmic Learning Theory (ALT’16), Oct 2016, Bari, Italy. pp.253-260, ⟨10.1007/978-3-319-46379-7_17⟩
Accès au bibtex
https://arxiv.org/pdf/1610.08239 BibTex
titre
Hybrid Recommender System based on Autoencoders
auteur
Florian Strub, Romaric Gaudel, Jérémie Mary
article
the 1st Workshop on Deep Learning for Recommender Systems, Sep 2016, Boston, United States. pp.11 – 16, ⟨10.1145/2988450.2988456⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01336912/file/AutoEnc.pdf BibTex
titre
Large-scale Bandit Recommender System
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
Proc. of the Second International Workshop on Machine Learning, Optimization and Big Data (MOD), Sep 2016, Volterra, Italy. pp.11, ⟨10.1007/978-3-319-51469-7_17⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406389/file/paper32.pdf BibTex
titre
A Stochastic Model for Computer-Aided Human-Human Dialogue
auteur
Merwan Barlier, Romain Laroche, Olivier Pietquin
article
Interspeech 2016, Sep 2016, San Francisco, United States. pp.2051 – 2055
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406894/file/IS_2016_MBRLOP.pdf BibTex
titre
Compromis exploration-exploitation pour système de recommandation à grande échelle
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
Conférence francophone sur l’Apprentissage Automatique (CAp’16), Jul 2016, Marseille, France
Accès au bibtex
BibTex
titre
Filtrage Collaboratif Hybride avec des Auto-encodeurs
auteur
Florian Strub, Jérémie Mary, Romaric Gaudel
article
Conférence francophone sur l’Apprentissage Automatique (CAp’16), Jul 2016, Marseille, France
Accès au bibtex
BibTex
titre
Online learning with Erdős-Rényi side-observation graphs
auteur
Tomáš Kocák, Gergely Neu, Michal Valko
article
Uncertainty in Artificial Intelligence, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01320588/file/kocak2016onlinea.pdf BibTex
titre
Analysis of Nyström method with sequential ridge leverage score sampling
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Uncertainty in Artificial Intelligence, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01343674/file/calandriello2016analysis.pdf BibTex
titre
Maximin Action Identification: A New Bandit Framework for Games
auteur
Aurélien Garivier, Emilie Kaufmann, Wouter M. Koolen
article
29th Annual Conference on Learning Theory (COLT), Jun 2016, New-York, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01273842/file/garivier16b.pdf BibTex
titre
Optimal Best Arm Identification with Fixed Confidence
auteur
Aurélien Garivier, Emilie Kaufmann
article
29th Annual Conference on Learning Theory (COLT), Jun 2016, New York, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01273838/file/MDLBAI.pdf BibTex
titre
Softened approximate policy iteration for Markov games
auteur
Julien Pérolat, Bilal Piot, Matthieu Geist, Bruno Scherrer, Olivier Pietquin
article
ICML 2016 – 33rd International Conference on Machine Learning, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01393328/file/nmz.pdf BibTex
titre
PAC learning of Probabilistic Automaton based on the Method of Moments
auteur
Hadrien Glaude, Olivier Pietquin
article
International Conference on Machine Learning (ICML 2016), Jun 2016, New York, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406889/file/glaude16.pdf BibTex
titre
Pliable rejection sampling
auteur
Akram Erraqabi, Michal Valko, Alexandra Carpentier, Odalric-Ambrym Maillard
article
International Conference on Machine Learning, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01322168/file/erraqabi2016pliable.pdf BibTex
titre
Reinforcement Learning of POMDPs using Spectral Methods
auteur
Kamyar Azizzadenesheli, Alessandro Lazaric, Animashree Anandkumar
article
Proceedings of the 29th Annual Conference on Learning Theory (COLT2016), Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01322207/file/master.pdf BibTex
titre
MultiVec: a Multilingual and Multilevel Representation Learning Toolkit for NLP
auteur
Alexandre Bérard, Christophe Servan, Olivier Pietquin, Laurent Besacier
article
The 10th edition of the Language Resources and Evaluation Conference (LREC), May 2016, Portoroz, Slovenia
Accès au texte intégral et bibtex
https://hal.science/hal-01335930/file/Berard_and_al-MultiVec_a_Multilingual_and_Multilevel_Representation-LREC2016.pdf BibTex
titre
A Learning Algorithm for Change Impact Prediction
auteur
Vincenzo Musco, Antonin Carette, Martin Monperrus, Philippe Preux
article
5th International Workshop on Realizing Artificial Intelligence Synergies in Software Engineering, May 2016, Austin, United States. pp.8-14, ⟨10.1145/2896995.2896996⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01279620/file/main.pdf BibTex
titre
Revealing graph bandits for maximizing local influence
auteur
Alexandra Carpentier, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, May 2016, Seville, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01304020/file/carpentier2016revealing.pdf BibTex
titre
Online learning with noisy side observations
auteur
Tomáš Kocák, Gergely Neu, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, May 2016, Seville, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01303377/file/kocak2016online.pdf BibTex
titre
Score-based Inverse Reinforcement Learning
auteur
Layla El Asri, Bilal Piot, Matthieu Geist, Romain Laroche, Olivier Pietquin
article
International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2016), May 2016, Singapore, Singapore
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406886/file/aamas-score-based.pdf BibTex
titre
On the Use of Non-Stationary Strategies for Solving Two-Player Zero-Sum Markov Games
auteur
Julien Pérolat, Bilal Piot, Bruno Scherrer, Olivier Pietquin
article
19th International Conference on Artificial Intelligence and Statistics (AISTATS 2016), May 2016, Cadiz, Spain
Accès au bibtex
BibTex
titre
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Ronald Ortner, Peter Bartlett
article
Proceedings of the 19th International Conference on Artificial Intelligence (AISTATS), May 2016, Cadiz, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01322198/file/AISTATS_full_CR.pdf BibTex
titre
Algorithms for Differentially Private Multi-Armed Bandits
auteur
Aristide C. Y. Tossou, Christos Dimitrakakis
article
AAAI 2016, Feb 2016, Phoenix, Arizona, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01234427/file/single-mab-aaai16-final.pdf BibTex
titre
On the Differential Privacy of Bayesian Inference
auteur
Zuhe Zhang, Benjamin Rubinstein, Christos Dimitrakakis
article
AAAI 2016 – Thirtieth AAAI Conference on Artificial Intelligence, Feb 2016, Phoenix, Arizona, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01234215/file/HAL.pdf BibTex
titre
Compact and Interpretable Dialogue State Representation with Genetic Sparse Distributed Memory
auteur
Layla El Asri, Romain Laroche, Olivier Pietquin
article
7th International Workshop on Spoken Dialogue Systems (IWSDS 2016), Jan 2016, Saariselka, Finland
Accès au bibtex
BibTex
titre
Pack only the essentials: Adaptive dictionary learning for kernel ridge regression
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Adaptive and Scalable Nonparametric Methods in Machine Learning at Neural Information Processing Systems, 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01482756/file/calandriello2016pack.pdf BibTex
titre
Scalable explore-exploit Collaborative Filtering
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
Pacific Asia Conference on Information Systems (PACIS’16), 2016, Chiayi, Taiwan
Accès au bibtex
BibTex
titre
Rewards and errors in multi-arm bandits for interactive education
auteur
Akram Erraqabi, Alessandro Lazaric, Michal Valko, Emma Brunskill, Yun-En Liu
article
Challenges in Machine Learning: Gaming and Education workshop at Neural Information Processing Systems, 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01482764/file/erraqabi2016rewards.pdf BibTex

Habilitation à diriger des recherches

titre
Bandits on graphs and structures
auteur
Michal Valko
article
Machine Learning [stat.ML]. École normale supérieure de Cachan – ENS Cachan, 2016
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01359757/file/valko2016bandits.pdf BibTex

Theses

titre
On Recommendation Systems in a Sequential Context
auteur
Frédéric Guillou
article
Machine Learning [cs.LG]. Université Lille 3, 2016. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01407336/file/main.pdf BibTex
titre
Sequential Learning with Similarities
auteur
Tomáš Kocák
article
Machine Learning [cs.LG]. Inria Lille Nord Europe – Laboratoire CRIStAL – Université de Lille, 2016. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01742570/file/Thesis.pdf BibTex
titre
Learning rational linear sequential systems using the method of moments
auteur
Hadrien Glaude
article
Apprentissage [cs.LG]. Université de Lille 1 – Sciences et Technologies, 2016. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01374080/file/Th%C3%A8se%20Hadrien%20Glaude.pdf BibTex

Preprints, Working Papers, …

titre
Hybrid Collaborative Filtering with Autoencoders
auteur
Florian Strub, Jérémie Mary, Romaric Gaudel
article
2016
Accès au texte intégral et bibtex
https://hal.science/hal-01281794/file/AutoEnc.pdf BibTex

2015

Journal articles

titre
Truthful Learning Mechanisms for Multi–Slot Sponsored Search Auctions with Externalities
auteur
Nicola Gatti, Alessandro Lazaric, Marco Rocco, Francesco Trovò
article
Artificial Intelligence, 2015, 227, pp.93-139. ⟨10.1016/j.artint.2015.05.012⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01237670/file/main.pdf BibTex
titre
Optimism in Active Learning
auteur
Timothé Collet, Olivier Pietquin
article
Computational Intelligence and Neuroscience, 2015, 2015, pp.1–17. ⟨10.1155/2015/973696⟩
Accès au bibtex
BibTex
titre
Random-Walk Perturbations for Online Combinatorial Optimization
auteur
Luc Devroye, Gábor Lugosi, Gergely Neu
article
IEEE Transactions on Information Theory, 2015, 61 (7), pp.4099 – 4106. ⟨10.1109/TIT.2015.2428253⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01214987/file/fpl_journal_final.pdf BibTex
titre
Generalizing the Wilcoxon rank-sum test for interval data
auteur
Julien Perolat, Ines Couso, Kevin Loquin, Olivier Strauss
article
International Journal of Approximate Reasoning, 2015, 56, pp.108-121. ⟨10.1016/j.ijar.2014.08.001⟩
Accès au bibtex
BibTex
titre
Approximate modified policy iteration and its application to the game of Tetris
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Boris Lesner, Matthieu Geist
article
Journal of Machine Learning Research, 2015, 16, pp.1629−1676
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01091341/file/final.pdf BibTex

Conference papers

titre
Spectral learning with proper probabilities for finite state automation
auteur
Hadrien Glaude, Cyrille Enderli, Olivier Pietquin
article
ASRU 2015 – Automatic Speech Recognition and Understanding Workshop, Dec 2015, Scottsdale, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225810/file/ASRU_2015_HGCEOP.pdf BibTex
titre
Explore no more: Improved high-probability regret bounds for non-stochastic bandits
auteur
Gergely Neu
article
Advances on Neural Information Processing Systems 28 (NIPS 2015), Dec 2015, Montreal, Canada. pp.3150-3158
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01223501/file/IX_nips_final.pdf BibTex
titre
Collaborative Filtering as a Multi-Armed Bandit
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
NIPS’15 Workshop: Machine Learning for eCommerce, Dec 2015, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01256254/file/main.pdf BibTex
titre
Bayesian Credible Intervals for Online and Active Learning of Classification Trees
auteur
Timothé Collet, Olivier Pietquin
article
ADPRL 2015 – Symposium on Adaptive Dynamic Programming and Reinforcement Learning., Dec 2015, Cape Town, South Africa
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225850/file/ADPRL_2015_TCOP.pdf BibTex
titre
Collaborative Filtering with Stacked Denoising AutoEncoders and Sparse Inputs
auteur
Florian Strub, Jérémie Mary, Preux Philippe
article
NIPS Workshop on Machine Learning for eCommerce, Dec 2015, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01256422/file/v1.1.pdf BibTex
titre
Optimism in Active Learning with Gaussian Processes
auteur
Timothé Collet, Olivier Pietquin
article
22nd International Conference on Neural Information Processing (ICONIP2015), Nov 2015, Istanbul, Turkey
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225826/file/ICONIP_2015_TCOP.pdf BibTex
titre
Non-negative Spectral Learning for Linear Sequential Systems
auteur
Hadrien Glaude, Cyrille Enderli, Olivier Pietquin
article
22nd International Conference on Neural Information Processing (ICONIP2015), Nov 2015, Istanbul, Turkey
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225838/file/ICONIP_2015_HGCEOP.pdf BibTex
titre
Learning of scanning strategies for electronic support using predictive state representations
auteur
Hadrien Glaude, Cyrille Enderli, Jean-François Grandin, Olivier Pietquin
article
International Workshop on Machine Learning for Signal Processing (MLSP 2015), Sep 2015, Boston, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225807/file/MLSP_2015_HGCEJFGOP.pdf BibTex
titre
Human-Machine Dialogue as a Stochastic Game
auteur
Merwan Barlier, Julien Perolat, Romain Laroche, Olivier Pietquin
article
16th Annual SIGdial Meeting on Discourse and Dialogue (SIGDIAL 2015), Sep 2015, Prague, Czech Republic
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225848/file/W15-4602.pdf BibTex
titre
Inverse Reinforcement Learning in Relational Domains
auteur
Thibaut Munzer, Bilal Piot, Matthieu Geist, Olivier Pietquin, Manuel Lopes
article
International Joint Conferences on Artificial Intelligence, Jul 2015, Buenos Aires, Argentina
Accès au texte intégral et bibtex
https://hal.science/hal-01154650/file/IJCAI2015_HAL.pdf BibTex
titre
Direct Policy Iteration with Demonstrations
auteur
Jessica Chemali, Alessandro Lazaric
article
IJCAI – 24th International Joint Conference on Artificial Intelligence, Jul 2015, Buenos Aires, Argentina
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01237659/file/DPID_CameraReady.pdf BibTex
titre
Maximum Entropy Semi-Supervised Inverse Reinforcement Learning
auteur
Julien Audiffren, Michal Valko, Alessandro Lazaric, Mohammad Ghavamzadeh
article
International Joint Conference on Artificial Intelligence, Jul 2015, Bueons Aires, Argentina
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01146187/file/messi-TR.pdf BibTex
titre
Bandits and Recommender Systems
auteur
Jérémie Mary, Romaric Gaudel, Philippe Preux
article
First International Workshop on Machine Learning, Optimization, and Big Data (MOD’15), Jul 2015, Taormina, Italy. pp.325-336, ⟨10.1007/978-3-319-27926-8_29⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01256033/file/Bandits_and_Recommender_Systems.pdf BibTex
titre
Large-scale semi-supervised learning with online spectral graph sparsification
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Resource-Efficient Machine Learning workshop at International Conference on Machine Learning, Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01544929/file/calandriello2015large-scale.pdf BibTex
titre
Imitation Learning Applied to Embodied Conversational Agents
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
4th Workshop on Machine Learning for Interactive Systems (MLIS 2015), Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225816/file/piot15.pdf BibTex
titre
A Relative Exponential Weighing Algorithm for Adversarial Utility-based Dueling Bandits
auteur
Pratik Gajane, Tanguy Urvoy, Fabrice Clérot
article
Proceedings of the 32nd International Conference on Machine Learning , Jul 2015, Lille, France. pp.218-227
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01225614/file/rex3_icml.pdf BibTex
titre
Qualitative Multi-Armed Bandits: A Quantile-Based Approach
auteur
Balazs Szorenyi, Róbert Busa-Fekete, Paul Weng, Eyke Hüllermeier
article
32nd International Conference on Machine Learning, Jul 2015, Lille, France. pp.1660-1668
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01204708/file/qmab_final.pdf BibTex
titre
Approximate dynamic programming for two-player zero-sum Markov games
auteur
Julien Perolat, Bruno Scherrer, Bilal Piot, Olivier Pietquin
article
International Conference on Machine Learning (ICML 2015), Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01153270/file/ICML_2015_JPBSBPOP.pdf BibTex
titre
First-order regret bounds for combinatorial semi-bandits
auteur
Gergely Neu
article
Proceedings of the 28th Annual Conference on Learning Theory (COLT), Jul 2015, Paris, France. pp.1360-1375
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01215001/file/firstorder_colt.pdf BibTex
titre
Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning
auteur
Kailasam Lakshmanan, Ronald Ortner, Daniil Ryabko
article
International Conference on Machine Learning (ICML), Jul 2015, Lille, France
Accès au bibtex
BibTex
titre
Simple regret for infinitely many armed bandits
auteur
Alexandra Carpentier, Michal Valko
article
International Conference on Machine Learning, Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01153538/file/carpentier2015simple.pdf BibTex
titre
The Replacement Bootstrap for Dependent Data
auteur
Amir Sani, Alessandro Lazaric, Daniil Ryabko
article
Proceedings of the IEEE International Symposium on Information Theory, Jun 2015, Hong Kong, Hong Kong SAR China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01144547/file/rboot_ISIT_2015.pdf BibTex
titre
Prédiction de performance sur des questions dichotomiques: comparaison de modèles pour des tests adaptatifs à grande échelle
auteur
Jill-Jênn Vie, Fabrice Popineau, Jean-Bastien Grill, Eric Bruillard, Yolaine Bourda
article
Atelier Évaluation des Apprentissages et Environnements Informatiques, EIAH 2015, Jun 2015, Agadir, Maroc
Accès au bibtex
BibTex
titre
Predicting the outcomes of every process for which an asymptotically accurate stationary predictor exists is impossible
auteur
Daniil Ryabko, Boris Ryabko
article
International Symposium on Information Theory, Jun 2015, Hong Kong, Hong Kong SAR China. pp.1204-1206
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01165876/file/stno.pdf BibTex
titre
Simultaneous Optimistic Optimization on the Noiseless BBOB Testbed
auteur
Bilel Derbel, Philippe Preux
article
The 17th IEEE Congress on Evolutionary Computation (CEC), May 2015, Sendai, Japan
Accès au bibtex
BibTex
titre
An Experimental Protocol for Analyzing the Accuracy of Software Error Impact Analysis
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
Tenth IEEE/ACM International Workshop on Automation of Software Test, May 2015, Florence, Italy. ⟨10.1109/AST.2015.20⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01120913/file/paper.pdf BibTex
titre
Black-box optimization of noisy functions with unknown smoothness
auteur
Jean-Bastien Grill, Michal Valko, Rémi Munos
article
Neural Information Processing Systems, 2015, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01222915/file/grill2015black-box.pdf BibTex
titre
Cheap Bandits
auteur
Manjesh Kumar Hanawal Hanawal, Venkatesh Saligrama, Michal Valko, Rémi Munos
article
International Conference on Machine Learning, 2015, Lille, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01153540/file/hanawal2015cheap.pdf BibTex

Habilitation à diriger des recherches

titre
Data-Driven Recommender Systems
auteur
Jérémie Mary
article
Artificial Intelligence [cs.AI]. Université de Lille 3, 2015
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01374729/file/hdr.pdf BibTex

Other publications

titre
L’apprentissage automatique : le diable n’est pas dans l’algorithme
auteur
Philippe Preux, Marc Tommasi, Thierry Viéville, Colin de La Higuera
article
2015
Accès au bibtex
BibTex

Books

titre
Proceedings of The 4th Workshop on Machine Learning for Interactive Systems (MLIS­2015)
auteur
Heriberto Cuayáhuitl, Nina Dethlefs, Lutz Frommberger, Martijn van Otterlo, Olivier Pietquin
article
, 43, 2015, JMLR Workshop and Conference Proceedings
Accès au bibtex
BibTex

Poster communications

titre
Predicting Performance over Dichotomous Questions: Comparing Models for Large-Scale Adaptive Testing
auteur
Jill-Jênn Vie, Fabrice Popineau, Jean-Bastien Grill, Eric Bruillard, Yolaine Bourda
article
8th International Conference on Educational Data Mining (EDM 2015), Jun 2015, Madrid, Spain
Accès au bibtex
BibTex

Proceedings

titre
Collaborative Filtering with Localised Ranking
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
pp.7, 2015, Proceedings of
Accès au bibtex
BibTex

Theses

titre
Sequential Resource Allocation in Linear Stochastic Bandits
auteur
Marta Soare
article
Machine Learning [cs.LG]. Université Lille 1 – Sciences et Technologies, 2015. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://hal.science/tel-01249224/file/thesis.pdf BibTex
titre
Machine Learning for Decision Making
auteur
Amir Sani
article
Machine Learning [stat.ML]. Université de Lille 1, 2015. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01256178/file/AmirSani_Thesis.pdf BibTex

Preprints, Working Papers, …

titre
A Learning Algorithm for Change Impact Prediction: Experimentation on 7 Java Applications
auteur
Vincenzo Musco, Antonin Carette, Martin Monperrus, Philippe Preux
article
2015
Accès au bibtex
https://arxiv.org/pdf/1512.07435 BibTex
titre
AUC Optimisation and Collaborative Filtering
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
2015
Accès au texte intégral et bibtex
https://hal.science/hal-01185836/file/LocalRankingArxiv.pdf BibTex

2014

Journal articles

titre
Preference-based reinforcement learning: evolutionary direct policy search using a preference-based racing algorithm
auteur
Róbert Busa-Fekete, Balázs Szörényi, Paul Weng, Weiwei Cheng, Eyke Hüllermeier
article
Machine Learning, 2014, 97 (3), pp.327-351. ⟨10.1007/s10994-014-5458-8⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079370/file/revised_1_1.pdf BibTex
titre
Efficient Eigen-updating for Spectral Graph Clustering
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
Neurocomputing, 2014, 131, pp.440-452. ⟨10.1016/j.neucom.2013.11.015⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00770889/file/TemporalClusteringArxiv.pdf BibTex
titre
An experimental comparison of four magnetocaloric regenerators using three different materials
auteur
Ulrich Legait, Frédéric Guillou, Afef Kedous-Lebouc, Vincent Hardy, Morgan Almanza
article
International Journal of Refrigeration, 2014, 37, pp.147.155. ⟨10.1016/j.ijrefrig.2013.07.006⟩
Accès au bibtex
BibTex
titre
Online Markov Decision Processes Under Bandit Feedback
auteur
Gergely Neu, András György, Csaba Szepesvári, András Antos
article
IEEE Transactions on Automatic Control, 2014, 59, pp.676 – 691. ⟨10.1109/TAC.2013.2292137⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01079422/file/NGSA14.pdf BibTex
titre
Near-Optimal Rates for Limited-Delay Universal Lossy Source Coding
auteur
András György, Gergely Neu
article
IEEE Transactions on Information Theory, 2014, pp.2823-2834. ⟨10.1109/TIT.2014.2307062⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01079327/file/quant_it_fin.pdf https://hal.science/hal-01079327/file/NGSA14.pdf BibTex
titre
Regret bounds for restless Markov bandits
auteur
Ronald Ortner, Daniil Ryabko, Peter Auer, Rémi Munos
article
Theoretical Computer Science, 2014, 558, pp.62-76. ⟨10.1016/j.tcs.2014.09.026⟩
Accès au bibtex
https://arxiv.org/pdf/1209.2693 BibTex
titre
Uniform hypothesis testing for finite-valued stationary processes
auteur
Daniil Ryabko
article
Statistics, 2014, 48 (1), pp.121-128. ⟨10.1080/02331888.2012.719511⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00610009/file/1uf_arx.pdf BibTex

Conference papers

titre
Best-Arm Identification in Linear Bandits
auteur
Marta Soare, Alessandro Lazaric, Rémi Munos
article
NIPS – Advances in Neural Information Processing Systems 27, Dec 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01075701/file/best_linear_arm.pdf BibTex
titre
Optimistic planning in Markov decision processes using a generative model
auteur
Balázs Szörényi, Gunnar Kedenburg, Rémi Munos
article
Advances in Neural Information Processing Systems 27, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079366/file/StOP_nips.pdf BibTex
titre
Exploiting easy data in online optimization
auteur
Amir Sani, Gergely Neu, Alessandro Lazaric
article
Advances in Neural Information Processing 27, Dec 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-01079428/file/SNL14.pdf BibTex
titre
Extreme bandits
auteur
Alexandra Carpentier, Michal Valko
article
Neural Information Processing Systems, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079354/file/carpentier2014extreme.pdf BibTex
titre
Efficient learning by implicit exploration in bandit problems with side observations
auteur
Tomáš Kocák, Gergely Neu, Michal Valko, Rémi Munos
article
Neural Information Processing Systems, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079351/file/kocak2014efficient.pdf BibTex
titre
Online combinatorial optimization with stochastic decision sets and adversarial losses
auteur
Gergely Neu, Michal Valko
article
Neural Information Processing Systems, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079355/file/neu2014online.pdf BibTex
titre
Sparse Multi-task Reinforcement Learning
auteur
Daniele Calandriello, Alessandro Lazaric, Marcello Restelli
article
NIPS – Advances in Neural Information Processing Systems 26, Dec 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01073513/file/sparse_mtrl_tech.pdf BibTex
titre
Difference of Convex Functions Programming for Reinforcement Learning
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
Advances in Neural Information Processing Systems (NIPS 2014), Dec 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01104419/file/5443-difference-of-convex-functions-programming-for-reinforcement-learning.pdf BibTex
titre
Subspace Identification for Predictive State Representation by Nuclear Norm Minimization
auteur
Hadrien Glaude, Cyrille Enderli, Olivier Pietquin
article
IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (ADPRL 2014), Dec 2014, Orlando, United States
Accès au bibtex
BibTex
titre
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
auteur
Ronald Ortner, Odalric-Ambrym Maillard, Daniil Ryabko
article
International Conference on Algorithmic Learning Theory (ALT), Oct 2014, Bled, Slovenia. pp.140-154
Accès au bibtex
BibTex
titre
CoAdapt P300 speller: optimized flashing sequences and online learning
auteur
Eoin Thomas, Emmanuel Daucé, Dieter Devlaminck, Loïc Mahé, Alexandra Carpentier, Rémi Munos, Margaux Perrin, Emmanuel Maby, Jérémie Mattout, Théodore Papadopoulo, Maureen Clerc
article
6th International Brain Computer Interface Conference, Sep 2014, Graz, Austria
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01103441/file/CoadaptP300.pdf BibTex
titre
Predicting when to laugh with structured classification
auteur
Bilal Piot, Olivier Pietquin, Matthieu Geist
article
InterSpeech 2014, Sep 2014, Singapore, Singapore. pp.1786-1790
Accès au texte intégral et bibtex
https://centralesupelec.hal.science/hal-01104739/file/supelec887.pdf BibTex
titre
A diffusion strategy for distributed dictionary learning
auteur
Pierre Chainais, Cédric Richard
article
2nd “international Traveling Workshop on Interactions between Sparse models and Technology” (iTWIST’14), Laurent Jacques, Aug 2014, Namur, Belgium
Accès au texte intégral et bibtex
https://hal.science/hal-01104781/file/Chainais_itwist14_paper.pdf BibTex
titre
Biclique Coverings, Rectifier Networks and the Cost of ε-Removal
auteur
Szabolcs Iván, Ádám Lelkes, Judit Nagy-György, Balázs Szörényi, György Turán
article
16th International Workshop on Descriptional Complexity of Formal Systems, Proceedings, Aug 2014, Turku, Finland. pp.174 – 185, ⟨10.1007/978-3-319-09704-6_16⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079368/file/1406.0017v1.pdf BibTex
titre
Spectral Bandits for Smooth Graph Functions with Applications in Recommender Systems
auteur
Tomáš Kocák, Michal Valko, Rémi Munos, Branislav Kveton, Shipra Agrawal
article
AAAI Workshop on Sequential Decision-Making with Big Data, Jul 2014, Québec City, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01045036/file/Spectral_Bandits.pdf BibTex
titre
PAC Rank Elicitation through Adaptive Sampling of Stochastic Pairwise Preferences
auteur
Róbert Busa-Fekete, Balázs Szörényi, Eyke Hüllermeier
article
28th AAAI Conference on Artificial Intelligence (AAAI-14), Jul 2014, Quebec City, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079283/file/aaai_2014_auth_2.pdf BibTex
titre
Spectral Thompson Sampling
auteur
Tomáš Kocák, Michal Valko, Rémi Munos, Shipra Agrawal
article
AAAI Conference on Artificial Intelligence, Jul 2014, Québec City, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00981575/file/kocak2014spectral.pdf BibTex
titre
Bandits attack function optimization
auteur
Philippe Preux, Rémi Munos, Michal Valko
article
IEEE Congress on Evolutionary Computation, Jul 2014, Beijing, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00978637/file/preux2014bandits.pdf BibTex
titre
Benthic sensitive habitat mapping: a new tool for ecosystem management ?
auteur
Aurélie Foveau, Sandrine Vaz, Nicolas Desroy, Vladimir E. Kostylev, Jean-Claude Dauvin, André Carpentier
article
Forum TransChannel ‘Science and Governance of the Channel Marine Ecosystem, Jul 2014, Caen, France
Accès au bibtex
BibTex
titre
Improving offline evaluation of contextual bandit algorithms via bootstrapping techniques
auteur
Olivier Nicol, Jérémie Mary, Philippe Preux
article
International Conference on Machine Learning, Jun 2014, Beijing, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00990840/file/Improving-offline-evaluation-of-contextual-bandit-algorithms-via-bootstrapping-techniques.pdf BibTex
titre
Preference-Based Rank Elicitation using Statistical Models: The Case of Mallows
auteur
Róbert Busa-Fekete, Eyke Hüllermeier, Balázs Szörényi
article
Proceedings of The 31st International Conference on Machine Learning, Jun 2014, Beijing, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01079369/file/BuHuSz14.pdf BibTex
titre
Online Stochastic Optimization under Correlated Bandit Feedback
auteur
Mohammad Gheshlaghi Azar, Alessandro Lazaric, Emma Brunskill
article
31st International Conference on Machine Learning, Jun 2014, Beijing, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01080138/file/paper%20%281%29.pdf BibTex
titre
Asymptotically consistent estimation of the number of change points in highly dependent time series
auteur
Azadeh Khaleghi, Daniil Ryabko
article
International Conference on Machine Learning (ICML), Jun 2014, Beijing, China. pp.539-547
Accès au bibtex
BibTex
titre
Spectral Bandits for Smooth Graph Functions
auteur
Michal Valko, Rémi Munos, Branislav Kveton, Tomáš Kocák
article
International Conference on Machine Learning, May 2014, Beijing, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00986818/file/valko2014spectral.pdf BibTex
titre
Méthode de minimisation du résidu de Bellman boostée qui tient compte des démonstrations expertes.
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA’14), May 2014, Liège, Belgique
Accès au bibtex
BibTex
titre
Quantitative control of the error bounds of a fast super-resolution technique for microscopy and astronomy
auteur
Pierre Chainais, Pierre Pfennig, Aymeric Leray
article
Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), May 2014, Florence, Italy. pp.2853 – 2857, ⟨10.1109/ICASSP.2014.6854121⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01081402/file/chainais_pfennig_icassp2014_FINAL.pdf BibTex
titre
Online Matrix Completion Through Nuclear Norm Regularisation
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
SDM – SIAM International Conference on Data Mining, Apr 2014, Philadelphia, United States. ⟨10.1137/1.9781611973440.72⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00926605/file/MatrixCompletionArxiv.pdf BibTex
titre
Evidence build-up facilitates on-line adaptivity in dynamic environments: example of the BCI P300-speller
auteur
Emmanuel Daucé, Eoin Thomas
article
22nd European Symposium on Artificial Neural Networks, Apr 2014, Bruges, Belgium
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01104024/file/es2014-188.pdf BibTex
titre
Synthèse en espace et temps du rayonnement acoustique d’une paroi sous excitation turbulente par synthèse spectrale 2D+T et formulation vibro-acoustique directe
auteur
Marc Pachebat, Nicolas Totaro, Pierre Chainais, Olivier Collery
article
Congrès Français d’acoustique 2014, Apr 2014, Poitiers, France. 6 p., p1921, papier N183
Accès au texte intégral et bibtex
https://hal.science/hal-01058151/file/CFA_2014_000183NversionAuteur.pdf BibTex
titre
MESSI: Maximum Entropy Semi-Supervised Inverse Reinforcement Learning
auteur
Julien Audiffren, Michal Valko, Alessandro Lazaric, Mohammad Ghavamzadeh
article
NIPS Workshop on Novel Trends and Applications in Reinforcement Learning, 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01177446/file/audiffren2014messi.pdf BibTex

Other publications

titre
User Engagement as Evaluation: a Ranking or a Regression Problem?
auteur
Frédéric Guillou, Romaric Gaudel, Jérémie Mary, Philippe Preux
article
2014, ⟨10.1145/2668067.2668073⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01077986/file/Paper%20Recsys.pdf BibTex

Reports

titre
Bandits Warm-up Cold Recommender Systems
auteur
Jérémie Mary, Romaric Gaudel, Philippe Preux
article
[Research Report] RR-8563, INRIA Lille; INRIA. 2014, pp.18
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01022628/file/RR-8563.pdf BibTex
titre
From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning
auteur
Rémi Munos
article
2014
Accès au texte intégral et bibtex
https://hal.science/hal-00747575/file/FTML2014.pdf BibTex
titre
A Generative Model of Software Dependency Graphs to Better Understand Software Evolution
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
[Technical Report] hal-01078716, Inria. 2014
Accès au bibtex
https://arxiv.org/pdf/1410.7921 BibTex

Theses

titre
Data-driven evaluation of Contextual Bandit algorithms and applications to Dynamic Recommendation
auteur
Olivier Nicol
article
Machine Learning [stat.ML]. Université de Lille I, 2014. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01297407/file/phd_nicol.pdf BibTex
titre
Mining Software Engineering Data for Useful Knowledge
auteur
Boris Baldassari
article
Machine Learning [stat.ML]. Université de Lille, 2014. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01297400/file/phd_baldassari.pdf BibTex
titre
Budgeted Classification-based Policy Iteration
auteur
Victor Gabillon
article
Machine Learning [stat.ML]. Universite Lille 1, 2014. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01297386/file/phd_gabillon.pdf BibTex

2013

Journal articles

titre
Kullback-Leibler Upper Confidence Bounds for Optimal Sequential Allocation
auteur
Olivier Cappé, Aurélien Garivier, Odalric-Ambrym Maillard, Rémi Munos, Gilles Stoltz
article
Annals of Statistics, 2013, 41 (3), pp.1516-1541. ⟨10.1214/13-AOS1119⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00738209/file/klucb.pdf BibTex
titre
Outlier detection for patient monitoring and alerting
auteur
Milos Hauskrecht, Iyad Batal, Michal Valko, Shyam Visweswaran, Gregory F Cooper, Gilles Clermont
article
Journal of Biomedical Informatics, 2013, 46, pp.47-55. ⟨10.1016/j.jbi.2012.08.004⟩
Accès au bibtex
BibTex
titre
Automatic motor task selection via a bandit algorithm for a brain-controlled button
auteur
Joan Fruitet, Alexandra Carpentier, Rémi Munos, Maureen Clerc
article
Journal of Neural Engineering, 2013, 10 (1), ⟨10.1088/1741-2560/10/1/016012⟩
Accès au bibtex
BibTex
titre
A confidence-set approach to signal denoising
auteur
Boris Ryabko, Daniil Ryabko
article
Statistical Methodology, 2013, 15, pp.115–120. ⟨10.1016/j.stamet.2013.05.003⟩
Accès au bibtex
BibTex
titre
A Binary-Classification-Based Metric between Time-Series Distributions and Its Use in Statistical and Learning Problems
auteur
Daniil Ryabko, Jérémie Mary
article
Journal of Machine Learning Research, 2013, 14, pp.2837-2856
Accès au bibtex
BibTex
titre
Minimax PAC bounds on the sample complexity of reinforcement learning with a generative model
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Hilbert Kappen
article
Machine Learning, 2013, 91 (3), pp.325-349. ⟨10.1007/s10994-013-5368-1⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00831875/file/SampCompRL_MLJ2012.pdf BibTex

Conference papers

titre
Learning a common dictionary over a sensor network
auteur
Pierre Chainais, Cédric Richard
article
CAMSAP 2013, Dec 2013, Saint-Martin, France. pp.1-4
Accès au texte intégral et bibtex
https://hal.science/hal-00923742/file/camsap2013_DicoLearn_final.pdf BibTex
titre
Thompson Sampling for one-dimensial exponential family bandits
auteur
Nathaniel Korda, Emilie Kaufmann, Rémi Munos
article
NIPS 2013 – Neural Information Processing Systems Conference, Dec 2013, Lake Tahoe, United States
Accès au bibtex
BibTex
titre
Approximate Dynamic Programming Finally Performs Well in the Game of Tetris
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Bruno Scherrer
article
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921250/file/tetris.pdf BibTex
titre
Online Learning in Episodic Markovian Decision Processes by Relative Entropy Policy Search
auteur
Alexander Zimin, Gergely Neu
article
Neural Information Processing Systems 26, Dec 2013, Lake Tahoe, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01079423/file/ZN13.pdf BibTex
titre
Sequential Transfer in Multi-armed Bandit with Finite Set of Models
auteur
Mohammad Gheshlaghi Azar, Alessandro Lazaric, Emma Brunskill
article
NIPS – Advances in Neural Information Processing Systems 25 – 2013, Dec 2013, Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00924025/file/transfer-bandit.pdf BibTex
titre
Optimizing P300-speller sequences by RIP-ping groups apart
auteur
Eoin M. Thomas, Maureen Clerc, Alexandra Carpentier, Emmanuel Daucé, Dieter Devlaminck, Rémi Munos
article
IEEE/EMBS 6th international conference on neural engineering (2013), IEEE/EMBS, Nov 2013, San Diego, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00907781/file/0125_MS_revised.pdf BibTex
titre
Quantification adaptative pour la stéganalyse d’images texturées
auteur
Emmanuel Zidel – Cauffet, Patrick Bas, Pierre Chainais
article
GRETSI 2013, Sep 2013, Brest, France
Accès au texte intégral et bibtex
https://hal.science/hal-00868550/file/gretsi_article_AfterDeadLine.pdf BibTex
titre
Regret Bounds for Reinforcement Learning with Policy Advice
auteur
Mohammad Gheshlaghi Azar, Alessandro Lazaric, Emma Brunskill
article
ECML/PKDD – European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, Sep 2013, Prague, Czech Republic
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00924021/file/RLPAcr.pdf BibTex
titre
Finite-Time Analysis of Kernelised Contextual Bandits
auteur
Michal Valko, Nathan Korda, Rémi Munos, Ilias Flaounas, Nello Cristianini
article
Uncertainty in Artificial Intelligence, Jul 2013, Bellevue, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00826946/file/paper.pdf BibTex
titre
Distributed dictionary learning over a sensor network
auteur
Pierre Chainais, Cédric Richard
article
CaP 2013, Jul 2013, Villeneuve d’Ascq, France. pp.1-4
Accès au texte intégral et bibtex
https://hal.science/hal-00923741/file/distrib_dico_learning_cap2013_final.pdf BibTex
titre
Cost-sensitive Multiclass Classification Risk Bounds
auteur
Bernardo Avila Pires, Mohammad Ghavamzadeh, Csaba Szepesvari
article
International Conference on Machine Learning, Jun 2013, Atlanta, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00840485/file/icml2013multiclass.pdf BibTex
titre
Gossip-based distributed stochastic bandit algorithms
auteur
Balázs Szorenyi, Róbert Busa-Fekete, Istvan Hegedüs, Róbert Ormandi, Márk Jelasity, Balázs Kégl
article
ICML 2013 – 30th International Conference on Machine Learning, Jun 2013, Atlanta, United States. pp.19-27
Accès au texte intégral et bibtex
https://in2p3.hal.science/in2p3-00907406/file/szorenyi13.pdf BibTex
titre
Stochastic Simultaneous Optimistic Optimization
auteur
Michal Valko, Alexandra Carpentier, Rémi Munos
article
International Conference on Machine Learning, Jun 2013, Atlanta, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00789606/file/paper.pdf BibTex
titre
A Generalized Kernel Approach to Structured Output Learning
auteur
Hachem Kadri, Mohammad Ghavamzadeh, Philippe Preux
article
International Conference on Machine Learning (ICML), Jun 2013, Atlanta, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00695631/file/Struct-Output-Final.pdf BibTex
titre
Learning from a Single Labeled Face and a Stream of Unlabeled Data
auteur
Branislav Kveton, Michal Valko
article
10th IEEE International Conference on Automatic Face and Gesture Recognition, Apr 2013, Shanghai, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00749197/file/kveton2013learning.pdf BibTex
titre
Optimistic planning for belief-augmented Markov decision processes
auteur
Raphael Fonteneau, Lucian Busoniu, Rémi Munos
article
IEEE International Symposium on Adaptive Dynamic Programming and reinforcement Learning, ADPRL 2013, Apr 2013, Singapour, Singapore. pp.CDROM
Accès au texte intégral et bibtex
https://hal.science/hal-00840202/file/adprl.pdf BibTex
titre
Time-series information and learning
auteur
Daniil Ryabko
article
ISIT – International Symposium on Information Theory, 2013, Istanbul, Turkey. pp.1392-1395
Accès au bibtex
BibTex
titre
Unsupervised model-free representation learning
auteur
Daniil Ryabko
article
Proc. 24th International Conf. on Algorithmic Learning Theory (ALT’13), 2013, Singapore, Singapore. pp.354-366
Accès au bibtex
BibTex
titre
Nonparametric multiple change point estimation in highly dependent time series
auteur
Azadeh Khaleghi, Daniil Ryabko
article
Proc. 24th International Conf. on Algorithmic Learning Theory (ALT’13), 2013, Singapore, Singapore. pp.382-396
Accès au bibtex
BibTex
titre
Toward optimal stratification for stratified monte-carlo integration
auteur
Alexandra Carpentier, Rémi Munos
article
International Conference on Machine Learning, 2013, United States
Accès au texte intégral et bibtex
https://hal.science/hal-00923685/file/icml13-stratMC.pdf BibTex
titre
Optimal Regret Bounds for Selecting the State Representation in Reinforcement Learning
auteur
Odalric-Ambrym Maillard, Phuong Nguyen, Ronald Ortner, Daniil Ryabko
article
ICML – 30th International Conference on Machine Learning, 2013, Atlanta, USA, United States. pp.543-551
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00778586/file/icml1_iblb_cr-corrected.pdf BibTex
titre
Thompson sampling for one-dimensional exponential family bandits
auteur
Nathaniel Korda, Emilie Kaufmann, Rémi Munos
article
Advances in Neural Information Processing Systems, 2013, United States
Accès au texte intégral et bibtex
https://hal.science/hal-00923683/file/nips13-TS.pdf BibTex
titre
Aggregating optimistic planning trees for solving markov decision processes
auteur
Gunnar Kedenburg, Raphael Fonteneau, Remi Munos
article
Advances in Neural Information Processing Systems, 2013, United States. pp.2382-2390
Accès au texte intégral et bibtex
https://hal.science/hal-00923681/file/nips13a.pdf BibTex
titre
Competing with an Infinite Set of Models in Reinforcement Learning
auteur
Phuong Nguyen, Odalric-Ambrym Maillard, Daniil Ryabko, Ronald Ortner
article
AISTATS, 2013, Arizona, United States. pp.463-471
Accès au bibtex
BibTex

Book sections

titre
A review of optimistic planning in Markov decision processes
auteur
Lucian Busoniu, Remi Munos, Robert Babuska
article
Frank Lewis and Derong Liu. Reinforcement Learning and Adaptive Dynamic Programming for Feedback Control, Wiley-IEEE Press, pp.494-516, 2013, IEEE Press Series on Computational Intelligence, 978-1-1181-0420-0
Accès au bibtex
BibTex

Reports

titre
Actor-Critic Algorithms for Risk-Sensitive MDPs
auteur
Prashanth L.A., Mohammad Ghavamzadeh
article
[Technical Report] 2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00794721/file/rs-rl-techreport.pdf BibTex

Theses

titre
On Some Unsupervised Learning Problems for Highly Dependent Time Series
auteur
Azadeh Khaleghi
article
Statistics [math.ST]. Institut national de recherche en informatique et en automatique (INRIA), 2013. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00920184/file/Thesis.pdf BibTex

2012

Journal articles

titre
Sequential approaches for learning datum-wise sparse representations
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
Machine Learning, 2012, 89 (1-2), pp.87-122. ⟨10.1007/s10994-012-5306-7⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00747724/file/versionPublieeMLJ.pdf BibTex
titre
Finite-Sample Analysis of Least-Squares Policy Iteration
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos
article
Journal of Machine Learning Research, 2012, 13, pp.3041-3074
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772060/file/lazaric12a.pdf BibTex
titre
Learning with stochastic inputs and adversarial outputs
auteur
Alessandro Lazaric, Rémi Munos
article
Journal of Computer and System Sciences, 2012, 78 (5), pp.1516-1537. ⟨10.1016/j.jcss.2011.12.027⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772046/file/00-estochad-alex.pdf BibTex
titre
Dislocation detection in field environments: A belief functions contribution
auteur
Saiedeh Razavi, Emmanuel Duflos, Carl Haas, Philippe Vanheeghe
article
Expert Systems with Applications, 2012, 39 (10), pp.8505-8513. ⟨10.1016/j.eswa.2011.12.014⟩
Accès au bibtex
BibTex
titre
Dirichlet Process Mixtures for Density Estimation in Dynamic Nonlinear Modeling: Application to GPS Positioning in Urban Canyons
auteur
Asma Rabaoui, Nicolas Viandier, Juliette Marais, Emmanuel Duflos, Philippe Vanheeghe
article
IEEE Transactions on Signal Processing, 2012, 60 (4), pp.1638 – 1655. ⟨10.1109/TSP.2011.2180901⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00712718/file/IEEE-TSP-2011-SubmitVersion.pdf BibTex
titre
Managing advertising campaigns — an approximate planning approach
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
Frontiers of Computer Science, 2012, 6 (2), pp.209-229. ⟨10.1007/s11704-012-2873-5⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00747722/file/FCS-11073.final.pdf BibTex
titre
Testing composite hypotheses about discrete ergodic processes
auteur
Daniil Ryabko
article
Test, 2012, 21 (2), pp.317-329. ⟨10.1007/s11749-011-0245-3⟩
Accès au bibtex
BibTex
titre
Linear Regression with Random Projections
auteur
Odalric Maillard, Rémi Munos
article
Journal of Machine Learning Research, 2012, 13 (1), pp.2735-2772
Accès au texte intégral et bibtex
https://hal.science/hal-00771487/file/JMLR_random_proj_2012.pdf BibTex

Conference papers

titre
Multiple Operator-valued Kernel Learning
auteur
Hachem Kadri, Alain Rakotomamonjy, Francis Bach, Philippe Preux
article
Neural Information Processing Systems (NIPS), Dec 2012, Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00677012/file/RR-7900.pdf BibTex
titre
Risk-Aversion in Multi-armed Bandits
auteur
Amir Sani, Alessandro Lazaric, Rémi Munos
article
NIPS – Twenty-Sixth Annual Conference on Neural Information Processing Systems, Dec 2012, Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772609/file/risk-bandit-cr.pdf BibTex
titre
Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Alessandro Lazaric
article
NIPS – Twenty-Sixth Annual Conference on Neural Information Processing Systems, Dec 2012, Lake Tahoe, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772615/file/nips2012l.pdf BibTex
titre
Reducing statistical time-series problems to binary classification
auteur
Daniil Ryabko, Jérémie Mary
article
NIPS, Dec 2012, Lake Tahoe, United States. pp.2069–2077
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00675637/file/red_hal2.pdf BibTex
titre
Thompson Sampling: An Asymptotically Optimal Finite Time Analysis
auteur
Emilie Kaufmann, Nathaniel Korda, Rémi Munos
article
ALT 2012 – International Conference on Algorithmic Learning Theory, Oct 2012, Lyon, France. pp.199-213, ⟨10.1007/978-3-642-34106-9_18⟩
Accès au bibtex
https://arxiv.org/pdf/1205.4217 BibTex
titre
Fast Reinforcement Learning with Large Action Sets Using Error-Correcting Output Codes for MDP Factorization
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
European Conference on Machine Learning, Sep 2012, Bristol, United Kingdom. pp.180-194, ⟨10.1007/978-3-642-33486-3_12⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00747729/file/version.officielle.Springer.pdf BibTex
titre
Towards dictionary learning from images with non Gaussian noise
auteur
Pierre Chainais
article
IEEE Int. Workshop on Machine Learning for Signal Processing, Sep 2012, Santander, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-00749035/file/MLSP2012_final_web.pdf BibTex
titre
ASYMPTOTIC STATISTICAL ANALYSIS OF STATIONARY ERGODIC TIME SERIES
auteur
Daniil Ryabko
article
WITMSE 2012, Aug 2012, Amsterdam, Netherlands
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00771128/file/stats.pdf BibTex
titre
Conservative and Greedy Approaches to Classification-based Policy Iteration
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric
article
AAAI – 26th Conference on Artificial Intelligence, Jul 2012, Toronto, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772610/file/Ghavamzadeh.pdf BibTex
titre
Semi-Supervised Apprenticeship Learning
auteur
Michal Valko, Mohammad Ghavamzadeh, Alessandro Lazaric
article
The 10th European Workshop on Reinforcement Learning (EWRL 2012), Jun 2012, Edinburgh, United Kingdom. pp.131-141
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00747921/file/valko2012semi-supervised_published.pdf BibTex
titre
A Dantzig Selector Approach to Temporal Difference Learning
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
ICML-12, Jun 2012, Edinburgh, United Kingdom. pp.1399-1406
Accès au bibtex
BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Matthieu Geist
article
29th International Conference on Machine Learning – ICML 2012, Jun 2012, Edinburgh, United Kingdom
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00758882/file/icml-short.pdf BibTex
titre
A Truthful Learning Mechanism for Contextual Multi–Slot Sponsored Search Auctions with Externalities
auteur
Nicola Gatti, Alessandro Lazaric, Francesco Trov'{o}
article
EC – 13th ACM Conference on Electronic Commerce, Jun 2012, Valencia, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772624/file/ec080-gatti.pdf BibTex
titre
Classification Localement Parcimonieuse par Méthodes Séquentielles
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
CAP 2012 – Conférence Francophone sur l’Apprentissage Automatique, May 2012, Nancy, France
Accès au bibtex
BibTex
titre
Un sélecteur de Dantzig pour l’apprentissage par différences temporelles
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes – JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00736229/file/3.pdf BibTex
titre
Approximations de l’Algorithme Itérations sur les Politiques Modifié
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes – JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p
Accès au bibtex
BibTex
titre
Apprentissage par renforcement rapide pour des grands ensembles d’actions en utilisant des codes correcteurs d’erreur
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes – JFPDA 2012, May 2012, Villers-lès-Nancy, France. 12 p
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00736322/file/2.pdf BibTex
titre
DPM pour l’inférence dans les modèles dynamiques non linéaires avec des bruits de mesure alpha-stable
auteur
Nouha Jaoua, Emmanuel Duflos, Philippe Vanheeghe
article
44ème Journées de Statistique, May 2012, Bruxelles, Belgique. pp.1-4
Accès au bibtex
BibTex
titre
Optimistic Planning for Markov Decision Processes
auteur
Lucian Busoniu, Remi Munos
article
15th International Conference on Artificial Intelligence and Statistics, AISTATS-12, Apr 2012, La Palma, Canary Islands, Spain. pp.182-189
Accès au texte intégral et bibtex
https://hal.science/hal-00756736/file/aistats12.pdf BibTex
titre
Online Clustering of Processes
auteur
Azadeh Khaleghi, Daniil Ryabko, Jérémie Mary, Philippe Preux
article
AISTATS 2012, 2012, La Palma, Spain. pp.601-609
Accès au bibtex
BibTex
titre
Regret Bounds for Restless Markov Bandits
auteur
Ronald Ortner, Daniil Ryabko, Peter Auer, Rémi Munos
article
ALT 2012, 2012, Lyon, France. pp.214–228
Accès au bibtex
BibTex
titre
On the Sample Complexity of Reinforcement Learning with a Generative Model
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Hilbert Kappen
article
International Conference on Machine Learning, 2012, United Kingdom
Accès au texte intégral et bibtex
https://hal.science/hal-00840331/file/RLcomplexity.pdf BibTex
titre
Adaptive Stratified Sampling for Monte-Carlo integration of Differentiable functions
auteur
Alexandra Carpentier, Rémi Munos
article
Advances in Neural Information Processing Systems, 2012, Lake Tahoe, United States
Accès au bibtex
BibTex
titre
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
auteur
Ronald Ortner, Daniil Ryabko
article
NIPS 2012, 2012, Lake Tahoe, United States. pp.1772–1780
Accès au bibtex
BibTex
titre
Incremental Decision Tree based on order statistics
auteur
Christophe Salperwyck, Vincent Lemaire
article
Workshop on Active and Incremental Learning (without proceedings), Vincent Lemaire, Pascal Cuxac and Jean-Charles Lamirel, 2012, Montpellier, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00758003/file/AIL_V1.4_submitted-23-07-2012.pdf BibTex
titre
Locating Changes in Highly Dependent Data with Unknown Number of Change Points
auteur
Azadeh Khaleghi, Daniil Ryabko
article
NIPS 2012, 2012, Lake Tahoe, United States. pp.3095–3103
Accès au bibtex
BibTex
titre
Bandit Algorithms boost Brain Computer Interfaces for motor-task selection of a brain-controlled button
auteur
Joan Fruitet, Alexandra Carpentier, Rémi Munos, Maureen Clerc
article
Advances in Neural Information Processing Systems, 2012, Lake Tahoe, Nevada, United States. pp.458–466
Accès au texte intégral et bibtex
https://hal.science/hal-00771495/file/NIPS.pdf BibTex

Book sections

titre
Transfer in Reinforcement Learning: a Framework and a Survey
auteur
Alessandro Lazaric
article
Marco Wiering, Martijn van Otterlo. Reinforcement Learning – State of the art, 12, Springer, pp.143-173, 2012, ⟨10.1007/978-3-642-27645-3_5⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772626/file/transfer.pdf BibTex
titre
Bayesian Reinforcement Learning
auteur
Nikos Vlassis, Mohammad Ghavamzadeh, Shie Mannor, Pascal Poupart
article
Marco Wiering and Martijn van Otterlo. Reinforcement Learning: State of the Art, Springer Verlag, 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00840479/file/BRLchapter.pdf BibTex

Reports

titre
Risk-Aversion in Multi-armed Bandits
auteur
Amir Sani, Alessandro Lazaric, Rémi Munos
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00750298/file/risk-bandit.pdf BibTex
titre
Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Alessandro Lazaric
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00747005/file/BestArm-TechnicalReport.pdf BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00697169/file/article.pdf BibTex
titre
A Truthful Learning Mechanism for Contextual Multi-Slot Sponsored Search Auctions with Externalities
auteur
Alessandro Lazaric, Nicola Gatti, Trov'{o} Francesco
article
[Research Report] 2012
Accès au bibtex
BibTex
titre
Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit
auteur
Alexandra Carpentier, Rémi Munos
article
[Technical Report] 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00659731/file/SparseBanditsAISTATS.pdf BibTex

Theses

titre
On optimal Sampling in low and high dimension
auteur
Alexandra Carpentier
article
Statistics [math.ST]. Université des Sciences et Technologie de Lille – Lille I, 2012. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00844361/file/Thesis_Carpentier.pdf BibTex
titre
Planification Optimiste pour Systèmes Déterministes
auteur
Jean-Francois Hren
article
Apprentissage [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2012. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00845898/file/thesis_Hren.pdf BibTex

Preprints, Working Papers, …

titre
On the Sample Complexity of Reinforcement Learning with a Generative Model
auteur
Mohammad Gheshlaghi Azar, Remi Munos, Bert Kappen
article
2012
Accès au bibtex
https://arxiv.org/pdf/1206.6461 BibTex
titre
Minimax Number of Strata for Online Stratified Sampling given Noisy Samples
auteur
Alexandra Carpentier, Rémi Munos
article
2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00698517/file/FixedStrata.pdf BibTex

2011

Journal articles

titre
Constructing perfect steganographic systems
auteur
Boris Ryabko, Daniil Ryabko
article
Information and Computation, 2011, 209 (9), pp.1223-1230. ⟨10.1016/j.ic.2011.06.004⟩
Accès au bibtex
https://arxiv.org/pdf/0809.1593 BibTex
titre
X-Armed Bandits
auteur
Sébastien Bubeck, Rémi Munos, Gilles Stoltz, Csaba Szepesvari
article
Journal of Machine Learning Research, 2011, 12, pp.1655-1695
Accès au texte intégral et bibtex
https://hal.science/hal-00450235/file/HOO-arXiv.pdf BibTex
titre
Pure exploration in finitely-armed and continuous-armed bandits
auteur
Gilles Stoltz, Sébastien Bubeck, Rémi Munos
article
Theoretical Computer Science, 2011, 412 (19), pp.1832-1852. ⟨10.1016/j.tcs.2010.12.059⟩
Accès au bibtex
BibTex
titre
On the relation between realizable and non-realizable cases of the sequence prediction problem
auteur
Daniil Ryabko
article
Journal of Machine Learning Research, 2011, 12, pp.2161-2180
Accès au bibtex
BibTex
titre
Identification of microbial and proteomic biomarkers in early childhood caries
auteur
Thomas C. Hart, Patricia M. Corby, Milos Hauskrecht, Ok Hee Ryu, Richard Pelikan, Michal Valko, Maria B. Oliveira, Gerald T. Hoehn, Walter A. Bretz
article
International Journal of Dentistry, 2011, 2011, pp.196721. ⟨10.1155/2011/196721⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00642074/file/hart2011indentification.pdf BibTex
titre
Aligned carbon nanotube based ultrasonic microtransducers for durability monitoring in civil engineering
auteur
Bérengère Lebental, Pierre Chainais, Pascale Chenevier, Nicolas Chevalier, Eric Delevoye, Jean-Marc Fabbri, Sergio Nicoletti, Philippe Renaux, Anne Ghis
article
Nanotechnology, 2011, 22 (39), pp.395501. ⟨10.1088/0957-4484/22/39/395501⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00707637/file/Lebental_Nanotechnology_2011.pdf BibTex

Conference papers

titre
Incremental Spectral Clustering with the Normalised Laplacian
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
DISCML – 3rd NIPS Workshop on Discrete Optimization in Machine Learning – 2011, Dec 2011, Sierra Nevada, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00745666/file/TemporalClustering.pdf BibTex
titre
Finite-Time Analysis of Stratified Sampling for Monte Carlo
auteur
Alexandra Carpentier, Rémi Munos
article
NIPS – Twenty-Fifth Annual Conference on Neural Information Processing Systems, Dec 2011, Grenade, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00636924/file/mc-ucb_3.pdf BibTex
titre
Conditional Anomaly Detection with Soft Harmonic Functions
auteur
Michal Valko, Branislav Kveton, Hamed Valizadegan, Gregory Cooper, Milos Hauskrecht
article
Proceedings of the 2011 IEEE International Conference on Data Mining, Dec 2011, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00641081/file/valko2011conditionala.pdf BibTex
titre
Transfer from Multiple MDPs
auteur
Alessandro Lazaric, Marcello Restelli
article
NIPS – Twenty-Fifth Annual Conference on Neural Information Processing Systems, Dec 2011, Granada, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772620/file/sourcetransfer.pdf BibTex
titre
Selecting the State-Representation in Reinforcement Learning
auteur
Odalric-Ambrym Maillard, Rémi Munos, Daniil Ryabko
article
Neural Information Processing Systems, Dec 2011, Granada, Spain
Accès au bibtex
BibTex
titre
CLOP: Confident Local Optimization for Noisy Black-Box Parameter Tuning
auteur
Rémi Coulom
article
Advances in Computer Games – 13th International Conference, Nov 2011, Tilburg, Netherlands. pp.146-157, ⟨10.1007/978-3-642-31866-5_13⟩
Accès au bibtex
BibTex
titre
Upper-Confidence-Bound Algorithms for Active Learning in Multi-Armed Bandits
auteur
Alexandra Carpentier, Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos, Peter Auer
article
ALT – the 22nd conference on Algorithmic Learning Theory, Oct 2011, Espoo, Finland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00659696/file/adapt_alloc_tech-report.pdf BibTex
titre
Caractérisation statistique d’une assemblée de nanotubes en imagerie microscopique
auteur
Pierre Chainais, Bérengère Lebental
article
GRETSI, Sep 2011, France. 4p
Accès au texte intégral et bibtex
https://hal.science/hal-00860839/file/doc00009389.pdf BibTex
titre
Datum-wise classification. A sequential Approach to sparsity
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
ECML PKDD 2011 – European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, Sep 2011, Athens, Greece. pp.375-390, ⟨10.1007/978-3-642-23780-5_34⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00772986/file/ecml2011.pdf BibTex
titre
A Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
auteur
Odalric-Ambrym Maillard, Rémi Munos, Gilles Stoltz
article
24th Annual Conference on Learning Theory : COLT’11, Jul 2011, Budapest, Hungary. pp.18
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00574987/file/66-Maillard-Munos-Stoltz.pdf BibTex
titre
Stumping along a Summary for Exploration & Exploitation Challenge 2011
auteur
Christophe Salperwyck, Tanguy Urvoy
article
Workshop on On-line Trading of Exploration and Exploitation 2, Jul 2011, Bellevue, Washington, United States. pp.86-97
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00757998/file/Explochallenge_JMLR_Salperwyck_Urvoy.pdf BibTex
titre
ICML Exploration & Exploitation challenge: Keep it simple!
auteur
Olivier Nicol, Jérémie Mary, Philippe Preux
article
Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2, Jul 2011, Bellevue, Washington, United States. pp.62-85
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00747725/file/nicol12a.pdf BibTex
titre
Confidence Sets in Time-Series Filtering
auteur
Boris Ryabko, Daniil Ryabko
article
IEEE International Symposium on Information Theory, Jul 2011, St. Petersburg, Russia. pp.2436-2438
Accès au bibtex
BibTex
titre
Multi-Sensor PHD by Space Partionning: Computation of a True Reference Density Within The PHD Framework
auteur
Emmanuel Delande, Emmanuel Duflos, Philippe Vanheeghe, Dominique Heurguier
article
Statistical Signal Processing Workshop (SSP), 2011, IEEE – Signal Processing Society, Jun 2011, Nice, France. pp.333 – 336, ⟨10.1109/SSP.2011.5967695⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00639710/file/SSP2011.pdf BibTex
titre
Conditional Anomaly Detection Using Soft Harmonic Functions: An Application to Clinical Alerting
auteur
Michal Valko, Hamed Valizadegan, Branislav Kveton, Gregory Cooper, Milos Hauskrecht
article
The 28th International Conference on Machine Learning Workshop on Machine Learning for Global Challenges, Jun 2011, Seattle, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00642313/file/valko2011conditional.pdf BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. pp.1049-1056
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00644935/file/dpi-critic.pdf BibTex
titre
Functional Regularized Least Squares Classi cation with Operator-valued Kernels
auteur
Hachem Kadri, Asma Rabaoui, Philippe Preux, Emmanuel Duflos, Alain Rakotomamonjy
article
28th International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. pp.993–1000
Accès au texte intégral et bibtex
https://hal.science/hal-00772406/file/FRLSC.pdf BibTex
titre
Multiple functional regression with both discrete and continuous covariates
auteur
Hachem Kadri, Philippe Preux, Emmanuel Duflos, Stéphane Canu
article
2nd International Workshop on Functional and Operatorial Statistics (IWFOS), Jun 2011, Santander, Spain. pp.189-195
Accès au texte intégral et bibtex
https://hal.science/hal-00772425/file/IWFOS2011-Kadri-FinalVersion.pdf BibTex
titre
On selecting the hyperparameters of the DPM models for the density estimation of observation errors
auteur
Asma Rabaoui, Emmanuel Duflos, Juliette Marais, Nicolas Viandier
article
International Conference on Acoustic, Speech and Signal Processing (ICASSP°, May 2011, Prague, Czech Republic. pp.4092-4095, ⟨10.1109/ICASSP.2011.5947252⟩
Accès au bibtex
BibTex
titre
Multi-Sensor PHD: Construction and Implementation by Space Partitioning
auteur
Emmanuel Delande, Emmanuel Duflos, Philippe Vanheeghe, Dominique Heurguier
article
International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. pp.3632 – 3635, ⟨10.1109/ICASSP.2011.5947137⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00639724/file/ICASSP2011.pdf BibTex
titre
Impulsive Interference Mitigation in Ad Hoc Networks Based on Alpha-Stable Modeling and Particle Filtering
auteur
Nouha Jaoua, Emmanuel Duflos, Philippe Vanheeghe, Laurent Clavier, François Septier
article
International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. pp.3548 – 3551, ⟨10.1109/ICASSP.2011.5946244⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00640682/file/ICASSP2011.pdf BibTex
titre
Learning vocal tract variables with multi-task kernels
auteur
Hachem Kadri, Emmanuel Duflos, Philippe Preux
article
36th International Conference on Acoustics, Speech and Signal Processing (ICASSP), May 2011, Prague, Czech Republic
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00826050/file/ICASSP2011.pdf BibTex
titre
Handling Expensive Optimization with Large Noise
auteur
Rémi Coulom, Philippe Rolet, Nataliya Sokolovska, Olivier Teytaud
article
Foundations of Genetic Algorithms, Jan 2011, Austria. pp.TBA
Accès au texte intégral et bibtex
https://hal.science/hal-00517157/file/foga10noise.pdf BibTex
titre
Optimistic planning for sparsely stochastic systems
auteur
Lucian Busoniu, Rémi Munos, Bart de Schutter, Robert Babuska
article
IEEE International Symposium on Adaptive Dynamic Programming and Reinforcement Learning, 2011, paris, France. pp.48-55
Accès au texte intégral et bibtex
https://hal.science/hal-00830125/file/adprl2011.pdf BibTex
titre
Speedy Q-learning
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Mohammad Ghavamzadeh, Hilbert Kappen
article
Advances in Neural Information Processing Systems, 2011, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-00830140/file/speedy-QL_nips2011.pdf BibTex
titre
Finite-sample analysis of Lasso-TD
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric, Rémi Munos, Matt Hoffman
article
International Conference on Machine Learning, 2011, United States
Accès au texte intégral et bibtex
https://hal.science/hal-00830149/file/lasso-TD.pdf BibTex
titre
Optimistic optimization of deterministic functions without the knowledge of its smoothness
auteur
Rémi Munos
article
Advances in Neural Information Processing Systems, 2011, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-00830143/file/opti2_nips2011.pdf BibTex
titre
Sparse Recovery with Brownian Sensing
auteur
Alexandra Carpentier, Odalric Maillard, Rémi Munos
article
Advances in Neural Information Processing Systems, 2011, Granada, Spain
Accès au bibtex
BibTex

Book sections

titre
Bandit view on noisy optimization
auteur
Jean-Yves Audibert, Sébastien Bubeck, Rémi Munos
article
Optimization for Machine Learning, MIT Press, pp.431-454, 2011, 978-0-262-01646-9
Accès au bibtex
BibTex
titre
Least-squares methods for policy iteration
auteur
Lucian Busoniu, Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos, Robert Babuska, Bart de Schutter
article
Reinforcement Learning: State of the Art, Springer, pp.75-109, 2011
Accès au texte intégral et bibtex
https://hal.science/hal-00830122/file/lspi_chapter.pdf BibTex

Habilitation à diriger des recherches

titre
LEARNABILITY IN PROBLEMS OF SEQUENTIAL INFERENCE
auteur
Daniil Ryabko
article
Machine Learning [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2011
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00675680/file/hdr_hal.pdf BibTex

Reports

titre
Multi-Bandit Best Arm Identification
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Alessandro Lazaric, Sébastien Bubeck
article
2011
Accès au texte intégral et bibtex
https://hal.science/hal-00632523/file/multi-bandit_techreport.pdf BibTex
titre
Reinforcement Learning with a Near Optimal Rate of Convergence
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Mohammad Ghavamzadeh, Hilbert Kappen
article
[Technical Report] 2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00636615/file/SQL_vNov19.pdf BibTex
titre
Automatic motor task selection via a bandit algorithm for a brain-controlled button
auteur
Joan Fruitet, Alexandra Carpentier, Rémi Munos, Maureen Clerc
article
[Rapport de recherche] RR-7721, INRIA. 2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00624686/file/RR-7721.pdf BibTex
titre
Transfer from Multiple MDPs
auteur
Alessandro Lazaric, Marcello Restelli
article
[Technical Report] 2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00618037/file/sourcetransfer-tech.pdf BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
2011
Accès au texte intégral et bibtex
https://hal.science/hal-00590972/file/dpi-critic-techReport.pdf BibTex
titre
Operator-Valued Kernels for Nonparametric Operator Estimation
auteur
Hachem Kadri, Philippe Preux, Emmanuel Duflos, Stephane Canu
article
[Research Report] RR-7607, INRIA. 2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00587649/file/RR-7607.pdf BibTex
titre
Adaptive Bandits: Towards the best history-dependent strategy
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
[Technical Report] 2011, pp.14
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00574999/file/AdaptiveBandits_HAL.pdf BibTex

Theses

titre
APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.
auteur
Odalric-Ambrym Maillard
article
Machine Learning [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2011. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00845410/file/thesis_Maillard.pdf BibTex
titre
Active Set Algorithms for the LASSO
auteur
Manuel Loth
article
Machine Learning [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2011. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00845441/file/thesis_Loth.pdf BibTex

Preprints, Working Papers, …

titre
Nearest Neighbor Clustering: A Baseline Method for Consistent Clustering with Arbitrary Objective Functions
auteur
Sébastien Bubeck, Ulrike von Luxburg
article
2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00185780/file/bubeck09a.pdf BibTex

2010

Journal articles

titre
Regret Bounds and Minimax Policies under Partial Monitoring
auteur
Jean-Yves Audibert, Sébastien Bubeck
article
Journal of Machine Learning Research, 2010, 11, pp.2785-2836
Accès au texte intégral et bibtex
https://enpc.hal.science/hal-00654356/file/JMLR10.pdf BibTex
titre
Discrimination between B-processes is impossible
auteur
Daniil Ryabko
article
Journal of Theoretical Probability, 2010, 23 (2), pp.565-575. ⟨10.1007/s10959-009-0263-1⟩
Accès au bibtex
BibTex
titre
Nonparametric Statistical Inference for Ergodic Processes
auteur
Daniil Ryabko, Boris Ryabko
article
IEEE Transactions on Information Theory, 2010, 56 (3), pp.1430-1435. ⟨10.1109/TIT.2009.2039169⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00269249/file/3s_fa.pdf BibTex
titre
On Finding Predictors for Arbitrary Families of Processes
auteur
Daniil Ryabko
article
Journal of Machine Learning Research, 2010, 11, pp.581-602
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00442881/file/pq3%2B.pdf BibTex

Conference papers

titre
Planning-based Approach for Optimizing the Display of Online Advertising Campaigns
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
NIPS workshop on Machine Learning in Online ADvertising, Dec 2010, Whistler, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-00772512/file/mload-2010.pdf BibTex
titre
Advertising Campaigns Management: Should We Be Greedy?
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
IEEE International Conference on Data Mining, Dec 2010, Sydney, Australia. pp.821-826
Accès au texte intégral et bibtex
https://hal.science/hal-00772447/file/icdm-2010-final.pdf BibTex
titre
The Iso-regularization Descent Algorithm for the LASSO
auteur
Manuel Loth, Philippe Preux
article
17th International Conference on Neural Information Processing, Nov 2010, Sidney, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00508257/file/master.pdf BibTex
titre
Advanced signal processing techniques for multipath mitigation in land transportation environment
auteur
Juliette Marais, Emmanuel Duflos, Nicolas Viandier, Donnay Fleury Nahimana, Asma Rabaoui
article
International IEEE Conference on Intelligent Transportation Systems (ITSC), Sep 2010, Funchal, France. pp.1480-1485, ⟨10.1109/ITSC.2010.5625065⟩
Accès au bibtex
BibTex
titre
Feature importance analysis for patient management decisions
auteur
Michal Valko, Milos Hauskrecht
article
13th International Congress on Medical Informatics MEDINFO 2010, Sep 2010, Cape Town, South Africa. pp.861-865, ⟨10.3233/978-1-60750-588-4-861⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643123/file/valko2010feature.pdf BibTex
titre
GNSS pseudorange error density tracking using Dirichlet Process Mixture
auteur
Nicolas Viandier, Asma Rabaoui, Juliette Marais, Emmanuel Duflos
article
FUSION 2010, Jul 2010, Edinburgh, United Kingdom. pp.1-7
Accès au bibtex
BibTex
titre
Open Loop Optimistic Planning
auteur
Sébastien Bubeck, Rémi Munos
article
COLT 2010 – The 23rd Conference on Learning Theory, Jun 2010, Haifa, Israel
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00943119/file/COLT10_BM.pdf BibTex
titre
Best Arm Identification in Multi-Armed Bandits
auteur
Jean-Yves Audibert, Sébastien Bubeck
article
COLT – 23th Conference on Learning Theory – 2010, Jun 2010, Haifa, Israel. 13 p
Accès au texte intégral et bibtex
https://enpc.hal.science/hal-00654404/file/COLT10.pdf BibTex
titre
Simulation-based search of combinatorial games
auteur
Lukasz Lew, Rémi Coulom
article
ICML 2010 : Workshop on Machine Learning and Games, Jun 2010, Haifa, Israel
Accès au bibtex
BibTex
titre
Analysis of a Classification-based Policy Iteration Algorithm
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Remi Munos
article
ICML – 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp.607-614
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00482065/file/dpi-jmlr.pdf BibTex
titre
Bayesian Multi-Task Reinforcement Learning
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh
article
ICML – 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp.599-606
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00475214/file/bmtl.pdf BibTex
titre
Finite-Sample Analysis of LSTD
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Remi Munos
article
ICML – 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp.615-622
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00482189/file/lstd-tech.pdf BibTex
titre
Clustering processes
auteur
Daniil Ryabko
article
27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp.919-926
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00477238/file/clust_hal.pdf BibTex
titre
Online Semi-Supervised Perception: Real-Time Learning without Explicit Feedback
auteur
Branislav Kveton, Michal Valko, Mathai Phillipose, Ling Huang
article
4th IEEE Online Learning for Computer Vision Workshop, Jun 2010, San Francisco, United States. ⟨10.1109/CVPRW.2010.5543877⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00642999/file/kveton2010online.pdf BibTex
titre
Online Semi-Supervised Learning on Quantized Graphs
auteur
Michal Valko, Branislav Kveton, Huang Ling, Ting Daniel
article
Uncertainty in Artificial Intelligence, Jun 2010, Catalina Island, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00642361/file/valko2010online.pdf BibTex
titre
Semi-Supervised Learning with Max-Margin Graph Cuts
auteur
Branislav Kveton, Michal Valko, Ali Rahimi, Ling Huang
article
International Conference on Artificial Intelligence and Statistics, May 2010, Chia Laguna, Sardinia, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00642891/file/kveton2010semi-supervised.pdf BibTex
titre
Studies on DPM for the density estimation of pseudorange noises and evaluations on real data
auteur
Juliette Marais, Asma Rabaoui, Emmanuel Duflos
article
Position Location and Navigation Symposium (PLANS), 2010 IEEE/ION, May 2010, Indian Wells, CA, USA, United States. pp.1154-1161, ⟨10.1109/PLANS.2010.5507234⟩
Accès au bibtex
BibTex
titre
Belief Function Based Algorithm for Material Detection and Tracking in Construction
auteur
Emmanuel Duflos, Philippe Vanheeghe, Saiedeh Razavi, Carl Haas
article
BELIEF 2010 : Workshop on the Theory of Belief Functions, Apr 2010, Brest, France. CDROM – 6 p
Accès au bibtex
BibTex
titre
Affichage de publicités sur des portails web
auteur
Victor Gabillon, Jérémie Mary, Philippe Preux
article
Extraction, Gestion des Connaissances (EGC), Jan 2010, Tunisie. pp.110-120
Accès au texte intégral et bibtex
https://hal.science/hal-00772531/file/egc-2010.fr.pdf BibTex
titre
Error propagation for approximate policy and value iteration
auteur
Amir Massoud Farahmand, Rémi Munos, Csaba Szepesvari
article
Advances in Neural Information Processing Systems, 2010, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-00830154/file/error_prop_nips2010.pdf BibTex
titre
Online Learning in Adversarial Lipschitz Environments
auteur
Odalric Maillard, Rémi Munos
article
European Conference on Machine Learing, 2010, Barcelone, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00510674/file/ALF_ecml10.pdf BibTex
titre
Scrambled Objects for Least-Squares Regression
auteur
Odalric Maillard, Rémi Munos
article
Advances in Neural Information Processing Systems, 2010, Granada, Spain
Accès au bibtex
BibTex
titre
Finite-Sample Analysis of Bellman Residual Minimization
auteur
Odalric-Ambrym Maillard, Rémi Munos, Alessandro Lazaric, Mohammad Ghavamzadeh
article
Asian Conference on Machine Learning, 2010, Japan
Accès au texte intégral et bibtex
https://hal.science/hal-00830212/file/brm_acml2010.pdf BibTex
titre
Nonlinear functional regression: a functional RKHS approach
auteur
Hachem Kadri, Emmanuel Duflos, Philippe Preux, Stephane Canu, Manuel Davy
article
Thirteenth International Conference on Artificial Intelligence and Statistics (AISTATS’10), 2010, Italy. pp.374-380
Accès au texte intégral et bibtex
https://hal.science/hal-00510411/file/HK_AISTATS2010.pdf BibTex
titre
Sequence prediction in realizable and non-realizable cases
auteur
Daniil Ryabko
article
Conference on Learning Theory, 2010, Haifa, Israel. pp.119-131
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00440669/file/pqout.pdf BibTex
titre
LSTD with Random Projections
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric, Odalric Maillard, Rémi Munos
article
Advances in Neural Information Processing Systems, 2010, Granada, Spain
Accès au bibtex
BibTex
titre
Testing composite hypotheses about discrete-valued stationary processes
auteur
Daniil Ryabko
article
IEEE Information Theory Workshop, 2010, Cairo, Egypt. pp.291-295
Accès au bibtex
BibTex

Book sections

titre
Approximate Dynamic Programming
auteur
Rémi Munos
article
Olivier Sigaud and Olivier Buffet. Markov Decision Processes in Artificial Intelligence, ISTE Ltd and John Wiley & Sons Inc, pp.67–98, 2010
Accès au bibtex
BibTex
titre
A comparison of two machine learning approaches for Photometric Solids Compression
auteur
Delepoulle Samuel, François Rouselle, Renaud Christophe, Philippe Preux
article
Plemenos, Dimitri; Miaoulis, Georgios. Intelligent Computer Graphics, 321, Springer, pp.145-164, 2010, Studies in Computational Intelligence
Accès au bibtex
BibTex
titre
Robust Unsupervised Speaker Segmentation for Audio Diarization
auteur
Kadri Hachem, Manuel Davy, Noureddine Ellouze
article
Signal Processing, INTECH, pp.307-320, 2010
Accès au texte intégral et bibtex
https://hal.science/hal-00510406/file/HK_Intech_BookChapter.pdf BibTex

Documents associated with scientific events

titre
Finite sample analysis of Least Squares Temporal Differences
auteur
Rémi Munos
article
Journées MAS et Journée en l’honneur de Jacques Neveu, Aug 2010, Talence, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00510324/file/REN-Munos.pdf BibTex

Reports

titre
Linear regression with random projections
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
[Technical Report] 2010, pp.22
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00483014/file/jmlr_blsr.pdf BibTex
titre
LSPI with Random Projections
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric, Odalric Maillard, Rémi Munos
article
[Technical Report] 2010
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00530762/file/randproj-lspi.pdf BibTex
titre
Finite-Sample Analysis of Least-Squares Policy Iteration
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos
article
[Technical Report] 2010
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00528596/file/lspi-jmlr.pdf BibTex
titre
Advertising Campaigns Management: Should We Be Greedy?
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
[Research Report] RR-7388, INRIA. 2010, pp.27
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00519694/file/RR-7388.pdf BibTex
titre
Multi-target PHD filtering: proposition of extensions to the multi-sensor case
auteur
Emmanuel Delande, Emmanuel Duflos, Dominique Heurguier, Philippe Vanheeghe
article
[Research Report] RR-7337, INRIA. 2010, pp.64
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00501502/file/PHD-21-12-10.pdf BibTex
titre
Brownian Motions and Scrambled Wavelets for Least-Squares Regression
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
[Technical Report] 2010, pp.13
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00483017/file/blsr.pdf BibTex

Theses

titre
Bandits Games and Clustering Foundations
auteur
Sébastien Bubeck
article
Statistics [math.ST]. Université des Sciences et Technologie de Lille – Lille I, 2010. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00845565/file/thesis_Bubeck.pdf BibTex

Preprints, Working Papers, …

titre
Pure Exploration for Multi-Armed Bandit Problems
auteur
Sébastien Bubeck, Rémi Munos, Gilles Stoltz
article
2010
Accès au texte intégral et bibtex
https://hal.science/hal-00257454/file/BMS--TCS09.pdf BibTex

2009

Journal articles

titre
Natural Actor-Critic Algorithms
auteur
Shalabh Bhatnagar, Richard Sutton, Mohammad Ghavamzadeh, Mark Lee
article
Automatica, 2009, 45 (11), ⟨10.1016/j.automatica.2009.07.008⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00840470/file/tr-final.pdf BibTex
titre
Radar Optimal Times Detection Allocation in Multitarget Environment
auteur
Marie de Vilmorin, Emmanuel Duflos, Philippe Vanheeghe
article
IEEE Systems Journal, 2009, Systems Journal, IEEE, 3 (2), pp.210-220. ⟨10.1109/JSYST.2009.2017393⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00448956/file/article.pdf BibTex
titre
Le jeu de go et la révolution de Monte Carlo
auteur
Rémi Coulom
article
Interstices, 2009
Accès au bibtex
BibTex
titre
Asymptotically Optimal Perfect Steganographic Systems
auteur
Boris Ryabko, Daniil Ryabko
article
Problems of Information Transmission, 2009, 45 (2), pp.184-190. ⟨10.1134/S0032946009020094⟩
Accès au bibtex
BibTex
titre
Exploration-exploitation tradeoff using variance estimates in multi-armed bandits
auteur
Jean-Yves Audibert, Remi Munos, Csaba Szepesvari
article
Theoretical Computer Science, 2009, 410 (19), pp.1876–1902. ⟨10.1016/j.tcs.2009.01.016⟩
Accès au bibtex
BibTex
titre
Using Data Compressors to Construct Rank Tests
auteur
Daniil Ryabko, Juergen Schmidhuber
article
Applied Mathematics Letters, 2009, 22 (7), pp.1029-1032
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00269225/file/tests.pdf BibTex
titre
Multifractal Random Walks as Fractional Wiener Integrals
auteur
Patrice Abry, Pierre Chainais, Laure Coutin, Vladas Pipiras
article
IEEE Transactions on Information Theory, 2009, 55 (8), pp.3825-3846. ⟨10.1109/TIT.2009.2023708⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00808604/file/multifractal-fbm-rev14.pdf BibTex

Conference papers

titre
ECON: a Kernel Basis Pursuit Algorithm with Automatic Feature Parameter Tuning, and its Application to Photometric Solids Approximation
auteur
Loth Manuel, Preux Philippe, Delepoulle Samuel, Renaud Christophe
article
International Conference on Machine Learning and Applications, Dec 2009, Miami, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00430578/file/icmla2009.pdf BibTex
titre
Compressed Least-Squares Regression
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
NIPS 2009, Dec 2009, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00419210/file/cls_nips.pdf BibTex
titre
On the use of Dirichlet process mixtures for the modelling of pseudorange errors in multi-constellation based localisation
auteur
Asma Rabaoui, Nicolas Viandier, Juliette Marais, Emmanuel Duflos
article
International Conference on Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp.465-470, ⟨10.1109/ITST.2009.5399308⟩
Accès au bibtex
BibTex
titre
Enhancement of Galileo and multi-constellation accuracy by modeling pseudorange noises
auteur
Nicolas Viandier, Asma Rabaoui, Juliette Marais, Emmanuel Duflos
article
Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp.459-464, ⟨10.1109/ITST.2009.5399311⟩
Accès au bibtex
BibTex
titre
Real world implementation of belief function theory to detect dislocation of materials in construction
auteur
Saiedeh Razavi, Carl Haas, Philippe Vanheeghe, Emmanuel Duflos
article
FUSION 2009, Jul 2009, Seattle, WA, United States. pp.748-755
Accès au bibtex
BibTex
titre
Hybrid Stochastic-Adversarial On-line Learning
auteur
Lazaric Alessandro, Rémi Munos
article
COLT 2009 – 22nd Conference on Learning Theory, Jun 2009, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00392524/file/estochad.pdf BibTex
titre
Minimax policies for adversarial and stochastic bandits
auteur
Jean-Yves Audibert, Sébastien Bubeck
article
COLT, Jun 2009, Montreal, Canada. pp.217-226
Accès au texte intégral et bibtex
https://enpc.hal.science/hal-00834882/file/COLT09a.pdf BibTex
titre
Feature Discovery in Approximate Dynamic Programming
auteur
Philippe Preux, Sertan Girgin, Manuel Loth
article
Approximate Dynamic Programming and Reinforcement Learning, Mar 2009, Nashville, United States
Accès au bibtex
BibTex
titre
Characterizing predictable classes of processes
auteur
Daniil Ryabko
article
UAI, 2009, Montreal, Canada. pp.471-478
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00388523/file/pq3_a.pdf BibTex
titre
Sensitivity analysis in HMMs with application to likelihood maximization
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
Advances in Neural Information Processing Systems, 2009, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-00830166/file/sensitivity_HMM_nips09.pdf BibTex
titre
Using Kolmogorov Complexity for Understanding Some Limitations on Steganography
auteur
Boris Ryabko, Daniil Ryabko
article
IEEE International Symposium on Information Theory, 2009, seoul, South Korea. pp.2733-2736
Accès au bibtex
BibTex
titre
An impossibility result for process discrimination
auteur
Daniil Ryabko
article
International Symposium on Information Theory, IEEE, 2009, Seoul, South Korea. pp.1734-1738
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00319076/file/discr.pdf BibTex

Book sections

titre
Light Source Storage and Interpolation for Global Illumination: a neural solution
auteur
Delepoulle Samuel, Renaud Christophe, Philippe Preux
article
Dimitri Plemenos, Georgios Miaoulis. Intelligent Computer Graphics, 240, Springer, pp.87-104, 2009, Studies in Computational Intelligence
Accès au bibtex
BibTex

Books

titre
Recent Advances in Reinforcement Learning
auteur
Sertan Girgin, Manuel Loth, Rémi Munos, Philippe Preux, Daniil Ryabko
article
Springer, Lectures Notes in Artificial Intelligence (LNAI), vol. 5323, pp.281, 2009
Accès au bibtex
BibTex

Reports

titre
A criterion for hypothesis testing for stationary processes
auteur
Daniil Ryabko
article
[Research Report] INRIA Lille. 2009
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00389689/file/1cf.pdf BibTex
titre
General Framework for Nonlinear Functional Regression with Reproducing Kernel Hilbert Spaces
auteur
Hachem Kadri, Emmanuel Duflos, Manuel Davy, Philippe Preux, Stephane Canu
article
[Research Report] RR-6908, INRIA. 2009
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00378381/file/RR-6908.pdf BibTex

2008

Journal articles

titre
Using One-Class SVMs and Wavelets for Audio Surveillance
auteur
Asma Rabaoui, Manuel Davy, Stéphane Rossignol, Noureddine Ellouze
article
IEEE Transactions on Information Forensics and Security, 2008, 3 (4), pp.763-775. ⟨10.1109/TIFS.2008.2008216⟩
Accès au bibtex
BibTex
titre
On the Possibility of Learning in Reactive Environments with Arbitrary Dependence
auteur
Daniil Ryabko, Marcus Hutter
article
Theoretical Computer Science, 2008, 405 (3), pp.274-284. ⟨10.1016/j.tcs.2008.06.039⟩
Accès au bibtex
https://arxiv.org/pdf/0810.5636 BibTex
titre
Least committed basic belief density induced by a multivariate Gaussian: Formulation with applications
auteur
Francois Caron, Branko Ristic, Emmanuel Duflos, Philippe Vanheeghe
article
International Journal of Approximate Reasoning, 2008, 48 (2), pp.419-436. ⟨10.1016/j.ijar.2006.10.003⟩
Accès au bibtex
BibTex
titre
Predicting Non-Stationary Processes
auteur
Daniil Ryabko, Marcus Hutter
article
Applied Mathematics Letters, 2008, 21 (5), pp.477-482. ⟨10.1016/j.aml.2007.04.004⟩
Accès au bibtex
BibTex
titre
Bayesian Inference for Linear Dynamic Models with Dirichlet Process Mixtures
auteur
François Caron, Manuel Davy, Arnaud Doucet, Emmanuel Duflos, Philippe Vanheeghe
article
IEEE Transactions on Signal Processing, 2008, 56 (1), pp.71-84. ⟨10.1109/TSP.2007.900167⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00129646/file/IEEESP06R3.pdf BibTex
titre
Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
auteur
Andras Antos, Csaba Szepesvari, Rémi Munos
article
Machine Learning, 2008, 71, pp.89-129. ⟨10.1007/s10994-007-5038-2⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00830201/file/sapi_MLJ08.pdf BibTex

Conference papers

titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
auteur
Sertan Girgin, Philippe Preux
article
8th International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. pp.75-82
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00356262/file/icmla08.pdf BibTex
titre
Online Optimization in X-Armed Bandits
auteur
Sébastien Bubeck, Rémi Munos, Gilles Stoltz, Csaba Szepesvari
article
Twenty-Second Annual Conference on Neural Information Processing Systems, Dec 2008, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00329797/file/HOO_non-anonymous.pdf BibTex
titre
Basis Function Construction in Reinforcement Learning using Cascade-Correlation Learning Architecture
auteur
Sertan Girgin, Philippe Preux
article
International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. pp.75-82
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00826054/file/icmla08.pdf BibTex
titre
Some sufficient conditions on an arbitrary class of stochastic processes for the existence of a predictor.
auteur
Daniil Ryabko
article
19th International Conference on Algorithmic Learning Theory, ALT 2008, Oct 2008, Budapest, Hungary. pp.169-182, ⟨10.1007/978-3-540-87987-9_17⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00347706/file/pq_.pdf BibTex
titre
Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength
auteur
Rémi Coulom
article
Computer and Games, Sep 2008, Beijing, China. pp.113–124
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00323349/file/WHR.pdf BibTex
titre
Conditional anomaly detection methods for patient-management alert systems
auteur
Michal Valko, Gregory F. Cooper, Amy Seybert, Shyam Visweswaran, Melissa Saul, Milos Hauskrecht
article
Workshop on Machine Learning in Health Care Applications in The 25th International Conference on Machine Learning, Jul 2008, Helsinki, Finland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643221/file/valko2008conditional.pdf BibTex
titre
Optimal Policies Search for Sensor Management
auteur
Thomas Bréhard, Emmanuel Duflos, Philippe Vanheeghe, Pierre-Arnaud Coquelin
article
FUSION 2008, Jun 2008, Cologne, Germany. pp.1 – 8
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00368875/file/Fusion2008_SensorManagement_EDuflos.pdf BibTex
titre
Optimal policies search for sensor management : Application to the ESA radar
auteur
Thomas Bréhard, Pierre-Arnaud Coquelin, Emmanuel Duflos, Philippe Vanheeghe
article
11th International Conference on Information Fusion, 2008., Jun 2008, Cologne, Germany. pp.1 – 8
Accès au bibtex
BibTex
titre
Reception State Estimation of GNSS satellites in urban environment using particle filtering
auteur
Donnay Fleury Nahimana, Emmanuel Duflos, Juliette Marais
article
FUSION 2008, Jun 2008, Cologne, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00368867/file/Paper_Fusion2008.pdf BibTex
titre
Basis Expansion in Natural Actor Critic Methods
auteur
Sertan Girgin, Philippe Preux
article
European Workshop on Reinforcement Learning, Jun 2008, Villeneuve d’Ascq, France. pp.110-123
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00826055/file/ewrl8.pdf BibTex
titre
Distance Metric Learning for Conditional Anomaly Detection
auteur
Michal Valko, Milos Hauskrecht
article
Twenty-First International Florida Artificial Intelligence Research Society Conference, May 2008, Coconut Grove, Florida, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643244/file/Valko.pdf BibTex
titre
Speech recognition with speech density estimation by the dirichlet process mixture
auteur
Kenko Ota, Emmanuel Duflos, Philippe Vanheeghe, Masuzo Yanagida
article
IEEE International Conference on Acoustics, Speech and Signal Processing, 2008. ICASSP 2008., Mar 2008, Las Vegas, United States. pp.1553 – 1556, ⟨10.1109/ICASSP.2008.4517919⟩
Accès au bibtex
BibTex
titre
Learning predictive models for combinations of heterogeneous proteomic data sources
auteur
Michal Valko, Richard Pelikan, Milos Hauskrecht
article
AMIA Summit on Translational Bioinformatics, Mar 2008, San Francisco, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643349/file/valko2008learning.pdf BibTex
titre
Infinitely many-armed bandits
auteur
Yizao Wang, Jean-Yves Audibert, Rémi Munos
article
Advances in Neural Information Processing Systems, 2008, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-00830178/file/many-armed.pdf BibTex
titre
Feature discovery in reinforcement learning using genetic programming
auteur
Sertan Girgin, Philippe Preux
article
11th European Conference on Genetic Programming (EUROGP), 2008, Naples, Italy. pp.218-229
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00826056/file/fdrl.pdf BibTex
titre
Optimistic planning of deterministic systems
auteur
Jean-Francois Hren, Rémi Munos
article
European Workshop on Reinforcement Learning, 2008, France. pp.151-164
Accès au texte intégral et bibtex
https://hal.science/hal-00830182/file/ewrl08.pdf BibTex
titre
Particle filter-based policy gradient for pomdps
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
Advances in Neural Information Processing Systems, 2008, Canada
Accès au texte intégral et bibtex
https://hal.science/hal-00830173/file/gradient_POMDP_nips08.pdf BibTex
titre
Adaptative play in texas hold’em poker
auteur
Raphael Maitrepierre, Jérémie Mary, Rémi Munos
article
European Conference on Artificial Intelligence, 2008, France
Accès au texte intégral et bibtex
https://hal.science/hal-00830189/file/poker_ecai08.pdf BibTex

Book sections

titre
Programmation dynamique avec approximation de la fonction valeur
auteur
Rémi Munos
article
Processus décisionnels de Markov et intelligence artificielle, Hermes, pp.19-50, 2008
Accès au texte intégral et bibtex
https://hal.science/hal-00830192/file/bouquinPDMIA.pdf BibTex

Reports

titre
Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs
auteur
Pierre Arnaud Coquelin, Romain Deguest, Rémi Munos
article
[Research Report] RR-6710, INRIA. 2008
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00336203/file/RR6710.pdf BibTex
titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
auteur
Sertan Girgin, Philippe Preux
article
[Research Report] RR-6505, INRIA. 2008
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00272368/file/inria.pdf BibTex
titre
The Equi-Correlation Network: a New Kernelized-LARS with Automatic Kernel Parameters Tuning
auteur
Manuel Loth, Philippe Preux
article
[Research Report] RR-6794, INRIA. 2008
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00351930/file/RR-6794.pdf BibTex

2007

Journal articles

titre
Joint Segmentation of Piecewise Constant Autoregressive Processes by Using a Hierarchical Model and a Bayesian Sampling Approach
auteur
Nicolas Dobigeon, Jean-Yves Tourneret, Manuel Davy
article
IEEE Transactions on Signal Processing, 2007, 55 (4), pp.1251-1263. ⟨10.1109/TSP.2006.889090⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04456567/file/article13.pdf BibTex
titre
Performance Bounds in $L_p$ norm for Approximate Value Iteration
auteur
Rémi Munos
article
SIAM Journal on Control and Optimization, 2007, 46 (2), pp.541-561. ⟨10.1137/040614384⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00124685/file/avi_siam_final.pdf BibTex
titre
L’Ordinateur, champion de go ?
auteur
Sylvain Gelly, Rémi Munos
article
Pour la science, 2007, 354, pp.28-35
Accès au bibtex
BibTex
titre
Analyse en norme $L_p$ de l’algorithme d’itérations sur les valeurs avec approximations
auteur
Rémi Munos
article
Revue des Sciences et Technologies de l’Information – Série RIA : Revue d’Intelligence Artificielle, 2007, 21
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00116987/file/avi_RIA_final.pdf BibTex

Conference papers

titre
Consistent Minimization of Clustering Objective Functions
auteur
Ulrike von Luxburg, Sébastien Bubeck, Stefanie Jegelka, Michael Kaufmann
article
Neural Information Processing Systems, Dec 2007, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00185777/file/LuxburgBubeckJegelka_nips07.pdf BibTex
titre
Monte-Carlo Tree Search in Crazy Stone
auteur
Rémi Coulom
article
12th Game Programming Workshop, Nov 2007, Hakone, Japan
Accès au bibtex
BibTex
titre
Computing Elo Ratings of Move Patterns in the Game of Go
auteur
Rémi Coulom
article
Computer Games Workshop, Jun 2007, Amsterdam, Netherlands
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00149859/file/MMGoPatterns.pdf BibTex
titre
A Unified View of TD Algorithms; Introducing Full-Gradient TD and Equi-Gradient Descent TD
auteur
Manuel Loth, Philippe Preux, Manuel Davy
article
European Symposium on Artificial Neural Networks, Apr 2007, Bruges, Belgium, Belgium
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00116936/file/unified.pdf BibTex
titre
A Dynamic Programming Approach to Viability Problems
auteur
Pierre-Arnaud Coquelin, Sophie Martin, Rémi Munos
article
IEEE ADPRL, IEEE Computational Intelligence Society, Apr 2007, Hawai, United States. pp.178-184
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00125423/file/viabilite.pdf BibTex
titre
Sparse Temporal Difference Learning using LASSO
auteur
Manuel Loth, Manuel Davy, Philippe Preux
article
IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, Apr 2007, Hawaï, USA, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117075/file/lassoTd.pdf BibTex
titre
Time Allocation of a Set of Radars in a Multitarget Environment
auteur
Emmanuel Duflos, Marie de Vilmorin, Philippe Vanheeghe
article
FUSION 2007, 2007, Québec, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00368905/file/fusion2007_final.pdf BibTex
titre
Value-Iteration Based Fitted Policy Iteration: Learning with a Single Trajectory
auteur
Andras Antos, Csaba Szepesvari, Rémi Munos
article
IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007, Hawai, United States. pp.2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00124833/file/sapi_adprl_final.pdf BibTex
titre
Fitted Q-iteration in continuous action-space MDPs
auteur
Andras Antos, Rémi Munos, Csaba Szepesvari
article
Neural Information Processing Systems, 2007, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00203359/file/rlca.pdf BibTex
titre
Tuning bandit algorithms in stochastic environments
auteur
Jean-Yves Audibert, Rémi Munos, Csaba Szepesvari
article
Algorithmic Learning Theory, 2007, Sendai, Japan. pp.150-165
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00203487/file/ucb_alt.pdf BibTex
titre
Bandit Algorithms for Tree Search
auteur
Pierre-Arnaud Coquelin, Rémi Munos
article
Uncertainty in Artificial Intelligence, 2007, Vancouver, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00150207/file/BAST.pdf BibTex

Reports

titre
Finite Time Bounds for Sampling-Based Fitted Value Iteration
auteur
Rémi Munos, Csaba Szepesvari
article
[Research Report] 2007, pp.46
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00120882/file/savi_1.5.pdf BibTex
titre
Optimal Policies Search for Sensor Management : Application to the AESA Radar
auteur
Thomas Bréhard, Pierre-Arnaud Coquelin, Emmanuel Duflos
article
[Research Report] RR-6361, INRIA. 2007, pp.21
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00188292/file/RR-6361.pdf BibTex
titre
Feature Discovery in Reinforcement Learning using Genetic Programming
auteur
Sertan Girgin, Philippe Preux
article
[Research Report] INRIA. 2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00187997/file/RR-6358.pdf BibTex
titre
Fitted Q-iteration in continuous action-space MDPs
auteur
Andras Antos, Rémi Munos, Csaba Szepesvari
article
[Technical Report] 2007, pp.24
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00185311/file/rlca.pdf BibTex
titre
Numerical methods for sensitivity analysis of Feynman-Kac models
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
[Research Report] 2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00125427/file/gradient.pdf BibTex
titre
Bandit Algorithms for Tree Search
auteur
Pierre-Arnaud Coquelin, Rémi Munos
article
[Research Report] RR-6141, INRIA. 2007, pp.20
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00136198/file/RR-6141.pdf BibTex

Preprints, Working Papers, …

titre
A Dynamic Programming Approach to Viability Problems
auteur
Pierre-Arnaud Coquelin, Sophie Martin, Rémi Munos
article
2007
Accès au texte intégral et bibtex
https://hal.science/hal-00125248/file/viabilite.pdf BibTex
titre
Numerical methods for sensitivity analysis of Feynman-Kac models
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
2007
Accès au texte intégral et bibtex
https://hal.science/hal-00125254/file/gradient.pdf BibTex

2006

Journal articles

titre
Numerical methods for the pricing of Swing options: a stochastic control approach
auteur
Christophe Barrera-Esteve, Florent Bergeret, Charles H Dossal, Emmanuel Gobet, Asma Meziou, Rémi Munos, Damien Reboul-Salze
article
Methodology and Computing in Applied Probability, 2006, Methodology and Computing in Applied Probability, 8 (4), pp.517-540. ⟨10.1007/s11009-006-0427-8⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117175/file/swing.pdf BibTex
titre
An Online Support Vector Machine for Abnormal Events Detection
auteur
Manuel Davy, Frederic Desobry, Arthur Gretton, Christian Doncarli
article
Signal Processing, 2006, 86 (8), pp.2009-2025. ⟨10.1016/j.sigpro.2005.09.027⟩
Accès au bibtex
BibTex
titre
Geometric Variance Reduction in Markov Chains: Application to Value Function and Gradient Estimation
auteur
Rémi Munos
article
Journal of Machine Learning Research, 2006, 7, pp.413-427
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117153/file/fast_mc_jmlr.pdf BibTex
titre
An anti-diffusive scheme for viability problems
auteur
Olivier Bokanowski, Sophie Martin, Rémi Munos, Hasnaa Zidani
article
Applied Numerical Mathematics: an IMACS journal, 2006, 56 (9), pp.1147-1162
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00112062/file/bokanowski.pdf BibTex
titre
Policy Gradient in Continuous Time
auteur
Rémi Munos
article
Journal of Machine Learning Research, 2006, 7, pp.771-791
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117152/file/munos06b.pdf BibTex
titre
Bayesian Analysis of Polyphonic western tonal Music
auteur
Manuel Davy, Simon Godsill, Jérôme Idier
article
Journal of the Acoustical Society of America, 2006, 119 (4), pp.2498-2517. ⟨10.1121/1.2168548⟩
Accès au bibtex
BibTex

Conference papers

titre
A Comparison of Chief Complaints and Emergency Department Reports for Identifying Patients with Acute Lower Respiratory Syndrome
auteur
Wendy Chapman, John Dowling, Gregory F Cooper, Milos Hauskrecht, Michal Valko
article
International Society for Disease Surveillance, Oct 2006, Baltimore, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643495/file/chapman2006comparison.pdf BibTex
titre
Equi-Gradient Temporal Difference Learning
auteur
Manuel Loth, Manuel Davy, Rémi Coulom, Philippe Preux
article
Kernel Methods and Reinforcement Learning, workshop of ICML 2006, Jun 2006, Pittsburgh, USA, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117178/file/Loth_ICML_KRL_2006.pdf BibTex
titre
Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
auteur
Andras Antos, Csaba Szepesvari, Rémi Munos
article
Conference On Learning Theory, Jun 2006, Pittsburgh, USA
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117130/file/antos-colt06.pdf BibTex
titre
Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search
auteur
Rémi Coulom
article
5th International Conference on Computer and Games, May 2006, Turin, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00116992/file/CG2006.pdf BibTex
titre
Joint segmentation of piecewise constant autoregressive processes by using a hierarchical model and a Bayesian sampling approach
auteur
Nicolas Dobigeon, Jean-Yves Tourneret, Manuel Davy
article
IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP 2006), May 2006, Toulouse, France. ⟨10.1109/ICASSP.2006.1660575⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119997/file/Dobigeon_ICASSP_2006.pdf BibTex
titre
Application des machines a vecteurs support mono-classe a l’indexation en locuteurs de documents audio
auteur
Belkacem Fergani, Manuel Davy, Amrane Houacine
article
Journees d’Etude sur la Parole 2006, 2006, Dinard, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119998/file/final-28.pdf BibTex
titre
ESTIMATION OF MINIMUM MEASURE SETS IN REPRODUCING KERNEL HILBERT SPACES AND APPLICATIONS.
auteur
Manuel Davy, Frederic Desobry, Stephane Canu
article
IEEE ICASSP 2006, 2006, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119999/file/Desobry_ICASSP_2006.pdf BibTex
titre
MAXIMUM LIKELIHOOD PARAMETER ESTIMATION FOR LATENT VARIABLE MODELS USING SEQUENTIAL MONTE CARLO
auteur
Adam Johansen, Arnaud Doucet, Manuel Davy
article
2006 IEEE International Conference on Acoustics, Speech, and Signal Processing : conference proceedings, May 14-19, 2006, Toulouse, 2006, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119988/file/Johansen_ICASSP_2006.pdf BibTex
titre
Bayesian Inference for Dynamic Models with Dirichlet Process Mixtures
auteur
Francois Caron, Manuel Davy, Arnaud Doucet, Emmanuel Duflos, Philippe Vanheeghe
article
9th IEEE International Conference on Information Fusion, 2006, Florence, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00119993/file/Caron_Fusion_2006.pdf BibTex

Book sections

titre
Feature Selection and Dimensionality Reduction in Genomics and Proteomics
auteur
Milos Hauskrecht, Richard Pelikan, Michal Valko, James Lyons-Weiler
article
Werner Dubitzky, Martin Granzow and Daniel Berrar. Fundamentals of Data Mining in Genomics and Proteomics, Springer, pp.149-172, 2006, ⟨10.1007/978-0-387-47509-7⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643496/file/chapter-Hauskrecht.pdf BibTex

Other publications

titre
Use of variance estimation in the multi-armed bandit problem
auteur
Jean-Yves Audibert, Rémi Munos, Csaba Szepesvari
article
2006
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00203496/file/ucbtuned.pdf BibTex

Books

titre
Signal Processing Methods for Music Transcription
auteur
Anssi Klapuri, Manuel Davy
article
Springer, pp.456, 2006, 0-387-30667-6
Accès au bibtex
BibTex

Reports

titre
Modification of UCT with Patterns in Monte-Carlo Go
auteur
Sylvain Gelly, Yizao Wang, Rémi Munos, Olivier Teytaud
article
[Research Report] RR-6062, INRIA. 2006
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00117266/file/RR-6062.pdf BibTex

2005

Master thesis

titre
Evolving Neural Networks for Statistical Decision Theory
auteur
Michal Valko
article
Machine Learning [stat.ML]. 2005
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00646451/file/nesdt.pdf BibTex

Comments are closed.