Publications

Publications HAL du labo/EPI SequeL

2017

Journal articles

titre
Differential Privacy for Bayesian Inference through Posterior Sampling
auteur
Christos Dimitrakakis, Blaine Nelson, Zuhe Zhang, Aikateirni Mitrokotsa, Benjamin Rubinstein
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2017, 18 (11), pp.1−39
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01500302/file/15-257.pdf BibTex

Conference papers

titre
Active Learning for Accurate Estimation of Linear Models
auteur
Carlos Riquelme, Mohammad Ghavamzadeh, Alessandro Lazaric
article
ICML 2017 – 34th International Conference on Machine Learning, Aug 2017, Sydney, Australia. pp.36
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01538762/file/active_learning_accurate_estimation_linear_models_supplementary.pdf BibTex
titre
A Multi-Armed Bandit Model Selection for Cold-Start User Recommendation
auteur
Crícia Felício, Klérisson Paixão, Celia Barcelos, Philippe Preux
article
25th ACM Conference on User Modelling, Adaptation and Personalization (UMAP), Jul 2017, Bratislava, Slovakia. 2017, <http://www.um.org/umap2017/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01517967/file/umap2017.4hal.pdf BibTex
titre
Exploration–Exploitation in MDPs with Options
auteur
Ronan Fruit, Alessandro Lazaric
article
AISTATS 2017 – 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01493567/file/main.pdf BibTex
titre
Linear Thompson Sampling Revisited
auteur
Marc Abeille, Alessandro Lazaric
article
AISTATS 2017 – 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States. 2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01493561/file/main.pdf BibTex
titre
Thompson Sampling for Linear-Quadratic Control Problems
auteur
Marc Abeille, Alessandro Lazaric
article
AISTATS 2017 – 20th International Conference on Artificial Intelligence and Statistics, Apr 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01493564/file/main.pdf BibTex
titre
Distributed adaptive sampling for kernel matrix approximation
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01482760/file/calandriello2017distributed.pdf BibTex
titre
Trading off rewards and errors in multi-armed bandits
auteur
Akram Erraqabi, Alessandro Lazaric, Michal Valko, Emma Brunskill, Yun-En Liu
article
International Conference on Artificial Intelligence and Statistics, 2017, Fort Lauderdale, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01482765/file/erraqabi2017trading.pdf BibTex
titre
Second-Order Kernel Online Convex Optimization with Adaptive Sketching
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
International Conference on Machine Learning, 2017, Sydney, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01537799/file/calandriello2017second-order.pdf BibTex
titre
Zonotope hit-and-run for efficient sampling from projection DPPs
auteur
Guillaume Gautier, Rémi Bardenet, Michal Valko
article
International Conference on Machine Learning, 2017, Sydney, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01526577/file/gautier2017zonotope.pdf BibTex

Preprints, Working Papers, …

titre
Subjective Fairness
auteur
Christos Dimitrakakis, Yang Liu, David Parkes, Goran Radanovic
article
2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01531849/file/subjective-fairness.pdf BibTex
titre
Monte-Carlo Tree Search by Best Arm Identification
auteur
Emilie Kaufmann, Wouter Koolen
article
2017
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01535907/file/mainarXiv.pdf BibTex
titre
Learning the distribution with largest mean: two bandit frameworks
auteur
Emilie Kaufmann, Aurélien Garivier
article
2017
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01449822/file/ESAIM16.pdf BibTex
titre
Multi-view Sequential Games: The Helper-Agent Problem
auteur
Christos Dimitrakakis, Firas Jarboui, David Parkes, Lior Seeman
article
2017
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01408294/file/GeneralMarkovGamesHAL.pdf BibTex

2016

Journal articles

titre
Exploiting Social Information in Pairwise Preference Recommender System
auteur
Crícia Felício, Klérisson Paixão, Guilherme Alves, Sandra De Amo, Philippe Preux
article
Journal of Information and Data Management, Brazilian Computer Society, 2016, 7 (2), pp.16
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01462200/file/1596-10577-1-PB.pdf BibTex
titre
Importance Weighting Without Importance Weights: An Efficient Algorithm for Combinatorial Semi-Bandits
auteur
Gergely Neu, Bartók Gábor
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2016, 17 (154), pp.1 – 21
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01380278/file/15-091.pdf BibTex
titre
Bayesian Policy Gradient and Actor-Critic Algorithms
auteur
Mohammad Ghavamzadeh, Yaakov Engel, Michal Valko
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2016, 17 (66), pp.1-53
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00776608/file/jmlr-BPG-BAC.pdf BibTex
titre
On the Complexity of Best Arm Identification in Multi-Armed Bandit Models
auteur
Emilie Kaufmann, Olivier Cappé, Aurélien Garivier
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2016, 17, pp.1-42
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01024894/file/kaufman15a.pdf BibTex
titre
Operator-valued Kernels for Learning from Functional Response Data
auteur
Hachem Kadri, Emmanuel Duflos, Philippe Preux, Stéphane Canu, Alain Rakotomamonjy, Julien Audiffren
article
Journal of Machine Learning Research (JMLR), 2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01221329/file/kadri15a.pdf BibTex
titre
Analysis of Classification-based Policy Iteration Algorithms
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2016, 17, pp.1 – 30
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01401513/file/10-364.pdf BibTex
titre
Consistent Algorithms for Clustering Time Series
auteur
Azadeh Khaleghi, Daniil Ryabko, Jérémie Mary, Philippe Preux
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2016, 17 (3), pp.1 – 32
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01399613/file/khaleghi16a.pdf BibTex
titre
Nonparametric multiple change point estimation in highly dependent time series
auteur
Azadeh Khaleghi, Daniil Ryabko
article
Theoretical Computer Science, Elsevier, 2016, 620, pp.119-133. <10.1016/j.tcs.2015.10.041>
Accès au bibtex
BibTex
titre
A Large-scale Study of Call Graph-based Impact Prediction using Mutation Testing
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
Software Quality Journal, Springer Verlag, 2016, <10.1007/s11219-016-9332-8>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01346046/file/papersqj.pdf BibTex

Conference papers

titre
Learning Dialogue Dynamics with the Method of Moments
auteur
Merwan Barlier, Romain Laroche, Olivier Pietquin
article
Workshop on Spoken Language Technologie (SLT 2016), Dec 2016, San Diego, United States. <http://www.slt2016.org/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01406904/file/SLT_2016_MBRLOP.pdf BibTex
titre
On Explore-Then-Commit Strategies
auteur
Aurélien Garivier, Emilie Kaufmann, Tor Lattimore
article
NIPS, Dec 2016, Barcelona, Spain. 29, 2016, Advances in Neural Information Processing Systems (NIPS)
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01322906/file/nips_final.pdf BibTex
titre
Blazing the trails before beating the path: Sample-efficient Monte-Carlo planning
auteur
Jean-Bastien Grill, Michal Valko, Rémi Munos
article
Neural Information Processing Systems, Dec 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01389107/file/grill2016blazing.pdf BibTex
titre
Preference-like Score to Cope with Cold-Start User in Recommender Systems
auteur
Crícia Felício, Klérisson Paixão, Celia Barcelos, Philippe Preux
article
28th International Conference on Tools with Artificial Intelligence (ICTAI), Nov 2016, San Jose, United States. 2016, Proceedings of the IEEE 28th International Conference on Tools with Artificial Intelligence (ICTAI)
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01390762/file/preference-score-cope.pdf BibTex
titre
A Spectral Algorithm with Additive Clustering for the Recovery of Overlapping Communities in Networks
auteur
Emilie Kaufmann, Thomas Bonald, Marc Lelarge
article
Ronald Ortner; Hans Ulrich Simon; Sandra Zilles. ALT 2016 – Algorithmic Learning Theory, Oct 2016, Bari, Italy. Springer, 9925, pp.355-370, 2016, Lecture Notes in Computer Science. <10.1007/978-3-319-46379-7_24>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01163147/file/KBL15.pdf BibTex
titre
Sequential Collaborative Ranking Using (No-)Click Implicit Feedback
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
The 23rd International Conference on Neural Information Processing (ICONIP’16), Oct 2016, Kyoto, Japan. 9948, pp.288 – 296, 2016, Lecture Notes in Computer Science. <10.1007/978-3-319-46672-9_33>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01406338/file/main.pdf BibTex
titre
Mutation-Based Graph Inference for Fault Localization
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
International Working Conference on Source Code Analysis and Manipulation, Oct 2016, Raleigh, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01350515/file/scam16.pdf BibTex
titre
Things Bayes can’t do
auteur
Daniil Ryabko
article
Proceedings of the 27th International Conference on Algorithmic Learning Theory (ALT’16), Oct 2016, Bari, Italy. LNCS ( 9925), pp.253-260, 2016, <10.1007/978-3-319-46379-7_17>
Accès au bibtex
https://arxiv.org/pdf/1610.08239 BibTex
titre
Hybrid Recommender System based on Autoencoders
auteur
Florian Strub, Romaric Gaudel, Jérémie Mary
article
the 1st Workshop on Deep Learning for Recommender Systems, Sep 2016, Boston, United States. pp.11 – 16, 2016, <10.1145/2988450.2988456>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01336912/file/AutoEnc.pdf BibTex
titre
Large-scale Bandit Recommender System
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
Pardalos, Panos M.; Conca, Piero; Giuffrida, Giovanni; Nicosia, Giuseppe. Proc. of the Second International Workshop on Machine Learning, Optimization and Big Data (MOD), Sep 2016, Volterra, Italy. Springer International Publishing, 10122, pp.11, 2016, Lecture Notes in Computer Science. <10.1007/978-3-319-51469-7_17>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01406389/file/paper32.pdf BibTex
titre
A Stochastic Model for Computer-Aided Human-Human Dialogue
auteur
Merwan Barlier, Romain Laroche, Olivier Pietquin
article
Interspeech 2016, Sep 2016, San Francisco, United States. 2016, pp.2051 – 2055, 2016, <http://www.interspeech2016.org/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01406894/file/IS_2016_MBRLOP.pdf BibTex
titre
Filtrage Collaboratif Hybride avec des Auto-encodeurs
auteur
Florian Strub, Jérémie Mary, Romaric Gaudel
article
Conférence francophone sur l’Apprentissage Automatique (CAp’16), Jul 2016, Marseille, France
Accès au bibtex
BibTex
titre
Compromis exploration-exploitation pour système de recommandation à grande échelle
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
Conférence francophone sur l’Apprentissage Automatique (CAp’16), Jul 2016, Marseille, France
Accès au bibtex
BibTex
titre
Analysis of Nyström method with sequential ridge leverage score sampling
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Uncertainty in Artificial Intelligence, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01343674/file/calandriello2016analysis.pdf BibTex
titre
Online learning with Erdős-Rényi side-observation graphs
auteur
Tomáš Kocák, Gergely Neu, Michal Valko
article
Uncertainty in Artificial Intelligence, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01320588/file/kocak2016onlinea.pdf BibTex
titre
Maximin Action Identification: A New Bandit Framework for Games
auteur
Aurélien Garivier, Emilie Kaufmann, Wouter Koolen
article
29th Annual Conference on Learning Theory (COLT), Jun 2016, New-York, United States. 49, JMLR Workshop and Conference Proceedings
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01273842/file/garivier16b.pdf BibTex
titre
Optimal Best Arm Identification with Fixed Confidence
auteur
Aurélien Garivier, Emilie Kaufmann
article
29th Annual Conference on Learning Theory (COLT), Jun 2016, New York, United States. 49, 2016, JMLR Workshop and Conference Proceedings. <http://www.learningtheory.org/colt2016/>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01273838/file/MDLBAI.pdf BibTex
titre
Softened Approximate Policy Iteration for Markov Games
auteur
Julien Pérolat, Bilal Piot, Matthieu Geist, Bruno Scherrer, Olivier Pietquin
article
ICML 2016 – 33rd International Conference on Machine Learning, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01393328/file/nmz.pdf BibTex
titre
Pliable rejection sampling
auteur
Akram Erraqabi, Michal Valko, Alexandra Carpentier, Odalric-Ambrym Maillard
article
International Conference on Machine Learning, Jun 2016, New York City, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01322168/file/erraqabi2016pliable.pdf BibTex
titre
PAC learning of Probabilistic Automaton based on the Method of Moments
auteur
Hadrien Glaude, Olivier Pietquin
article
International Conference on Machine Learning (ICML 2016), Jun 2016, New York, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01406889/file/glaude16.pdf BibTex
titre
Reinforcement Learning of POMDPs using Spectral Methods
auteur
Kamyar Azizzadenesheli, Alessandro Lazaric, Animashree Anandkumar
article
Proceedings of the 29th Annual Conference on Learning Theory (COLT2016), Jun 2016, New York City, United States. 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01322207/file/master.pdf BibTex
titre
MultiVec: a Multilingual and Multilevel Representation Learning Toolkit for NLP
auteur
Alexandre Bérard, Christophe Servan, Olivier Pietquin, Laurent Besacier
article
The 10th edition of the Language Resources and Evaluation Conference (LREC), May 2016, Portoroz, Slovenia. 2016, <http://lrec2016.lrec-conf.org/en/>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01335930/file/Berard_and_al-MultiVec_a_Multilingual_and_Multilevel_Representation-LREC2016.pdf BibTex
titre
A Learning Algorithm for Change Impact Prediction
auteur
Vincenzo Musco, Antonin Carette, Martin Monperrus, Philippe Preux
article
5th International Workshop on Realizing Artificial Intelligence Synergies in Software Engineering, May 2016, Austin, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01279620/file/main.pdf BibTex
titre
Score-based Inverse Reinforcement Learning
auteur
Layla El Asri, Bilal Piot, Matthieu Geist, Romain Laroche, Olivier Pietquin
article
International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2016), May 2016, Singapore, Singapore. <http://sis.smu.edu.sg/aamas2016>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01406886/file/aamas-score-based.pdf BibTex
titre
Online learning with noisy side observations
auteur
Tomáš Kocák, Gergely Neu, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, May 2016, Seville, Spain
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01303377/file/kocak2016online.pdf BibTex
titre
Revealing graph bandits for maximizing local influence
auteur
Alexandra Carpentier, Michal Valko
article
International Conference on Artificial Intelligence and Statistics, May 2016, Seville, Spain
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01304020/file/carpentier2016revealing.pdf BibTex
titre
On the Use of Non-Stationary Strategies for Solving Two-Player Zero-Sum Markov Games
auteur
Julien Pérolat, Bilal Piot, Bruno Scherrer, Olivier Pietquin
article
19th International Conference on Artificial Intelligence and Statistics (AISTATS 2016), May 2016, Cadiz, Spain. Proceedings of the International Conference on Artificial Intelligences and Statistics. <http://www.aistats.org/>
Accès au bibtex
BibTex
titre
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Ronald Ortner, Peter Bartlett
article
Proceedings of the 19th International Conference on Artificial Intelligence (AISTATS), May 2016, Cadiz, Spain. 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01322198/file/AISTATS_full_CR.pdf BibTex
titre
Algorithms for Differentially Private Multi-Armed Bandits
auteur
Aristide Tossou, Christos Dimitrakakis
article
AAAI 2016, Feb 2016, Phoenix, Arizona, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01234427/file/single-mab-aaai16-final.pdf BibTex
titre
On the Differential Privacy of Bayesian Inference
auteur
Zuhe Zhang, Benjamin Rubinstein, Christos Dimitrakakis
article
AAAI 2016 – Thirtieth AAAI Conference on Artificial Intelligence, Feb 2016, Phoenix, Arizona, United States. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01234215/file/HAL.pdf BibTex
titre
Compact and Interpretable Dialogue State Representation with Genetic Sparse Distributed Memory
auteur
Layla El Asri, Romain Laroche, Olivier Pietquin
article
7th International Workshop on Spoken Dialogue Systems (IWSDS 2016), Jan 2016, Saariselka, Finland. <http://www.iwsds.org/>
Accès au bibtex
BibTex
titre
Scalable explore-exploit Collaborative Filtering
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
Pacific Asia Conference on Information Systems (PACIS’16), 2016, Chiayi, Taiwan. 2016
Accès au bibtex
BibTex
titre
Pack only the essentials: Adaptive dictionary learning for kernel ridge regression
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Adaptive and Scalable Nonparametric Methods in Machine Learning at Neural Information Processing Systems, 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01482756/file/calandriello2016pack.pdf BibTex
titre
Rewards and errors in multi-arm bandits for interactive education
auteur
Akram Erraqabi, Alessandro Lazaric, Michal Valko, Emma Brunskill, Yun-En Liu
article
Challenges in Machine Learning: Gaming and Education workshop at Neural Information Processing Systems, 2016, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01482764/file/erraqabi2016rewards.pdf BibTex

Habilitation à diriger des recherches

titre
Bandits on graphs and structures
auteur
Michal Valko
article
Machine Learning [stat.ML]. École normale supérieure de Cachan – ENS Cachan, 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/tel-01359757/file/valko2016bandits.pdf BibTex

Reports

titre
Correctness Attraction: A Study of Stability of Software Behavior Under Runtime Perturbation
auteur
Benjamin Danglot, Philippe Preux, Benoit Baudry, Martin Monperrus
article
[Research Report] hal-01378523, HAL. 2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01378523/file/correctness-attraction.pdf BibTex

Theses

titre
On Recommendation Systems in a Sequential Context
auteur
Frédéric Guillou
article
Machine Learning [cs.LG]. Université Lille 3, 2016. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01407336/file/main.pdf BibTex
titre
Propagation Analysis based on Software Graphs and Synthetic Data
auteur
Vincenzo Musco
article
Software Engineering [cs.SE]. Université Lille 3, 2016. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01398903/file/dissertation_musco.pdf BibTex
titre
Méthodes des moments pour l’inférence de systèmes séquentiels linéaires rationnels
auteur
Hadrien Glaude
article
Apprentissage [cs.LG]. Université de Lille 1 – Sciences et Technologies, 2016. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01374080/file/Th%C3%A8se%20Hadrien%20Glaude.pdf BibTex

Preprints, Working Papers, …

titre
On Bayesian index policies for sequential resource allocation
auteur
Emilie Kaufmann
article
2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01251606/file/BayesianHaL.pdf BibTex
titre
Hybrid Collaborative Filtering with Autoencoders
auteur
Florian Strub, Jérémie Mary, Romaric Gaudel
article
2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01281794/file/AutoEnc.pdf BibTex
titre
Asymptotically Optimal Algorithms for Multiple Play Bandits with Partial Feedback
auteur
Alexander Luedtke, Emilie Kaufmann, Antoine Chambaz
article
2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01338733/file/combinatorial_feedback.pdf BibTex

2015

Journal articles

titre
Truthful Learning Mechanisms for Multi–Slot Sponsored Search Auctions with Externalities
auteur
Nicola Gatti, Alessandro Lazaric, Marco Rocco, Francesco Trovò
article
Artificial Intelligence, Elsevier, 2015, 227, pp.93-139
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01237670/file/main.pdf BibTex
titre
Optimism in Active Learning
auteur
Timothé Collet, Olivier Pietquin
article
Computational Intelligence and Neuroscience, Hindawi Publishing Corporation, 2015
Accès au bibtex
BibTex
titre
Random-Walk Perturbations for Online Combinatorial Optimization
auteur
Luc Devroye, Gábor Lugosi, Gergely Neu
article
IEEE Transactions on Information Theory, Institute of Electrical and Electronics Engineers, 2015, 61 (7), pp.4099 – 4106. <10.1109/TIT.2015.2428253>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01214987/file/fpl_journal_final.pdf BibTex
titre
Generalizing the Wilcoxon rank-sum test for interval data
auteur
Julien Perolat, Inés Couso, Kevin Loquin, Olivier Strauss
article
International Journal of Approximate Reasoning, Elsevier, 2015, 56, pp.108-121. <10.1016/j.ijar.2014.08.001>
Accès au bibtex
BibTex
titre
Approximate Modified Policy Iteration and its Application to the Game of Tetris
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Boris Lesner, Matthieu Geist
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2015, 16, pp.1629−1676
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01091341/file/final.pdf BibTex

Conference papers

titre
Spectral learning with proper probabilities for finite state automation
auteur
Hadrien Glaude, Cyrille Enderli, Olivier Pietquin
article
ASRU 2015 – Automatic Speech Recognition and Understanding Workshop, Dec 2015, Scottsdale, United States. IEEE, Proceedings of the Automatic Speech Recognition and Understanding Workshop. <http://www.asru2015.org/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225810/file/ASRU_2015_HGCEOP.pdf BibTex
titre
Explore no more: Improved high-probability regret bounds for non-stochastic bandits
auteur
Gergely Neu
article
Advances on Neural Information Processing Systems 28 (NIPS 2015), Dec 2015, Montreal, Canada. pp.3150-3158
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01223501/file/IX_nips_final.pdf BibTex
titre
Collaborative Filtering as a Multi-Armed Bandit
auteur
Frédéric Guillou, Romaric Gaudel, Philippe Preux
article
NIPS’15 Workshop: Machine Learning for eCommerce, Dec 2015, Montréal, Canada. <https://sites.google.com/site/nips15ecommerce/home>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01256254/file/main.pdf BibTex
titre
Bayesian Credible Intervals for Online and Active Learning of Classification Trees
auteur
Timothé Collet, Olivier Pietquin
article
ADPRL 2015 – Symposium on Adaptive Dynamic Programming and Reinforcement Learning., Dec 2015, Cape Town, South Africa. IEEE, Proceedings of the Symposium Series on Computational Intelligence. <http://ieee-ssci.org.za/ADPRL/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225850/file/ADPRL_2015_TCOP.pdf BibTex
titre
Black-box optimization of noisy functions with unknown smoothness
auteur
Jean-Bastien Grill, Michal Valko, Rémi Munos
article
Neural Information Processing Systems, Dec 2015, Montréal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01222915/file/grill2015black-box.pdf BibTex
titre
Collaborative Filtering with Stacked Denoising AutoEncoders and Sparse Inputs
auteur
Florian Strub, Jérémie Mary
article
NIPS Workshop on Machine Learning for eCommerce, Dec 2015, Montreal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01256422/file/Collaborative%20Filtering%20with%20Stacked%20Denoising%20AutoEncoders%20and%20Sparse%20Inputs.pdf BibTex
titre
Non-negative Spectral Learning for Linear Sequential Systems
auteur
Hadrien Glaude, Cyrille Enderli, Olivier Pietquin
article
22nd International Conference on Neural Information Processing (ICONIP2015), Nov 2015, Istanbul, Turkey. <http://iconip2015.org/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225838/file/ICONIP_2015_HGCEOP.pdf BibTex
titre
Optimism in Active Learning with Gaussian Processes
auteur
Timothé Collet, Olivier Pietquin
article
22nd International Conference on Neural Information Processing (ICONIP2015), Nov 2015, Istanbul, Turkey
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225826/file/ICONIP_2015_TCOP.pdf BibTex
titre
Learning of scanning strategies for electronic support using predictive state representations
auteur
Hadrien Glaude, Cyrille Enderli, Jean-François Grandin, Olivier Pietquin
article
International Workshop on Machine Learning for Signal Processing (MLSP 2015), Sep 2015, Boston, United States. 2015, Proceedings of the International Workshop on Machine Learning for Signal Processing. <http://mlsp2015.conwiz.dk/home.htm>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225807/file/MLSP_2015_HGCEJFGOP.pdf BibTex
titre
Human-Machine Dialogue as a Stochastic Game
auteur
Merwan Barlier, Julien Perolat, Romain Laroche, Olivier Pietquin
article
16th Annual SIGdial Meeting on Discourse and Dialogue (SIGDIAL 2015), Sep 2015, Prague, Czech Republic. 2015, <http://www.sigdial.org/workshops/conference16/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225848/file/W15-4602.pdf BibTex
titre
Direct Policy Iteration with Demonstrations
auteur
Jessica Chemali, Alessandro Lazaric
article
IJCAI – 24th International Joint Conference on Artificial Intelligence, Jul 2015, Buenos Aires, Argentina. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01237659/file/DPID_CameraReady.pdf BibTex
titre
Inverse Reinforcement Learning in Relational Domains
auteur
Thibaut Munzer, Bilal Piot, Matthieu Geist, Olivier Pietquin, Manuel Lopes
article
International Joint Conferences on Artificial Intelligence, Jul 2015, Buenos Aires, Argentina
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01154650/file/IJCAI2015_HAL.pdf BibTex
titre
Maximum Entropy Semi-Supervised Inverse Reinforcement Learning
auteur
Julien Audiffren, Michal Valko, Alessandro Lazaric, Mohammad Ghavamzadeh
article
International Joint Conference on Artificial Intelligence, Jul 2015, Bueons Aires, Argentina
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01146187/file/messi-TR.pdf BibTex
titre
Bandits and Recommender Systems
auteur
Jérémie Mary, Romaric Gaudel, Philippe Preux
article
First International Workshop on Machine Learning, Optimization, and Big Data (MOD’15), Jul 2015, Taormina, Italy. Springer International Publishing, Lecture Notes in Computer Science, 9432, pp.325-336, 2016, Lecture Notes in Computer Science. <http://link.springer.com/chapter/10.1007/978-3-319-27926-8_29>. <10.1007/978-3-319-27926-8_29>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01256033/file/Bandits_and_Recommender_Systems.pdf BibTex
titre
Imitation Learning Applied to Embodied Conversational Agents
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
JMLR Workshop and Conference Proceedings. 4th Workshop on Machine Learning for Interactive Systems (MLIS 2015), Jul 2015, Lille, France. 43, Proceedings of the 4th Workshop on Machine Learning for Interactive Systems. <http://mlis-workshop.org/2015/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225816/file/piot15.pdf BibTex
titre
Large-scale semi-supervised learning with online spectral graph sparsification
auteur
Daniele Calandriello, Alessandro Lazaric, Michal Valko
article
Resource-Efficient Machine Learning workshop at International Conference on Machine Learning, Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01544929/file/calandriello2015large-scale.pdf BibTex
titre
A Relative Exponential Weighing Algorithm for Adversarial Utility-based Dueling Bandits
auteur
Pratik Gajane, Tanguy Urvoy, Fabrice Clérot
article
Proceedings of the 32nd International Conference on Machine Learning , Jul 2015, Lille, France. pp.218-227, 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01225614/file/rex3_icml.pdf BibTex
titre
Qualitative Multi-Armed Bandits: A Quantile-Based Approach
auteur
Balazs Szorenyi, Róbert Busa-Fekete, Paul Weng, Eyke Hüllermeier
article
32nd International Conference on Machine Learning, Jul 2015, Lille, France. Proceedings of The 32nd International Conference on Machine Learning, pp.1660-1668, <http://icml.cc/2015/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01204708/file/qmab_final.pdf BibTex
titre
Approximate Dynamic Programming for Two-Player Zero-Sum Markov Games
auteur
Julien Perolat, Bruno Scherrer, Bilal Piot, Olivier Pietquin
article
International Conference on Machine Learning (ICML 2015), Jul 2015, Lille, France. 2015, <http://jmlr.org/proceedings/papers/v37/perolat15.pdf>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01153270/file/ICML_2015_JPBSBPOP.pdf BibTex
titre
First-order regret bounds for combinatorial semi-bandits
auteur
Gergely Neu
article
Proceedings of the 28th Annual Conference on Learning Theory (COLT), Jul 2015, Paris, France. 40, pp.1360-1375, 2015, JMLR Workshop and Conference Proceedings
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01215001/file/firstorder_colt.pdf BibTex
titre
Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning
auteur
Kailasam Lakshmanan, Ronald Ortner, Daniil Ryabko
article
International Conference on Machine Learning (ICML), Jul 2015, Lille, France
Accès au bibtex
BibTex
titre
Simple regret for infinitely many armed bandits
auteur
Alexandra Carpentier, Michal Valko
article
International Conference on Machine Learning, Jul 2015, Lille, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01153538/file/carpentier2015simple.pdf BibTex
titre
The Replacement Bootstrap for Dependent Data
auteur
Amir Sani, Alessandro Lazaric, Daniil Ryabko
article
Proceedings of the IEEE International Symposium on Information Theory, Jun 2015, Hong Kong, Hong Kong SAR China. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01144547/file/rboot_ISIT_2015.pdf BibTex
titre
Prédiction de performance sur des questions dichotomiques: comparaison de modèles pour des tests adaptatifs à grande échelle
auteur
Jill-Jênn Vie, Fabrice Popineau, Jean-Bastien Grill, Eric Bruillard, Yolaine Bourda
article
Atelier Évaluation des Apprentissages et Environnements Informatiques, EIAH 2015, Jun 2015, Agadir, Maroc
Accès au bibtex
BibTex
titre
Predicting the outcomes of every process for which an asymptotically accurate stationary predictor exists is impossible
auteur
Daniil Ryabko, Boris Ryabko
article
International Symposium on Information Theory, Jun 2015, Hong Kong, Hong Kong SAR China. IEEE, pp.1204-1206
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01165876/file/stno.pdf BibTex
titre
Simultaneous Optimistic Optimization on the Noiseless BBOB Testbed
auteur
Bilel Derbel, Philippe Preux
article
The 17th IEEE Congress on Evolutionary Computation (CEC), May 2015, Sendai, Japan. 2015
Accès au bibtex
BibTex
titre
An Experimental Protocol for Analyzing the Accuracy of Software Error Impact Analysis
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
Tenth IEEE/ACM International Workshop on Automation of Software Test, May 2015, Florence, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01120913/file/paper.pdf BibTex
titre
Collaborative Filtering with Localised Ranking
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
Twenty-Ninth AAAI Conference on Artificial Intelligence (AAAI’15), Jan 2015, Austin, United States. pp.7, Proceedings of. <http://www.aaai.org/Conferences/AAAI/aaai15.php>
Accès au bibtex
BibTex
titre
Cheap Bandits
auteur
Manjesh Kumar Hanawal, Venkatesh Saligrama, Michal Valko, Rémi Munos
article
International Conference on Machine Learning, 2015, Lille, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01153540/file/hanawal2015cheap.pdf BibTex

Habilitation à diriger des recherches

titre
Data-Driven Recommender Systems
auteur
Jérémie Mary
article
Artificial Intelligence [cs.AI]. Université de Lille 3, 2015
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01374729/file/hdr.pdf BibTex

Other publications

titre
L’apprentissage automatique : le diable n’est pas dans l’algorithme
auteur
Philippe Preux, Marc Tommasi, Thierry Vieville, Colin De La Higuera
article
Article sur http://binaire.blog.lemonde.fr. 2015
Accès au bibtex
BibTex

Poster communications

titre
Predicting Performance over Dichotomous Questions: Comparing Models for Large-Scale Adaptive Testing
auteur
Jill-Jênn Vie, Fabrice Popineau, Jean-Bastien Grill, Eric Bruillard, Yolaine Bourda
article
8th International Conference on Educational Data Mining (EDM 2015), Jun 2015, Madrid, Spain
Accès au bibtex
BibTex

Theses

titre
Sequential Resource Allocation in Linear Stochastic Bandits
auteur
Marta Soare
article
Machine Learning [cs.LG]. Université Lille 1 – Sciences et Technologies, 2015. English
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/tel-01249224/file/thesis.pdf BibTex
titre
Machine Learning for Decision Making
auteur
Amir Sani
article
Machine Learning [stat.ML]. Université de Lille 1, 2015. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01256178/file/AmirSani_Thesis.pdf BibTex

Preprints, Working Papers, …

titre
A Learning Algorithm for Change Impact Prediction: Experimentation on 7 Java Applications
auteur
Vincenzo Musco, Antonin Carette, Martin Monperrus, Philippe Preux
article
2015
Accès au bibtex
https://arxiv.org/pdf/1512.07435 BibTex
titre
AUC Optimisation and Collaborative Filtering
auteur
Charanpal Dhanjal, Romaric Gaudel, Stephan Clemencon
article
2015
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01185836/file/LocalRankingArxiv.pdf BibTex

2014

Journal articles

titre
Preference-based reinforcement learning: evolutionary direct policy search using a preference-based racing algorithm
auteur
Róbert Busa-Fekete, Balázs Szörényi, Paul Weng, Weiwei Cheng, Eyke Hüllermeier
article
Machine Learning, Springer Verlag, 2014, 97 (3), pp.327-351. <10.1007/s10994-014-5458-8>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079370/file/revised_1_1.pdf BibTex
titre
Efficient Eigen-updating for Spectral Graph Clustering
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
Neurocomputing, Elsevier, 2014, 131, pp.440-452. <10.1016/j.neucom.2013.11.015>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00770889/file/TemporalClusteringArxiv.pdf BibTex
titre
An experimental comparison of four magnetocaloric regenerators using three different materials
auteur
Ulrich Legait, Frédéric Guillou, Afef Kedous-Lebouc, Vincent Hardy, Morgan Almanza
article
International Journal of Refrigeration, Elsevier, 2014, 37, pp.147.155. <10.1016/j.ijrefrig.2013.07.006>
Accès au bibtex
BibTex
titre
Regret bounds for restless Markov bandits
auteur
Ronald Ortner, Daniil Ryabko, Peter Auer, Rémi Munos
article
Journal of Theoretical Computer Science (TCS), Elsevier, 2014, 558, pp.62-76. <10.1016/j.tcs.2014.09.026>
Accès au bibtex
BibTex
titre
Near-Optimal Rates for Limited-Delay Universal Lossy Source Coding
auteur
András György, Gergely Neu
article
IEEE Transactions on Information Theory, Institute of Electrical and Electronics Engineers, 2014, pp.2823-2834. <10.1109/TIT.2014.2307062>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01079327/file/quant_it_fin.pdf https://hal.archives-ouvertes.fr/hal-01079327/file/NGSA14.pdf BibTex
titre
Online Markov Decision Processes Under Bandit Feedback
auteur
Gergely Neu, András György, Csaba Szepesvári, András Antos
article
IEEE Transactions on Automatic Control, Institute of Electrical and Electronics Engineers, 2014, 59, pp.676 – 691. <10.1109/TAC.2013.2292137>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01079422/file/NGSA14.pdf BibTex
titre
Uniform hypothesis testing for finite-valued stationary processes
auteur
Daniil Ryabko
article
Statistics, Taylor & Francis: STM, Behavioural Science and Public Health Titles, 2014, 48 (1), pp.121-128. <10.1080/02331888.2012.719511>
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00610009/file/1uf_arx.pdf BibTex

Conference papers

titre
Exploiting easy data in online optimization
auteur
Amir Sani, Gergely Neu, Alessandro Lazaric
article
Advances in Neural Information Processing 27, Dec 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01079428/file/SNL14.pdf BibTex
titre
Optimistic planning in Markov decision processes using a generative model
auteur
Balázs Szörényi, Gunnar Kedenburg, Rémi Munos
article
Advances in Neural Information Processing Systems 27, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079366/file/StOP_nips.pdf BibTex
titre
Best-Arm Identification in Linear Bandits
auteur
Marta Soare, Alessandro Lazaric, Rémi Munos
article
NIPS – Advances in Neural Information Processing Systems 27, Dec 2014, Montreal, Canada. 2014, <https://nips.cc/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01075701/file/best_linear_arm.pdf BibTex
titre
Extreme bandits
auteur
Alexandra Carpentier, Michal Valko
article
Neural Information Processing Systems, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079354/file/carpentier2014extreme.pdf BibTex
titre
Efficient learning by implicit exploration in bandit problems with side observations
auteur
Tomáš Kocák, Gergely Neu, Michal Valko, Rémi Munos
article
Neural Information Processing Systems, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079351/file/kocak2014efficient.pdf BibTex
titre
Online combinatorial optimization with stochastic decision sets and adversarial losses
auteur
Gergely Neu, Michal Valko
article
Neural Information Processing Systems, Dec 2014, Montréal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079355/file/neu2014online.pdf BibTex
titre
Sparse Multi-task Reinforcement Learning
auteur
Daniele Calandriello, Alessandro Lazaric, Marcello Restelli
article
NIPS – Advances in Neural Information Processing Systems 26, Dec 2014, Montreal, Canada. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01073513/file/sparse_mtrl_tech.pdf BibTex
titre
Difference of Convex Functions Programming for Reinforcement Learning
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
Advances in Neural Information Processing Systems (NIPS 2014), Dec 2014, Montreal, Canada. <http://nips.cc/Conferences/2014/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01104419/file/5443-difference-of-convex-functions-programming-for-reinforcement-learning.pdf BibTex
titre
Subspace Identification for Predictive State Representation by Nuclear Norm Minimization
auteur
Hadrien Glaude, Cyrille Enderli, Olivier Pietquin
article
IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (ADPRL 2014), Dec 2014, Orlando, United States
Accès au bibtex
BibTex
titre
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
auteur
Ronald Ortner, Odalric-Ambrym Maillard, Daniil Ryabko
article
International Conference on Algorithmic Learning Theory (ALT), Oct 2014, Bled, Slovenia. Springer, 8776, pp.140-154, 2014, LNCS
Accès au bibtex
BibTex
titre
CoAdapt P300 speller: optimized flashing sequences and online learning
auteur
Eoin Thomas, Emmanuel Daucé, Dieter Devlaminck, Loïc Mahé, Alexandra Carpentier, Rémi Munos, Margaux Perrin, Emmanuel Maby, Jérémie Mattout, Théodore Papadopoulo, Maureen Clerc
article
6th International Brain Computer Interface Conference, Sep 2014, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01103441/file/CoadaptP300.pdf BibTex
titre
Predicting when to laugh with structured classification
auteur
Bilal Piot, Olivier Pietquin, Matthieu Geist
article
InterSpeech 2014, Sep 2014, Singapore, Singapore. Proceedings of the Annual Conference of the International Speech Communication Association, pp.1786-1790, 2014, <http://www.isca-speech.org/archive/archive_papers/interspeech_2014/i14_1786.pdf>
Accès au texte intégral et bibtex
https://hal-supelec.archives-ouvertes.fr/hal-01104739/file/supelec887.pdf BibTex
titre
A diffusion strategy for distributed dictionary learning
auteur
Pierre Chainais, Cédric Richard
article
2nd “international Traveling Workshop on Interactions between Sparse models and Technology” (iTWIST’14), Aug 2014, Namur, Belgium. 2014, Proceedings of the second “international Traveling Workshop on Interactions between Sparse models and Technology” (iTWIST’14)
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01104781/file/Chainais_itwist14_paper.pdf BibTex
titre
Biclique Coverings, Rectifier Networks and the Cost of ε-Removal
auteur
Szabolcs Iván, Ádám D. Lelkes, Judit Nagy-György, Balázs Szörényi, György Turán
article
16th International Workshop on Descriptional Complexity of Formal Systems, Proceedings, Aug 2014, Turku, Finland. pp.174 – 185, 2014, <10.1007/978-3-319-09704-6_16>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079368/file/1406.0017v1.pdf BibTex
titre
Spectral Bandits for Smooth Graph Functions with Applications in Recommender Systems
auteur
Tomáš Kocák, Michal Valko, Rémi Munos, Branislav Kveton, Shipra Agrawal
article
AAAI Workshop on Sequential Decision-Making with Big Data, Jul 2014, Québec City, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01045036/file/Spectral_Bandits.pdf BibTex
titre
Spectral Thompson Sampling
auteur
Tomáš Kocák, Michal Valko, Rémi Munos, Shipra Agrawal
article
AAAI Conference on Artificial Intelligence, Jul 2014, Québec City, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00981575/file/kocak2014spectral.pdf BibTex
titre
PAC Rank Elicitation through Adaptive Sampling of Stochastic Pairwise Preferences
auteur
Róbert Busa-Fekete, Balázs Szörényi, Eyke Hüllermeier
article
28th AAAI Conference on Artificial Intelligence (AAAI-14), Jul 2014, Quebec City, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079283/file/aaai_2014_auth_2.pdf BibTex
titre
Bandits attack function optimization
auteur
Philippe Preux, Rémi Munos, Michal Valko
article
IEEE Congress on Evolutionary Computation, Jul 2014, Beijing, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00978637/file/preux2014bandits.pdf BibTex
titre
Improving offline evaluation of contextual bandit algorithms via bootstrapping techniques
auteur
Olivier Nicol, Jérémie Mary, Philippe Preux
article
Eric Xing; Tony Jebara. International Conference on Machine Learning, Jun 2014, Beijing, China. 32, 2014, Journal of Machine Learning Research, Workshop and Conference Proceedings; Proceedings of The 31st International Conference on Machine Learning. <http://jmlr.org/proceedings/papers/v32/>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00990840/file/Improving-offline-evaluation-of-contextual-bandit-algorithms-via-bootstrapping-techniques.pdf BibTex
titre
Preference-Based Rank Elicitation using Statistical Models: The Case of Mallows
auteur
Róbert Busa-Fekete, Eyke Hüllermeier, Balázs Szörényi
article
Proceedings of The 31st International Conference on Machine Learning, Jun 2014, Beijing, China. 32, JMLR Workshop and Conference Proceedings Volume 32
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01079369/file/BuHuSz14.pdf BibTex
titre
Online Stochastic Optimization under Correlated Bandit Feedback
auteur
Mohammad Gheshlaghi Azar, Alessandro Lazaric, Emma Brunskill
article
31st International Conference on Machine Learning, Jun 2014, Beijing, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01080138/file/paper%20%281%29.pdf BibTex
titre
Asymptotically consistent estimation of the number of change points in highly dependent time series
auteur
Azadeh Khaleghi, Daniil Ryabko
article
International Conference on Machine Learning (ICML), Jun 2014, Beijing, China. pp.539-547, 2014
Accès au bibtex
BibTex
titre
Spectral Bandits for Smooth Graph Functions
auteur
Michal Valko, Rémi Munos, Branislav Kveton, Tomáš Kocák
article
International Conference on Machine Learning, May 2014, Beijing, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00986818/file/valko2014spectral.pdf BibTex
titre
Méthode de minimisation du résidu de Bellman boostée qui tient compte des démonstrations expertes.
auteur
Bilal Piot, Matthieu Geist, Olivier Pietquin
article
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA’14), May 2014, Liège, Belgique. 2014
Accès au bibtex
BibTex
titre
Quantitative control of the error bounds of a fast super-resolution technique for microscopy and astronomy
auteur
Pierre Chainais, Pierre Pfennig, Aymeric Leray
article
Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), May 2014, Florence, Italy. pp.2853 – 2857, 2014, <10.1109/ICASSP.2014.6854121>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01081402/file/chainais_pfennig_icassp2014_FINAL.pdf BibTex
titre
Online Matrix Completion Through Nuclear Norm Regularisation
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
SDM – SIAM International Conference on Data Mining, Apr 2014, Philadelphia, United States. 2014, <http://epubs.siam.org/doi/abs/10.1137/1.9781611973440.72>. <10.1137/1.9781611973440.72>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00926605/file/MatrixCompletionArxiv.pdf BibTex
titre
Evidence build-up facilitates on-line adaptivity in dynamic environments: example of the BCI P300-speller
auteur
Emmanuel Daucé, Eoin Thomas
article
22nd European Symposium on Artificial Neural Networks, Apr 2014, Bruges, Belgium. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01104024/file/es2014-188.pdf BibTex
titre
Synthèse en espace et temps du rayonnement acoustique d’une paroi sous excitation turbulente par synthèse spectrale 2D+T et formulation vibro-acoustique directe
auteur
Marc Pachebat, Nicolas Totaro, Pierre Chainais, Olivier Collery
article
Congrès Français d’acoustique 2014, Apr 2014, Poitiers, France. 6 p., p1921, papier N183, 2014
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01058151/file/CFA_2014_000183NversionAuteur.pdf BibTex
titre
MESSI: Maximum Entropy Semi-Supervised Inverse Reinforcement Learning
auteur
Julien Audiffren, Michal Valko, Alessandro Lazaric, Mohammad Ghavamzadeh
article
NIPS Workshop on Novel Trends and Applications in Reinforcement Learning, 2014, Montreal, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01177446/file/audiffren2014messi.pdf BibTex

Other publications

titre
User Engagement as Evaluation: a Ranking or a Regression Problem?
auteur
Frédéric Guillou, Romaric Gaudel, Jérémie Mary, Philippe Preux
article
1. Introduction 2. Recsys Challenge 2014: Data and Protocol 2.1 Data Characteristics and St.. 2014, <10.1145/2668067.2668073>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01077986/file/Paper%20Recsys.pdf BibTex

Reports

titre
Bandits Warm-up Cold Recommender Systems
auteur
Jérémie Mary, Romaric Gaudel, Philippe Preux
article
[Research Report] RR-8563, INRIA Lille; INRIA. 2014, pp.18
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01022628/file/RR-8563.pdf BibTex
titre
A Generative Model of Software Dependency Graphs to Better Understand Software Evolution
auteur
Vincenzo Musco, Martin Monperrus, Philippe Preux
article
[Technical Report] Inria. 2014
Accès au bibtex
https://arxiv.org/pdf/1410.7921 BibTex
titre
From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning
auteur
Rémi Munos
article
2014
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00747575/file/FTML2014.pdf BibTex

Theses

titre
Data-driven evaluation of Contextual Bandit algorithms and applications to Dynamic Recommendation
auteur
Olivier Nicol
article
Machine Learning [stat.ML]. Université de Lille I, 2014. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01297407/file/phd_nicol.pdf BibTex
titre
Mining Software Engineering Data for Useful Knowledge
auteur
Boris Baldassari
article
Machine Learning [stat.ML]. Université de Lille, 2014. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01297400/file/phd_baldassari.pdf BibTex
titre
Budgeted Classification-based Policy Iteration
auteur
Victor Gabillon
article
Machine Learning [stat.ML]. Universite Lille 1, 2014. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01297386/file/phd_gabillon.pdf BibTex

2013

Journal articles

titre
Outlier detection for patient monitoring and alerting
auteur
Milos Hauskrecht, Iyad Batal, Michal Valko, Shyam Visweswaran, Gregory F Cooper, Gilles Clermont
article
Journal of Biomedical Informatics, Elsevier, 2013, 46, pp.47-55. <10.1016/j.jbi.2012.08.004>
Accès au bibtex
BibTex
titre
Automatic motor task selection via a bandit algorithm for a brain-controlled button
auteur
Joan Fruitet, Alexandra Carpentier, Rémi Munos, Maureen Clerc
article
Journal of Neural Engineering, IOP Publishing, 2013, 10 (1), <10.1088/1741-2560/10/1/016012>
Accès au bibtex
BibTex
titre
Kullback-Leibler Upper Confidence Bounds for Optimal Sequential Allocation
auteur
Olivier Cappé, Aurélien Garivier, Odalric-Ambrym Maillard, Rémi Munos, Gilles Stoltz
article
Annals of Statistics, Institute of Mathematical Statistics, 2013, 41 (3), pp.1516-1541
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00738209/file/klucb.pdf BibTex
titre
A Binary-Classification-Based Metric between Time-Series Distributions and Its Use in Statistical and Learning Problems
auteur
Daniil Ryabko, Jérémie Mary
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2013, 14, pp.2837-2856
Accès au bibtex
BibTex
titre
Minimax PAC bounds on the sample complexity of reinforcement learning with a generative model
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Hilbert Kappen
article
Machine Learning, Springer Verlag, 2013, 91 (3), pp.325-349
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00831875/file/SampCompRL_MLJ2012.pdf BibTex
titre
A confidence-set approach to signal denoising
auteur
Boris Ryabko, Daniil Ryabko
article
Statistical Methodology, Elsevier, 2013, 15, pp.115–120
Accès au bibtex
BibTex

Conference papers

titre
Learning a common dictionary over a sensor network
auteur
Pierre Chainais, Cédric Richard
article
CAMSAP 2013, Dec 2013, Saint-Martin, France. pp.1-4, 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00923742/file/camsap2013_DicoLearn_final.pdf BibTex
titre
Approximate Dynamic Programming Finally Performs Well in the Game of Tetris
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Bruno Scherrer
article
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921250/file/tetris.pdf BibTex
titre
Online Learning in Episodic Markovian Decision Processes by Relative Entropy Policy Search
auteur
Alexander Zimin, Gergely Neu
article
Neural Information Processing Systems 26, Dec 2013, Lake Tahoe, United States
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01079423/file/ZN13.pdf BibTex
titre
Sequential Transfer in Multi-armed Bandit with Finite Set of Models
auteur
Mohammad Gheshlaghi Azar, Alessandro Lazaric, Emma Brunskill
article
NIPS – Advances in Neural Information Processing Systems 25 – 2013, Dec 2013, Lake Tahoe, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00924025/file/transfer-bandit.pdf BibTex
titre
Optimizing P300-speller sequences by RIP-ping groups apart
auteur
Eoin M. Thomas, Maureen Clerc, Alexandra Carpentier, Emmanuel Daucé, Dieter Devlaminck, Rémi Munos
article
IEEE/EMBS 6th international conference on neural engineering (2013), Nov 2013, San Diego, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00907781/file/0125_MS_revised.pdf BibTex
titre
Quantification adaptative pour la stéganalyse d’images texturées
auteur
Emmanuel Zidel – Cauffet, Patrick Bas, Pierre Chainais
article
GRETSI 2013, Sep 2013, Brest, France. 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00868550/file/gretsi_article_AfterDeadLine.pdf BibTex
titre
Regret Bounds for Reinforcement Learning with Policy Advice
auteur
Mohammad Gheshlaghi Azar, Alessandro Lazaric, Emma Brunskill
article
ECML/PKDD – European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, Sep 2013, Prague, Czech Republic. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00924021/file/RLPAcr.pdf BibTex
titre
Finite-Time Analysis of Kernelised Contextual Bandits
auteur
Michal Valko, Nathan Korda, Rémi Munos, Ilias Flaounas, Nello Cristianini
article
Uncertainty in Artificial Intelligence, Jul 2013, Bellevue, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00826946/file/paper.pdf BibTex
titre
Distributed dictionary learning over a sensor network
auteur
Pierre Chainais, Cédric Richard
article
CaP 2013, Jul 2013, Villeneuve d’Ascq, France. pp.1-4, 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00923741/file/distrib_dico_learning_cap2013_final.pdf BibTex
titre
Gossip-based distributed stochastic bandit algorithms
auteur
B. Szorenyi, R. Busa-Fekete, I. Hegedüs, R. Ormandi, M. Jelasity, B. Kégl
article
Sanjoy Dasgupta and David McAllester. 30th International Conference on Machine Learning (ICML 2013), Jun 2013, Atlanta, United States. Acm Press, 28, pp.19-27, 2013
Accès au texte intégral et bibtex
http://hal.in2p3.fr/in2p3-00907406/file/szorenyi13.pdf BibTex
titre
Stochastic Simultaneous Optimistic Optimization
auteur
Michal Valko, Alexandra Carpentier, Rémi Munos
article
International Conference on Machine Learning, Jun 2013, Atlanta, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00789606/file/paper.pdf BibTex
titre
Cost-sensitive Multiclass Classification Risk Bounds
auteur
Bernardo Avila Pires, Mohammad Ghavamzadeh, Csaba Szepesvari
article
International Conference on Machine Learning, Jun 2013, Atlanta, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00840485/file/icml2013multiclass.pdf BibTex
titre
A Generalized Kernel Approach to Structured Output Learning
auteur
Hachem Kadri, Mohammad Ghavamzadeh, Philippe Preux
article
International Conference on Machine Learning (ICML), Jun 2013, Atlanta, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00695631/file/Struct-Output-Final.pdf BibTex
titre
Learning from a Single Labeled Face and a Stream of Unlabeled Data
auteur
Branislav Kveton, Michal Valko
article
10th IEEE International Conference on Automatic Face and Gesture Recognition, Apr 2013, Shanghai, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00749197/file/kveton2013learning.pdf BibTex
titre
Optimistic planning for belief-augmented Markov decision processes
auteur
Raphael Fonteneau, Lucian Busoniu, Rémi Munos
article
IEEE International Symposium on Adaptive Dynamic Programming and reinforcement Learning, ADPRL 2013, Apr 2013, Singapour, Singapore. pp.CDROM, 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00840202/file/adprl.pdf BibTex
titre
Competing with an Infinite Set of Models in Reinforcement Learning
auteur
Phuong Nguyen, Odalric-Ambrym Maillard, Daniil Ryabko, Ronald Ortner
article
AISTATS, 2013, Arizona, United States. 31, pp.463-471, 2013, JMLR W&CP
Accès au bibtex
BibTex
titre
Toward optimal stratification for stratified monte-carlo integration
auteur
Alexandra Carpentier, Rémi Munos
article
International Conference on Machine Learning, 2013, United States. 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00923685/file/icml13-stratMC.pdf BibTex
titre
Thompson sampling for one-dimensional exponential family bandits
auteur
Nathaniel Korda, Emilie Kaufmann, Rémi Munos
article
Advances in Neural Information Processing Systems, 2013, United States. 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00923683/file/nips13-TS.pdf BibTex
titre
Time-series information and learning
auteur
Daniil Ryabko
article
ISIT – International Symposium on Information Theory, 2013, Istanbul, Turkey. pp.1392-1395, 2013
Accès au bibtex
BibTex
titre
Aggregating optimistic planning trees for solving markov decision processes
auteur
Gunnar Kedenburg, Raphael Fonteneau, Remi Munos
article
Advances in Neural Information Processing Systems, 2013, United States. pp.2382-2390, 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00923681/file/nips13a.pdf BibTex
titre
Nonparametric multiple change point estimation in highly dependent time series
auteur
Azadeh Khaleghi, Daniil Ryabko
article
Proc. 24th International Conf. on Algorithmic Learning Theory (ALT’13), 2013, Singapore, Singapore. Springer, pp.382-396, 2013, LNCS 8139
Accès au bibtex
BibTex
titre
Unsupervised model-free representation learning
auteur
Daniil Ryabko
article
Proc. 24th International Conf. on Algorithmic Learning Theory (ALT’13), 2013, Singapore, Singapore. Springer, pp.354-366, 2013, LNCS 8139
Accès au bibtex
BibTex
titre
Optimal Regret Bounds for Selecting the State Representation in Reinforcement Learning
auteur
Odalric-Ambrym Maillard, Phuong Nguyen, Ronald Ortner, Daniil Ryabko
article
ICML – 30th International Conference on Machine Learning, 2013, Atlanta, USA, United States. 28(1), pp.543-551, 2013, JMLR W&CP
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00778586/file/icml1_iblb_cr-corrected.pdf BibTex

Book sections

titre
A review of optimistic planning in Markov decision processes
auteur
Lucian Busoniu, Remi Munos, Robert Babuska
article
Frank Lewis and Derong Liu. Reinforcement Learning and Adaptive Dynamic Programming for Feedback Control, Wiley-IEEE Press, pp.494-516, 2013, IEEE Press Series on Computational Intelligence, 978-1-1181-0420-0
Accès au bibtex
BibTex

Reports

titre
Actor-Critic Algorithms for Risk-Sensitive MDPs
auteur
Prashanth L.A., Mohammad Ghavamzadeh
article
[Technical Report] 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00794721/file/rs-rl-techreport.pdf BibTex

Theses

titre
On Some Unsupervised Learning Problems for Highly Dependent Time Series
auteur
Azadeh Khaleghi
article
Statistics [math.ST]. Institut national de recherche en informatique et en automatique (INRIA), 2013. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00920184/file/Thesis.pdf BibTex

2012

Journal articles

titre
Finite-Sample Analysis of Least-Squares Policy Iteration
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2012, 13, pp.3041-3074
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772060/file/lazaric12a.pdf BibTex
titre
Sequential approaches for learning datum-wise sparse representations
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
Machine Learning, Springer Verlag, 2012, 89 (1-2), pp.87-122. <http://link.springer.com/article/10.1007%2Fs10994-012-5306-7>. <10.1007/s10994-012-5306-7>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00747724/file/versionPublieeMLJ.pdf BibTex
titre
Learning with stochastic inputs and adversarial outputs
auteur
Alessandro Lazaric, Rémi Munos
article
Journal of Computer and System Sciences (JCSS), Elsevier, 2012, 78 (5), pp.1516-1537. <http://www.sciencedirect.com/science/article/pii/S002200001200027X>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772046/file/00-estochad-alex.pdf BibTex
titre
Dislocation detection in field environments: A belief functions contribution
auteur
S.N. Razavi, Emmanuel Duflos, Carl Haas, Philippe Vanheeghe
article
Expert Systems with Applications, Elsevier, 2012, 39 (10), pp.8505-8513. <10.1016/j.eswa.2011.12.014>
Accès au bibtex
BibTex
titre
Dirichlet Process Mixtures for Density Estimation in Dynamic Nonlinear Modeling: Application to GPS Positioning in Urban Canyons
auteur
Asma Rabaoui, Nicolas Viandier, Juliette Marais, Emmanuel Duflos, Philippe Vanheeghe
article
IEEE Transactions on Signal Processing, Institute of Electrical and Electronics Engineers, 2012, 60 (4), pp.1638 – 1655. <10.1109/TSP.2011.2180901>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00712718/file/IEEE-TSP-2011-SubmitVersion.pdf BibTex
titre
Testing composite hypotheses about discrete ergodic processes
auteur
Daniil Ryabko
article
test, Springer, 2012, 21 (2), pp.317-329. <10.1007/s11749-011-0245-3>
Accès au bibtex
BibTex
titre
Managing advertising campaigns — an approximate planning approach
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
Frontiers of Computer Science -Springer-, Springer Verlag, 2012, 6 (2), pp.209-229. <http://rd.springer.com/article/10.1007/s11704-012-2873-5>. <10.1007/s11704-012-2873-5>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00747722/file/FCS-11073.final.pdf BibTex
titre
Linear Regression with Random Projections
auteur
Odalric Maillard, Rémi Munos
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2012, 13, pp.2735-2772
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00771487/file/JMLR_random_proj_2012.pdf BibTex

Conference papers

titre
Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Alessandro Lazaric
article
NIPS – Twenty-Sixth Annual Conference on Neural Information Processing Systems, Dec 2012, Lake Tahoe, United States. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772615/file/nips2012l.pdf BibTex
titre
Risk-Aversion in Multi-armed Bandits
auteur
Amir Sani, Alessandro Lazaric, Rémi Munos
article
NIPS – Twenty-Sixth Annual Conference on Neural Information Processing Systems, Dec 2012, Lake Tahoe, United States. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772609/file/risk-bandit-cr.pdf BibTex
titre
Reducing statistical time-series problems to binary classification
auteur
Daniil Ryabko, Jérémie Mary
article
NIPS, Dec 2012, Lake Tahoe, United States. pp.2069–2077, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00675637/file/red_hal2.pdf BibTex
titre
Multiple Operator-valued Kernel Learning
auteur
Hachem Kadri, Alain Rakotomamonjy, Francis Bach, Philippe Preux
article
Neural Information Processing Systems (NIPS), Dec 2012, Lake Tahoe, United States. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00677012/file/RR-7900.pdf BibTex
titre
Thompson Sampling: An Asymptotically Optimal Finite Time Analysis
auteur
Emilie Kaufmann, Nathaniel Korda, Rémi Munos
article
Algorithmic Learning Theory, Oct 2012, Lyon, France. Springer, LNCS 7568, pp.199-213, 2012
Accès au bibtex
https://arxiv.org/pdf/1205.4217 BibTex
titre
Fast Reinforcement Learning with Large Action Sets Using Error-Correcting Output Codes for MDP Factorization
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
European Conference on Machine Learning, Sep 2012, Bristol, United Kingdom. Springer, Machine Learning and Knowledge Discovery in Databases, 7524, pp.180-194, 2012, Lecture Notes in Computer Science. <http://link.springer.com/chapter/10.1007/978-3-642-33486-3_12>. <10.1007/978-3-642-33486-3_12>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00747729/file/version.officielle.Springer.pdf BibTex
titre
Towards dictionary learning from images with non Gaussian noise
auteur
Pierre Chainais
article
IEEE Int. Workshop on Machine Learning for Signal Processing, Sep 2012, Santander, Spain. pp.0000, 2012
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00749035/file/MLSP2012_final_web.pdf BibTex
titre
ASYMPTOTIC STATISTICAL ANALYSIS OF STATIONARY ERGODIC TIME SERIES
auteur
Daniil Ryabko
article
WITMSE 2012, Aug 2012, Amsterdam, Netherlands. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00771128/file/stats.pdf BibTex
titre
Conservative and Greedy Approaches to Classification-based Policy Iteration
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric
article
AAAI – 26th Conference on Artificial Intelligence, Jul 2012, Toronto, Canada. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772610/file/Ghavamzadeh.pdf BibTex
titre
Semi-Supervised Apprenticeship Learning
auteur
Michal Valko, Mohammad Ghavamzadeh, Alessandro Lazaric
article
Marc Peter Deisenroth and Csaba Szepesvári and Jan Peters. The 10th European Workshop on Reinforcement Learning (EWRL 2012), Jun 2012, Edinburgh, United Kingdom. Sparc, 24, pp.131-141, The 10th European Workshop on Reinforcement Learning
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00747921/file/valko2012semi-supervised_published.pdf BibTex
titre
A Dantzig Selector Approach to Temporal Difference Learning
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
John Langford and Joelle Pineau. ICML-12, Jun 2012, Edinburgh, United Kingdom. Omnipress, pp.1399-1406, 2012
Accès au bibtex
BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Mohammad Ghavamzadeh, Victor Gabillon, Matthieu Geist
article
29th International Conference on Machine Learning – ICML 2012, Jun 2012, Edinburgh, United Kingdom. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00758882/file/icml-short.pdf BibTex
titre
A Truthful Learning Mechanism for Contextual Multi–Slot Sponsored Search Auctions with Externalities
auteur
Nicola Gatti, Alessandro Lazaric, Francesco Trov\'{o}
article
EC – 13th ACM Conference on Electronic Commerce, Jun 2012, Valencia, Spain. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772624/file/ec080-gatti.pdf BibTex
titre
Classification Localement Parcimonieuse par Méthodes Séquentielles
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
CAP 2012 – Conférence Francophone sur l’Apprentissage Automatique, May 2012, Nancy, France. 2012
Accès au bibtex
BibTex
titre
Apprentissage par renforcement rapide pour des grands ensembles d’actions en utilisant des codes correcteurs d’erreur
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
Olivier Buffet. Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes – JFPDA 2012, May 2012, Villers-lès-Nancy, France. 12 p, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00736322/file/2.pdf BibTex
titre
Approximations de l’Algorithme Itérations sur les Politiques Modifié
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
Olivier Buffet. Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes – JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p, 2012, <http://icml.cc/2012/papers/608.pdf>
Accès au bibtex
BibTex
titre
Un sélecteur de Dantzig pour l’apprentissage par différences temporelles
auteur
Matthieu Geist, Bruno Scherrer, Alessandro Lazaric, Mohammad Ghavamzadeh
article
Olivier Buffet. Journées Francophones sur la planification, la décision et l’apprentissage pour le contrôle des systèmes – JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00736229/file/3.pdf BibTex
titre
DPM pour l’inférence dans les modèles dynamiques non linéaires avec des bruits de mesure alpha-stable
auteur
Nouha Jaoua, Emmanuel Duflos, Philippe Vanheeghe
article
44ème Journées de Statistique, May 2012, Bruxelles, Belgique. pp.1-4, 2012
Accès au bibtex
BibTex
titre
Optimistic Planning for Markov Decision Processes
auteur
Lucian Busoniu, Remi Munos
article
15th International Conference on Artificial Intelligence and Statistics, AISTATS-12, Apr 2012, La Palma, Canary Islands, Spain. 22, pp.182-189, 2012, Journal of Machine Learning Research: Workshop and Conference Proceedings
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00756736/file/aistats12.pdf BibTex
titre
Bandit Algorithms boost Brain Computer Interfaces for motor-task selection of a brain-controlled button
auteur
Joan Fruitet, Alexandra Carpentier, Rémi Munos, Maureen Clerc
article
P. Bartlett and F.C.N. Pereira and C.J.C. Burges and L. Bottou and K.Q. Weinberger. Advances in Neural Information Processing Systems, 2012, Lake Tahoe, Nevada, United States. Neural Information Processing Systems (NIPS) Foundation, 25, pp.458–466, 2012
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00771495/file/NIPS.pdf BibTex
titre
Incremental Decision Tree based on order statistics
auteur
Christophe Salperwyck, Vincent Lemaire
article
Workshop on Active and Incremental Learning (without proceedings), 2012, Montpellier, France. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00758003/file/AIL_V1.4_submitted-23-07-2012.pdf BibTex
titre
Locating Changes in Highly Dependent Data with Unknown Number of Change Points
auteur
Azadeh Khaleghi, Daniil Ryabko
article
P. Bartlett and F.C.N. Pereira and C.J.C. Burges and L. Bottou and K.Q. Weinberger. NIPS 2012, 2012, Lake Tahoe, United States. pp.3095–3103, 2012, Advances in Neural Information Processing Systems 25
Accès au bibtex
BibTex
titre
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
auteur
Ronald Ortner, Daniil Ryabko
article
P. Bartlett and F.C.N. Pereira and C.J.C. Burges and L. Bottou and K.Q. Weinberger. NIPS 2012, 2012, Lake Tahoe, United States. pp.1772–1780, 2012, Advances in Neural Information Processing Systems 25
Accès au bibtex
BibTex
titre
Regret Bounds for Restless Markov Bandits
auteur
Ronald Ortner, Daniil Ryabko, Peter Auer, Rémi Munos
article
ALT 2012, 2012, Lyon, France. 7568, pp.214–228, 2012, LNCS
Accès au bibtex
BibTex
titre
Online Clustering of Processes
auteur
Azadeh Khaleghi, Daniil Ryabko, Jérémie Mary, Philippe Preux
article
AISTATS 2012, 2012, La Palma, Spain. 22, pp.601-609, 2012, JMLR W\&CP
Accès au bibtex
BibTex
titre
On the Sample Complexity of Reinforcement Learning with a Generative Model
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Hilbert Kappen
article
International Conference on Machine Learning, 2012, United Kingdom. 2012
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00840331/file/RLcomplexity.pdf BibTex
titre
Adaptive Stratified Sampling for Monte-Carlo integration of Differentiable functions
auteur
A. Carpentier, R. Munos
article
Advances in Neural Information Processing Systems, 2012, Lake Tahoe, United States. 2012
Accès au bibtex
BibTex

Book sections

titre
Transfer in Reinforcement Learning: a Framework and a Survey
auteur
Alessandro Lazaric
article
Marco Wiering, Martijn van Otterlo. Reinforcement Learning – State of the art, 12, Springer, pp.143-173, 2012, <10.1007/978-3-642-27645-3_5>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772626/file/transfer.pdf BibTex
titre
Bayesian Reinforcement Learning
auteur
Nikos Vlassis, Mohammad Ghavamzadeh, Shie Mannor, Pascal Poupart
article
Marco Wiering and Martijn van Otterlo. Reinforcement Learning: State of the Art, Springer Verlag, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00840479/file/BRLchapter.pdf BibTex

Reports

titre
Risk-Aversion in Multi-armed Bandits
auteur
Amir Sani, Alessandro Lazaric, Rémi Munos
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00750298/file/risk-bandit.pdf BibTex
titre
Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Alessandro Lazaric
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00747005/file/BestArm-TechnicalReport.pdf BibTex
titre
Approximate Modified Policy Iteration
auteur
Bruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh, Matthieu Geist
article
[Research Report] 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00697169/file/article.pdf BibTex
titre
A Truthful Learning Mechanism for Contextual Multi-Slot Sponsored Search Auctions with Externalities
auteur
Alessandro Lazaric, Nicola Gatti, Trov\'{o} Francesco
article
[Research Report] 2012
Accès au bibtex
BibTex
titre
Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit
auteur
Alexandra Carpentier, Rémi Munos
article
[Technical Report] 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00659731/file/SparseBanditsAISTATS.pdf BibTex

Theses

titre
On optimal Sampling in low and high dimension
auteur
Alexandra Carpentier
article
Statistics [math.ST]. Université des Sciences et Technologie de Lille – Lille I, 2012. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00844361/file/Thesis_Carpentier.pdf BibTex
titre
Planification Optimiste pour Systèmes Déterministes
auteur
Jean-Francois Hren
article
Apprentissage [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2012. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00845898/file/thesis_Hren.pdf BibTex

Preprints, Working Papers, …

titre
On the Sample Complexity of Reinforcement Learning with a Generative Model
auteur
Mohammad Gheshlaghi Azar, Remi Munos, Bert Kappen
article
Appears in Proceedings of the 29th International Conference on Machine Learning (ICML 2012). 2012
Accès au bibtex
https://arxiv.org/pdf/1206.6461 BibTex
titre
Minimax Number of Strata for Online Stratified Sampling given Noisy Samples
auteur
Alexandra Carpentier, Rémi Munos
article
2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00698517/file/FixedStrata.pdf BibTex

2011

Journal articles

titre
X-Armed Bandits
auteur
Sébastien Bubeck, Rémi Munos, Gilles Stoltz, Csaba Szepesvari
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2011, 12, pp.1655-1695
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00450235/file/HOO-arXiv.pdf BibTex
titre
Pure exploration in finitely-armed and continuous-armed bandits
auteur
Gilles Stoltz, Sébastien Bubeck, Rémi Munos
article
Theoretical Computer Science, Elsevier, 2011, 412 (19), pp.1832-1852. <10.1016/j.tcs.2010.12.059>
Accès au bibtex
BibTex
titre
Constructing perfect steganographic systems
auteur
Boris Ryabko, Daniil Ryabko
article
Information and Computation, Elsevier, 2011, 209 (9), pp.1223-1230
Accès au bibtex
BibTex
titre
Identification of microbial and proteomic biomarkers in early childhood caries
auteur
Thomas Hart, Patricia Corby, Milos Hauskrecht, Ok Hee Ryu, Richard Pelikan, Michal Valko, Maria Oliveira, Gerald Hoehn, Walter Bretz
article
International Journal of Dentistry, Hindawi Publishing Corporation, 2011, 2011, pp.196721. <10.1155/2011/196721>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00642074/file/hart2011indentification.pdf BibTex
titre
On the relation between realizable and non-realizable cases of the sequence prediction problem
auteur
Daniil Ryabko
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2011, 12, pp.2161-2180
Accès au bibtex
BibTex
titre
Aligned carbon nanotube based ultrasonic microtransducers for durability monitoring in civil engineering
auteur
Bérengère Lebental, Pierre Chainais, Pascale Chenevier, Nicolas Chevalier, Eric Delevoye, Jean-Marc Fabbri, Sergio Nicoletti, Philippe Renaux, Anne Ghis
article
Nanotechnology, Institute of Physics: Hybrid Open Access, 2011, 22 (39), pp.395501. <10.1088/0957-4484/22/39/395501>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00707637/file/Lebental_Nanotechnology_2011.pdf BibTex

Conference papers

titre
Incremental Spectral Clustering with the Normalised Laplacian
auteur
Charanpal Dhanjal, Romaric Gaudel, Stéphan Clémençon
article
DISCML – 3rd NIPS Workshop on Discrete Optimization in Machine Learning – 2011, Dec 2011, Sierra Nevada, Spain. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00745666/file/TemporalClustering.pdf BibTex
titre
Finite-Time Analysis of Stratified Sampling for Monte Carlo
auteur
Alexandra Carpentier, Rémi Munos
article
NIPS – Twenty-Fifth Annual Conference on Neural Information Processing Systems, Dec 2011, Grenade, Spain. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00636924/file/mc-ucb_3.pdf BibTex
titre
Conditional Anomaly Detection with Soft Harmonic Functions
auteur
Michal Valko, Branislav Kveton, Hamed Valizadegan, Gregory Cooper, Milos Hauskrecht
article
Proceedings of the 2011 IEEE International Conference on Data Mining, Dec 2011, Vancouver, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00641081/file/valko2011conditionala.pdf BibTex
titre
Transfer from Multiple MDPs
auteur
Alessandro Lazaric, Marcello Restelli
article
NIPS – Twenty-Fifth Annual Conference on Neural Information Processing Systems, Dec 2011, Granada, Spain. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772620/file/sourcetransfer.pdf BibTex
titre
Selecting the State-Representation in Reinforcement Learning
auteur
Odalric-Ambrym Maillard, Rémi Munos, Daniil Ryabko
article
Neural Information Processing Systems, Dec 2011, Granada, Spain. 2011
Accès au bibtex
BibTex
titre
CLOP: Confident Local Optimization for Noisy Black-Box Parameter Tuning
auteur
Rémi Coulom
article
van den Herik, H. Jaap and Plaat, Aske. Advances in Computer Games – 13th International Conference, Nov 2011, Tilburg, Netherlands. Springer, 7168, pp.146-157, 2012, Lecture Notes in Computer Science; Advances in Computer Games. <http://link.springer.com/chapter/10.1007%2F978-3-642-31866-5_13>. <10.1007/978-3-642-31866-5_13>
Accès au bibtex
BibTex
titre
Upper-Confidence-Bound Algorithms for Active Learning in Multi-Armed Bandits
auteur
Alexandra Carpentier, Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos, Peter Auer
article
ALT – the 22nd conference on Algorithmic Learning Theory, Oct 2011, Espoo, Finland. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00659696/file/adapt_alloc_tech-report.pdf BibTex
titre
Datum-wise classification. A sequential Approach to sparsity
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
ECML PKDD 2011 – European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, Sep 2011, Athens, Greece. Springer, 6911, pp.375-390, 2011, Lecture Notes in Computer Science. <10.1007/978-3-642-23780-5_34>
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00772986/file/ecml2011.pdf BibTex
titre
Caractérisation statistique d’une assemblée de nanotubes en imagerie microscopique
auteur
Pierre Chainais, Bérengère Lebental
article
GRETSI, Sep 2011, France. 4p., 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00860839/file/doc00009389.pdf BibTex
titre
A Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
auteur
Odalric-Ambrym Maillard, Rémi Munos, Gilles Stoltz
article
Sham Kakade & Ulrike von Luxburg. 24th Annual Conference on Learning Theory : COLT’11, Jul 2011, Budapest, Hungary. pp.18, 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00574987/file/66-Maillard-Munos-Stoltz.pdf BibTex
titre
ICML Exploration & Exploitation challenge: Keep it simple!
auteur
Olivier Nicol, Jérémie Mary, Philippe Preux
article
Dorota Glowacka and Louis Dorard and John Shawe-Taylor. Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2, Jul 2011, Bellevue, Washington, United States. sans, 26, pp.62-85, 2012, Journal of Machine Learning Research – Proceedings Track
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00747725/file/nicol12a.pdf BibTex
titre
Stumping along a Summary for Exploration & Exploitation Challenge 2011
auteur
Christophe Salperwyck, Tanguy Urvoy
article
Dorota Glowacka and Louis Dorard and John Shawe-Taylor. Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2, Jul 2011, Bellevue, Washington, United States. 26, pp.86-97, 2012, Journal of Machine Learning Research – Workshop and Conference Proceedings
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00757998/file/Explochallenge_JMLR_Salperwyck_Urvoy.pdf BibTex
titre
Confidence Sets in Time-Series Filtering
auteur
Boris Ryabko, Daniil Ryabko
article
IEEE International Symposium on Information Theory, Jul 2011, St. Petersburg, Russia. IEEE, pp.2436-2438, 2011, Proceedings of IEEE International Symposium on Information Theory
Accès au bibtex
BibTex
titre
Functional Regularized Least Squares Classi cation with Operator-valued Kernels
auteur
Hachem Kadri, Asma Rabaoui, Philippe Preux, Emmanuel Duflos, Alain Rakotomamonjy
article
Lise Getoor, Tobias Scheffer. 28th International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. ACM, pp.993–1000, 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00772406/file/FRLSC.pdf BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. ACM, pp.1049-1056, 2011, Proceedings of the 28 th International Conference on Machine Learning
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00644935/file/dpi-critic.pdf BibTex
titre
Multi-Sensor PHD by Space Partionning: Computation of a True Reference Density Within The PHD Framework
auteur
Emmanuel Delande, Emmanuel Duflos, Philippe Vanheeghe, Dominique Heurguier
article
IEEE – Signal Processing Society. Statistical Signal Processing Workshop (SSP), 2011, Jun 2011, Nice, France. IEEE – Signal Processing Society, pp.333 – 336, 2011, Statistical Signal Processing Workshop (SSP). <10.1109/SSP.2011.5967695>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00639710/file/SSP2011.pdf BibTex
titre
Conditional Anomaly Detection Using Soft Harmonic Functions: An Application to Clinical Alerting
auteur
Michal Valko, Hamed Valizadegan, Branislav Kveton, Gregory Cooper, Milos Hauskrecht
article
The 28th International Conference on Machine Learning Workshop on Machine Learning for Global Challenges, Jun 2011, Seattle, United States. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00642313/file/valko2011conditional.pdf BibTex
titre
Multiple functional regression with both discrete and continuous covariates
auteur
Hachem Kadri, Philippe Preux, Emmanuel Duflos, Stéphane Canu
article
Fréderic Ferraty. 2nd International Workshop on Functional and Operatorial Statistics (IWFOS), Jun 2011, Santander, Spain. Physica-Verlag/Springer, pp.189-195, 2011, Contributions to Statistics
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00772425/file/IWFOS2011-Kadri-FinalVersion.pdf BibTex
titre
On selecting the hyperparameters of the DPM models for the density estimation of observation errors
auteur
Asma Rabaoui, Emmanuel Duflos, Juliette Marais, Nicolas Viandier
article
International Conference on Acoustic, Speech and Signal Processing (ICASSP°, May 2011, Prague, Czech Republic. pp.4092-4095, 2011, <10.1109/ICASSP.2011.5947252>
Accès au bibtex
BibTex
titre
Multi-Sensor PHD: Construction and Implementation by Space Partitioning
auteur
Emmanuel Delande, Emmanuel Duflos, Philippe Vanheeghe, Dominique Heurguier
article
IEEE – Signal Processing Society. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. IEEE – Signal Processing Society, pp.3632 – 3635, 2011, <10.1109/ICASSP.2011.5947137>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00639724/file/ICASSP2011.pdf BibTex
titre
Impulsive Interference Mitigation in Ad Hoc Networks Based on Alpha-Stable Modeling and Particle Filtering
auteur
Nouha Jaoua, Emmanuel Duflos, Philippe Vanheeghe, Laurent Clavier, François Septier
article
IEEE – Signal Processing Society. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. IEEE – Signal Processing Society, pp.3548 – 3551, 2011, <10.1109/ICASSP.2011.5946244>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00640682/file/ICASSP2011.pdf BibTex
titre
Learning vocal tract variables with multi-task kernels
auteur
Hachem Kadri, Emmanuel Duflos, Philippe Preux
article
36th International Conference on Acoustics, Speech and Signal Processing (ICASSP), May 2011, Prague, Czech Republic. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00826050/file/ICASSP2011.pdf BibTex
titre
Handling Expensive Optimization with Large Noise
auteur
Rémi Coulom, Philippe Rolet, Nataliya Sokolovska, Olivier Teytaud
article
ACM. Foundations of Genetic Algorithms, Jan 2011, Austria. pp.TBA, 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00517157/file/foga10noise.pdf BibTex
titre
Speedy Q-learning
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Mohammad Ghavamzadeh, Hilbert Kappen
article
Advances in Neural Information Processing Systems, 2011, Spain. 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830140/file/speedy-QL_nips2011.pdf BibTex
titre
Finite-sample analysis of Lasso-TD
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric, Rémi Munos, Matt Hoffman
article
International Conference on Machine Learning, 2011, United States. 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830149/file/lasso-TD.pdf BibTex
titre
Optimistic planning for sparsely stochastic systems
auteur
Lucian Busoniu, Rémi Munos, Bart De Schutter, Robert Babuska
article
IEEE International Symposium on Adaptive Dynamic Programming and Reinforcement Learning, 2011, paris, France. pp.48-55, 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830125/file/adprl2011.pdf BibTex
titre
Optimistic optimization of deterministic functions without the knowledge of its smoothness
auteur
Rémi Munos
article
Advances in Neural Information Processing Systems, 2011, Spain. 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830143/file/opti2_nips2011.pdf BibTex
titre
Sparse Recovery with Brownian Sensing
auteur
A. Carpentier, O. A. Maillard, R. Munos
article
Advances in Neural Information Processing Systems, 2011, Granada, Spain. 2011
Accès au bibtex
BibTex

Book sections

titre
Bandit view on noisy optimization
auteur
Jean-Yves Audibert, Sébastien Bubeck, Rémi Munos
article
Optimization for Machine Learning, MIT Press, pp.431-454, 2011, 978-0-262-01646-9
Accès au bibtex
BibTex
titre
Least-squares methods for policy iteration
auteur
Lucian Busoniu, Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos, Robert Babuska, Bart De Schutter
article
Reinforcement Learning: State of the Art, Springer, pp.75-109, 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830122/file/lspi_chapter.pdf BibTex

Habilitation à diriger des recherches

titre
LEARNABILITY IN PROBLEMS OF SEQUENTIAL INFERENCE
auteur
Daniil Ryabko
article
Machine Learning [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2011
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00675680/file/hdr_hal.pdf BibTex

Reports

titre
Multi-Bandit Best Arm Identification
auteur
Victor Gabillon, Mohammad Ghavamzadeh, Alessandro Lazaric, Sébastien Bubeck
article
2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00632523/file/multi-bandit_techreport.pdf BibTex
titre
Reinforcement Learning with a Near Optimal Rate of Convergence
auteur
Mohammad Gheshlaghi Azar, Rémi Munos, Mohammad Ghavamzadeh, Hilbert Kappen
article
[Technical Report] 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00636615/file/SQL_vNov19.pdf BibTex
titre
Automatic motor task selection via a bandit algorithm for a brain-controlled button
auteur
Joan Fruitet, Alexandra Carpentier, Rémi Munos, Maureen Clerc
article
[Rapport de recherche] RR-7721, INRIA. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00624686/file/RR-7721.pdf BibTex
titre
Transfer from Multiple MDPs
auteur
Alessandro Lazaric, Marcello Restelli
article
[Technical Report] 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00618037/file/sourcetransfer-tech.pdf BibTex
titre
Classification-based Policy Iteration with a Critic
auteur
Victor Gabillon, Alessandro Lazaric, Mohammad Ghavamzadeh, Bruno Scherrer
article
2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00590972/file/dpi-critic-techReport.pdf BibTex
titre
Operator-Valued Kernels for Nonparametric Operator Estimation
auteur
Hachem Kadri, Philippe Preux, Emmanuel Duflos, Stephane Canu
article
[Research Report] RR-7607, INRIA. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00587649/file/RR-7607.pdf BibTex
titre
Adaptive Bandits: Towards the best history-dependent strategy
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
[Technical Report] 2011, pp.14
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00574999/file/AdaptiveBandits_HAL.pdf BibTex

Theses

titre
APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.
auteur
Odalric-Ambrym Maillard
article
Machine Learning [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2011. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00845410/file/thesis_Maillard.pdf BibTex
titre
Active Set Algorithms for the LASSO
auteur
Manuel Loth
article
Machine Learning [cs.LG]. Université des Sciences et Technologie de Lille – Lille I, 2011. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00845441/file/thesis_Loth.pdf BibTex

Preprints, Working Papers, …

titre
Datum-Wise Classification: A Sequential Approach to Sparsity
auteur
Gabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux, Patrick Gallinari
article
ECML2011. 2011
Accès au bibtex
https://arxiv.org/pdf/1108.5668 BibTex
titre
Nearest Neighbor Clustering: A Baseline Method for Consistent Clustering with Arbitrary Objective Functions
auteur
Sébastien Bubeck, Ulrike Von Luxburg
article
2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00185780/file/bubeck09a.pdf BibTex

2010

Journal articles

titre
Regret Bounds and Minimax Policies under Partial Monitoring
auteur
Jean-Yves Audibert, Sébastien Bubeck
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2010, 11, pp.2785-2836
Accès au texte intégral et bibtex
https://hal-enpc.archives-ouvertes.fr/hal-00654356/file/JMLR10.pdf BibTex
titre
Discrimination between B-processes is impossible
auteur
Daniil Ryabko
article
Journal of Theoretical Probability, Sprnger, 2010, 23 (2), pp.565-575
Accès au bibtex
BibTex
titre
Nonparametric Statistical Inference for Ergodic Processes
auteur
Daniil Ryabko, Boris Ryabko
article
IEEE Transactions on Information Theory, Institute of Electrical and Electronics Engineers, 2010, 56 (3), pp.1430-1435
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00269249/file/3s_fa.pdf BibTex
titre
On Finding Predictors for Arbitrary Families of Processes
auteur
Daniil Ryabko
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2010, 11, pp.581-602
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00442881/file/pq3%2B.pdf BibTex

Conference papers

titre
Planning-based Approach for Optimizing the Display of Online Advertising Campaigns
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
NIPS workshop on Machine Learning in Online ADvertising, Dec 2010, Whistler, Canada
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00772512/file/mload-2010.pdf BibTex
titre
Advertising Campaigns Management: Should We Be Greedy?
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
IEEE International Conference on Data Mining, Dec 2010, Sydney, Australia. IEEE, pp.821-826, 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00772447/file/icdm-2010-final.pdf BibTex
titre
The Iso-regularization Descent Algorithm for the LASSO
auteur
Manuel Loth, Philippe Preux
article
17th International Conference on Neural Information Processing, Nov 2010, Sidney, Australia. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00508257/file/master.pdf BibTex
titre
Advanced signal processing techniques for multipath mitigation in land transportation environment
auteur
Juliette Marais, Emmanuel Duflos, Nicolas Viandier, Donnay Nahimana, Asma Rabaoui
article
International IEEE Conference on Intelligent Transportation Systems (ITSC), Sep 2010, Funchal, France. pp.1480-1485, 2010, <10.1109/ITSC.2010.5625065>
Accès au bibtex
BibTex
titre
Feature importance analysis for patient management decisions
auteur
Michal Valko, Milos Hauskrecht
article
13th International Congress on Medical Informatics MEDINFO 2010, Sep 2010, Cape Town, South Africa. IOS Press, pp.861-865, 2010, MEDINFO 2010 – Proceedings of the 13th World Congress on Medical Informatics. <10.3233/978-1-60750-588-4-861>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643123/file/valko2010feature.pdf BibTex
titre
GNSS pseudorange error density tracking using Dirichlet Process Mixture
auteur
Nicolas Viandier, Asma Rabaoui, Juliette Marais, Emmanuel Duflos
article
FUSION 2010, Jul 2010, Edinburgh, United Kingdom. pp.1-7, 2010
Accès au bibtex
BibTex
titre
Best Arm Identification in Multi-Armed Bandits
auteur
Jean-Yves Audibert, Sébastien Bubeck
article
COLT – 23th Conference on Learning Theory – 2010, Jun 2010, Haifa, Israel. 13 p., 2010
Accès au texte intégral et bibtex
https://hal-enpc.archives-ouvertes.fr/hal-00654404/file/COLT10.pdf BibTex
titre
Simulation-based search of combinatorial games
auteur
Lukasz Lew, Rémi Coulom
article
ICML 2010 : Workshop on Machine Learning and Games, Jun 2010, Haifa, Israel. 2010, <http://www-kd.iai.uni-bonn.de/icml2010mlg/program.html>
Accès au bibtex
BibTex
titre
Bayesian Multi-Task Reinforcement Learning
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh
article
ICML – 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. Omnipress, pp.599-606, 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00475214/file/bmtl.pdf BibTex
titre
Clustering processes
auteur
Daniil Ryabko
article
27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp.919-926, 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00477238/file/clust_hal.pdf BibTex
titre
Analysis of a Classification-based Policy Iteration Algorithm
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Remi Munos
article
ICML – 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. Omnipress, pp.607-614, 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00482065/file/dpi-jmlr.pdf BibTex
titre
Finite-Sample Analysis of LSTD
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Remi Munos
article
ICML – 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp.615-622, 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00482189/file/lstd-tech.pdf BibTex
titre
Online Semi-Supervised Perception: Real-Time Learning without Explicit Feedback
auteur
Branislav Kveton, Michal Valko, Mathai Phillipose, Ling Huang
article
4th IEEE Online Learning for Computer Vision Workshop, Jun 2010, San Francisco, United States. 2010, <10.1109/CVPRW.2010.5543877>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00642999/file/kveton2010online.pdf BibTex
titre
Online Semi-Supervised Learning on Quantized Graphs
auteur
Michal Valko, Branislav Kveton, Huang Ling, Ting Daniel
article
Uncertainty in Artificial Intelligence, Jun 2010, Catalina Island, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00642361/file/valko2010online.pdf BibTex
titre
Semi-Supervised Learning with Max-Margin Graph Cuts
auteur
Branislav Kveton, Michal Valko, Ali Rahimi, Ling Huang
article
International Conference on Artificial Intelligence and Statistics, May 2010, Chia Laguna, Sardinia, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00642891/file/kveton2010semi-supervised.pdf BibTex
titre
Studies on DPM for the density estimation of pseudorange noises and evaluations on real data
auteur
Juliette Marais, Asma Rabaoui, Emmanuel Duflos
article
Position Location and Navigation Symposium (PLANS), 2010 IEEE/ION, May 2010, Indian Wells, CA, USA, United States. pp.1154-1161, 2010, <10.1109/PLANS.2010.5507234>
Accès au bibtex
BibTex
titre
Belief Function Based Algorithm for Material Detection and Tracking in Construction
auteur
Emmanuel Duflos, Philippe Vanheeghe, S.N. Razavi, Carl Haas
article
BELIEF 2010 : Workshop on the Theory of Belief Functions, Apr 2010, Brest, France. CDROM – 6 p., 2010
Accès au bibtex
BibTex
titre
Affichage de publicités sur des portails web
auteur
Victor Gabillon, Jérémie Mary, Philippe Preux
article
Extraction, Gestion des Connaissances (EGC), Jan 2010, Tunisie. pp.110-120, 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00772531/file/egc-2010.fr.pdf BibTex
titre
Sequence prediction in realizable and non-realizable cases
auteur
Daniil Ryabko
article
Conference on Learning Theory, 2010, Haifa, Israel. pp.119-131, 2010, COLT
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00440669/file/pqout.pdf BibTex
titre
Open Loop Optimistic Planning
auteur
S. Bubeck, R. Munos
article
Conference on Learning Theory, 2010, Haifa, Israel. 2010
Accès au bibtex
BibTex
titre
LSTD with Random Projections
auteur
M. Ghavamzadeh, A. Lazaric, O. A. Maillard, R. Munos
article
Advances in Neural Information Processing Systems, 2010, Granada, Spain. 2010
Accès au bibtex
BibTex
titre
Testing composite hypotheses about discrete-valued stationary processes
auteur
Daniil Ryabko
article
IEEE Information Theory Workshop, 2010, Cairo, Egypt. IEEE, pp.291-295, 2010
Accès au bibtex
BibTex
titre
Online Learning in Adversarial Lipschitz Environments
auteur
Odalric Maillard, Rémi Munos
article
European Conference on Machine Learing, 2010, Barcelone, Spain. Springer, 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00510674/file/ALF_ecml10.pdf BibTex
titre
Nonlinear functional regression: a functional RKHS approach
auteur
Hachem Kadri, Emmanuel Duflos, Philippe Preux, Stephane Canu, Manuel Davy
article
Thirteenth International Conference on Artificial Intelligence and Statistics (AISTATS’10), 2010, Italy. 9, pp.374-380, 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00510411/file/HK_AISTATS2010.pdf BibTex
titre
Error propagation for approximate policy and value iteration
auteur
Amir Massoud Farahmand, Rémi Munos, Csaba Szepesvari
article
Advances in Neural Information Processing Systems, 2010, Canada. 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830154/file/error_prop_nips2010.pdf BibTex
titre
Finite-Sample Analysis of Bellman Residual Minimization
auteur
Odalric-Ambrym Maillard, Rémi Munos, Alessandro Lazaric, Mohammad Ghavamzadeh
article
Asian Conference on Machine Learning, 2010, Japan. 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830212/file/brm_acml2010.pdf BibTex
titre
Scrambled Objects for Least-Squares Regression
auteur
O. A. Maillard, R. Munos
article
Advances in Neural Information Processing Systems, 2010, Granada, Spain. 2010
Accès au bibtex
BibTex

Book sections

titre
A comparison of two machine learning approaches for Photometric Solids Compression
auteur
Delepoulle Samuel, François Rouselle, Renaud Christophe, Philippe Preux
article
Plemenos, Dimitri; Miaoulis, Georgios. Intelligent Computer Graphics, 321, Springer, pp.145-164, 2010, Studies in Computational Intelligence
Accès au bibtex
BibTex
titre
Robust Unsupervised Speaker Segmentation for Audio Diarization
auteur
Kadri Hachem, Manuel Davy, Noureddine Ellouze
article
Signal Processing, INTECH, pp.307-320, 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00510406/file/HK_Intech_BookChapter.pdf BibTex
titre
Approximate Dynamic Programming
auteur
R. Munos
article
Olivier Sigaud and Olivier Buffet. Markov Decision Processes in Artificial Intelligence, ISTE Ltd and John Wiley & Sons Inc, pp.67–98, 2010
Accès au bibtex
BibTex

Documents associated with scientific events

titre
Finite sample analysis of Least Squares Temporal Differences
auteur
Rémi Munos
article
Journées MAS et Journée en l’honneur de Jacques Neveu, Aug 2010, Talence, France
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00510324/file/REN-Munos.pdf BibTex

Reports

titre
LSPI with Random Projections
auteur
Mohammad Ghavamzadeh, Alessandro Lazaric, Odalric Maillard, Rémi Munos
article
[Technical Report] 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00530762/file/randproj-lspi.pdf BibTex
titre
Linear regression with random projections
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
[Technical Report] 2010, pp.22
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00483014/file/jmlr_blsr.pdf BibTex
titre
Finite-Sample Analysis of Least-Squares Policy Iteration
auteur
Alessandro Lazaric, Mohammad Ghavamzadeh, Rémi Munos
article
[Technical Report] 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00528596/file/lspi-jmlr.pdf BibTex
titre
Advertising Campaigns Management: Should We Be Greedy?
auteur
Sertan Girgin, Jérémie Mary, Philippe Preux, Olivier Nicol
article
[Research Report] RR-7388, INRIA. 2010, pp.27
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00519694/file/RR-7388.pdf BibTex
titre
Multi-target PHD filtering: proposition of extensions to the multi-sensor case
auteur
Emmanuel Delande, Emmanuel Duflos, Dominique Heurguier, Philippe Vanheeghe
article
[Research Report] RR-7337, INRIA. 2010, pp.64
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00501502/file/PHD-21-12-10.pdf BibTex
titre
Brownian Motions and Scrambled Wavelets for Least-Squares Regression
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
[Technical Report] 2010, pp.13
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00483017/file/blsr.pdf BibTex

Theses

titre
Bandits Games and Clustering Foundations
auteur
Sébastien Bubeck
article
Statistics [math.ST]. Université des Sciences et Technologie de Lille – Lille I, 2010. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00845565/file/thesis_Bubeck.pdf BibTex

Preprints, Working Papers, …

titre
Pure Exploration for Multi-Armed Bandit Problems
auteur
Sébastien Bubeck, Rémi Munos, Gilles Stoltz
article
2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00257454/file/BMS--TCS09.pdf BibTex

2009

Journal articles

titre
Natural Actor-Critic Algorithms
auteur
Shalabh Bhatnagar, Richard Sutton, Mohammad Ghavamzadeh, Mark Lee
article
Automatica, Elsevier, 2009, 45 (11), <10.1016/j.automatica.2009.07.008>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00840470/file/tr-final.pdf BibTex
titre
Radar Optimal Times Detection Allocation in Multitarget Environment
auteur
Marie De Vilmorin, Emmanuel Duflos, Philippe Vanheeghe
article
Systems Journal, IEEE, IEEE, 2009, Systems Journal, IEEE, 3 (2), pp.210-220. <10.1109/JSYST.2009.2017393>
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00448956/file/article.pdf BibTex
titre
Le jeu de go et la révolution de Monte Carlo
auteur
Rémi Coulom
article
Interstices, INRIA, 2009, <https://interstices.info/jcms/c_43860/le-jeu-de-go-et-la-revolution-de-monte-carlo>
Accès au bibtex
BibTex
titre
Multifractal Random Walks as Fractional Wiener Integrals
auteur
P. Abry, Pierre Chainais, L. Coutin, V. Pipiras
article
IEEE Transactions on Information Theory, Institute of Electrical and Electronics Engineers, 2009, 55 (8), pp.3825-3846
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00808604/file/multifractal-fbm-rev14.pdf BibTex
titre
Asymptotically Optimal Perfect Steganographic Systems
auteur
Boris Ryabko, Daniil Ryabko
article
Problems of Information Transmission, MAIK Nauka/Interperiodica, 2009, 45 (2), pp.184-190
Accès au bibtex
BibTex
titre
Using Data Compressors to Construct Rank Tests
auteur
Daniil Ryabko, Juergen Schmidhuber
article
Applied Mathematics Letters, Elsevier, 2009, 22 (7), pp.1029-1032
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00269225/file/tests.pdf BibTex
titre
Hybrid Stochastic-Adversarial On-line Learning
auteur
Lazaric Alessandro, Rémi Munos
article
COLT, COLT, 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00392524/file/estochad.pdf BibTex
titre
Exploration-exploitation tradeoff using variance estimates in multi-armed bandits
auteur
Jean-Yves Audibert, Remi Munos, Csaba Szepesvari
article
Theoretical Computer Science, Elsevier, 2009, 410 (19), pp.1876–1902. <10.1016/j.tcs.2009.01.016>
Accès au bibtex
BibTex

Conference papers

titre
ECON: a Kernel Basis Pursuit Algorithm with Automatic Feature Parameter Tuning, and its Application to Photometric Solids Approximation
auteur
Loth Manuel, Preux Philippe, Delepoulle Samuel, Renaud Christophe
article
IEEE Press. International Conference on Machine Learning and Applications, Dec 2009, Miami, United States. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00430578/file/icmla2009.pdf BibTex
titre
Compressed Least-Squares Regression
auteur
Odalric-Ambrym Maillard, Rémi Munos
article
NIPS 2009, Dec 2009, Vancouver, Canada. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00419210/file/cls_nips.pdf BibTex
titre
Enhancement of Galileo and multi-constellation accuracy by modeling pseudorange noises
auteur
Nicolas Viandier, Asma Rabaoui, Juliette Marais, Emmanuel Duflos
article
Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp.459-464, 2009, <10.1109/ITST.2009.5399311>
Accès au bibtex
BibTex
titre
On the use of Dirichlet process mixtures for the modelling of pseudorange errors in multi-constellation based localisation
auteur
Asma Rabaoui, Nicolas Viandier, Juliette Marais, Emmanuel Duflos
article
International Conference on Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp.465-470, 2009, <10.1109/ITST.2009.5399308>
Accès au bibtex
BibTex
titre
Real world implementation of belief function theory to detect dislocation of materials in construction
auteur
S.N. Razavi, Carl Haas, Philippe Vanheeghe, Emmanuel Duflos
article
FUSION 2009, Jul 2009, Seattle, WA, United States. pp.748-755, 2009
Accès au bibtex
BibTex
titre
Minimax policies for adversarial and stochastic bandits
auteur
Jean-Yves Audibert, Sébastien Bubeck
article
COLT, Jun 2009, Montreal, Canada. pp.217-226, 2009
Accès au texte intégral et bibtex
https://hal-enpc.archives-ouvertes.fr/hal-00834882/file/COLT09a.pdf BibTex
titre
Feature Discovery in Approximate Dynamic Programming
auteur
Philippe Preux, Sertan Girgin, Manuel Loth
article
Approximate Dynamic Programming and Reinforcement Learning, Mar 2009, Nashville, United States. IEEE, 2009
Accès au bibtex
BibTex
titre
An impossibility result for process discrimination
auteur
Daniil Ryabko
article
International Symposium on Information Theory, 2009, Seoul, South Korea. pp.1734-1738, 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00319076/file/discr.pdf BibTex
titre
Using Kolmogorov Complexity for Understanding Some Limitations on Steganography
auteur
Boris Ryabko, Daniil Ryabko
article
IEEE International Symposium on Information Theory, 2009, seoul, South Korea. IEEE, pp.2733-2736, 2009
Accès au bibtex
BibTex
titre
Sensitivity analysis in HMMs with application to likelihood maximization
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
Advances in Neural Information Processing Systems, 2009, Canada. 2009
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830166/file/sensitivity_HMM_nips09.pdf BibTex
titre
Hybrid stochastic-adversarial on-line learning
auteur
Alessandro Lazaric, Rémi Munos
article
Conference on Learning Theory, 2009, France. 2009
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830168/file/estochad_COLT2009.pdf BibTex
titre
Characterizing predictable classes of processes
auteur
Daniil Ryabko
article
UAI, 2009, Montreal, Canada. pp.471-478, 2009, Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence (UAI’09)
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00388523/file/pq3_a.pdf BibTex

Book sections

titre
Light Source Storage and Interpolation for Global Illumination: a neural solution
auteur
Delepoulle Samuel, Renaud Christophe, Philippe Preux
article
Dimitri Plemenos, Georgios Miaoulis. Intelligent Computer Graphics, 240, Springer, pp.87-104, 2009, Studies in Computational Intelligence
Accès au bibtex
BibTex

Directions of work or proceedings

titre
Recent Advances in Reinforcement Learning
auteur
Sertan Girgin, Manuel Loth, Rémi Munos, Philippe Preux, Daniil Ryabko
article
Springer, Lectures Notes in Artificial Intelligence (LNAI), vol. 5323, pp.281, 2009
Accès au bibtex
BibTex

Reports

titre
General Framework for Nonlinear Functional Regression with Reproducing Kernel Hilbert Spaces
auteur
Hachem Kadri, Emmanuel Duflos, Manuel Davy, Philippe Preux, Stephane Canu
article
[Research Report] RR-6908, INRIA. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00378381/file/RR-6908.pdf BibTex
titre
A criterion for hypothesis testing for stationary processes
auteur
Daniil Ryabko
article
[Research Report] INRIA Lille. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00389689/file/1cf.pdf BibTex

2008

Journal articles

titre
Using One-Class SVMs and Wavelets for Audio Surveillance
auteur
Asma Rabaoui, Manuel Davy, Stéphane Rossignol, Noureddine Ellouze
article
IEEE Transactions on Information Forensics and Security, Institute of Electrical and Electronics Engineers, 2008, 3 (4), pp.763-775. <10.1109/TIFS.2008.2008216>
Accès au bibtex
BibTex
titre
Least committed basic belief density induced by a multivariate Gaussian: Formulation with applications
auteur
Francois Caron, Branko Ristic, Emmanuel Duflos, Philippe Vanheeghe
article
International Journal of Approximate Reasoning, Elsevier, 2008, 48 (2), pp.419-436. <10.1016/j.ijar.2006.10.003>
Accès au bibtex
BibTex
titre
Bayesian Inference for Linear Dynamic Models with Dirichlet Process Mixtures
auteur
François Caron, Manuel Davy, Arnaud Doucet, Emmanuel Duflos, Philippe Vanheeghe
article
IEEE Transactions on Signal Processing, Institute of Electrical and Electronics Engineers, 2008, 56 (1), pp.71-84. <10.1109/TSP.2007.900167>
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00129646/file/IEEESP06R3.pdf BibTex
titre
Predicting Non-Stationary Processes
auteur
Daniil Ryabko, M. Hutter
article
Applied Mathematics Letters, Elsevier, 2008, 21 (5), pp.477-482
Accès au bibtex
BibTex
titre
Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
auteur
Andras Antos, Csaba Szepesvari, Rémi Munos
article
Machine Learning Journal, Springer, 2008, pp.71:89-129
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830201/file/sapi_MLJ08.pdf BibTex
titre
On the Possibility of Learning in Reactive Environments with Arbitrary Dependence
auteur
Daniil Ryabko, M. Hutter
article
Theoretical Computer Science, Elsevier, 2008, 405, pp.274-284
Accès au bibtex
BibTex

Conference papers

titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
auteur
Sertan Girgin, Philippe Preux
article
8th International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. IEEE Press, pp.75-82, 2008, Proc. of the International Conference on Machine Learning and Applications (ICML-A)
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00356262/file/icmla08.pdf BibTex
titre
Online Optimization in X-Armed Bandits
auteur
Sébastien Bubeck, Rémi Munos, Gilles Stoltz, Csaba Szepesvari
article
Twenty-Second Annual Conference on Neural Information Processing Systems, Dec 2008, Vancouver, Canada. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00329797/file/HOO_non-anonymous.pdf BibTex
titre
Basis Function Construction in Reinforcement Learning using Cascade-Correlation Learning Architecture
auteur
Sertan Girgin, Philippe Preux
article
International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. IEEE Press, pp.75-82, 2008, Proceedings of the International Conference on Machine Learning and Applications (ICML-A)
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00826054/file/icmla08.pdf BibTex
titre
Some sufficient conditions on an arbitrary class of stochastic processes for the existence of a predictor.
auteur
Daniil Ryabko
article
Freund, Y.; Györfi, L.; Turán, G.; Zeugmann, Th. 19th International Conference on Algorithmic Learning Theory, ALT 2008, Oct 2008, Budapest, Hungary. Springer, 5254, pp.169-182, 2008, Lecture Notes in Artificial Intelligence; Lecture Notes in Artificial Intelligence (LNAI). <http://link.springer.com/chapter/10.1007/978-3-540-87987-9_17>. <10.1007/978-3-540-87987-9_17>
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00347706/file/pq_.pdf BibTex
titre
Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength
auteur
Rémi Coulom
article
van den Herik, H. J. and Xu, Xinhe and Ma, Zongming and Winands, M.H.M. Computer and Games, Sep 2008, Beijing, China. Springer, 5131, pp.113–124, 2008, Lectures Notes in Computer Science; Computers and Games
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00323349/file/WHR.pdf BibTex
titre
Conditional anomaly detection methods for patient-management alert systems
auteur
Michal Valko, Gregory Cooper, Amy Seybert, Shyam Visweswaran, Melissa Saul, Milos Hauskrecht
article
Workshop on Machine Learning in Health Care Applications in The 25th International Conference on Machine Learning, Jul 2008, Helsinki, Finland
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643221/file/valko2008conditional.pdf BibTex
titre
Optimal policies search for sensor management : Application to the ESA radar
auteur
Thomas Bréhard, Pierre-Arnaud Coquelin, Emmanuel Duflos, Philippe Vanheeghe
article
11th International Conference on Information Fusion, 2008., Jun 2008, Cologne, Germany. pp.1 – 8, 2008
Accès au bibtex
BibTex
titre
Optimal Policies Search for Sensor Management
auteur
Thomas Bréhard, Emmanuel Duflos, Philippe Vanheeghe, Pierre-Arnaud Coquelin
article
FUSION 2008, Jun 2008, Cologne, Germany. pp.1 – 8, 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00368875/file/Fusion2008_SensorManagement_EDuflos.pdf BibTex
titre
Reception State Estimation of GNSS satellites in urban environment using particle filtering
auteur
Donnay Fleury Nahimana, Emmanuel Duflos, Juliette Marais
article
FUSION 2008, Jun 2008, Cologne, Germany. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00368867/file/Paper_Fusion2008.pdf BibTex
titre
Basis Expansion in Natural Actor Critic Methods
auteur
Sertan Girgin, Philippe Preux
article
Girgin, Loth, Munos, Preux. European Workshop on Reinforcement Learning, Jun 2008, Villeneuve d’Ascq, France. Springer, 5323, pp.110-123, 2008, LNAI; Recent Advances in Reinforcement Learning
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00826055/file/ewrl8.pdf BibTex
titre
Distance Metric Learning for Conditional Anomaly Detection
auteur
Michal Valko, Milos Hauskrecht
article
Twenty-First International Florida Artificial Intelligence Research Society Conference, May 2008, Coconut Grove, Florida, United States. AAAI Press
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643244/file/Valko.pdf BibTex
titre
Speech recognition with speech density estimation by the dirichlet process mixture
auteur
Kenko Ota, Emmanuel Duflos, Philippe Vanheeghe, Masuzo Yanagida
article
IEEE International Conference on Acoustics, Speech and Signal Processing, 2008. ICASSP 2008., Mar 2008, Las Vegas, United States. pp.1553 – 1556, 2008, <10.1109/ICASSP.2008.4517919>
Accès au bibtex
BibTex
titre
Learning predictive models for combinations of heterogeneous proteomic data sources
auteur
Michal Valko, Richard Pelikan, Milos Hauskrecht
article
AMIA Summit on Translational Bioinformatics, Mar 2008, San Francisco, United States. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643349/file/valko2008learning.pdf BibTex
titre
Feature discovery in reinforcement learning using genetic programming
auteur
Sertan Girgin, Philippe Preux
article
11th European Conference on Genetic Programming (EUROGP), 2008, Naples, Italy. Springer, 4971, pp.218-229, 2008, LNCS. <http://link.springer.com/chapter/10.1007%2F978-3-540-78671-9_19>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00826056/file/fdrl.pdf BibTex
titre
Infinitely many-armed bandits
auteur
Yizao Wang, Jean-Yves Audibert, Rémi Munos
article
Advances in Neural Information Processing Systems, 2008, Canada. 2008
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830178/file/many-armed.pdf BibTex
titre
Optimistic planning of deterministic systems
auteur
Jean-Francois Hren, Rémi Munos
article
European Workshop on Reinforcement Learning, 2008, France. pp.151-164, 2008
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830182/file/ewrl08.pdf BibTex
titre
Adaptative play in texas hold’em poker
auteur
Raphael Maitrepierre, Jérémie Mary, Rémi Munos
article
European Conference on Artificial Intelligence, 2008, France. 2008
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830189/file/poker_ecai08.pdf BibTex
titre
Particle filter-based policy gradient for pomdps
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
Advances in Neural Information Processing Systems, 2008, Canada. 2008
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830173/file/gradient_POMDP_nips08.pdf BibTex

Book sections

titre
Programmation dynamique avec approximation de la fonction valeur
auteur
Rémi Munos
article
Processus décisionnels de Markov et intelligence artificielle, Hermes, pp.19-50, 2008
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00830192/file/bouquinPDMIA.pdf BibTex

Reports

titre
The Equi-Correlation Network: a New Kernelized-LARS with Automatic Kernel Parameters Tuning
auteur
Manuel Loth, Philippe Preux
article
[Research Report] RR-6794, INRIA. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00351930/file/RR-6794.pdf BibTex
titre
Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs
auteur
Pierre Arnaud Coquelin, Romain Deguest, Rémi Munos
article
[Research Report] RR-6710, INRIA. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00336203/file/RR6710.pdf BibTex
titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
auteur
Sertan Girgin, Philippe Preux
article
[Research Report] RR-6505, INRIA. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00272368/file/inria.pdf BibTex

2007

Journal articles

titre
L’Ordinateur, champion de go ?
auteur
Sylvain Gelly, Rémi Munos
article
Pour la science, Paris : E. Belin, 2007, 354, pp.28-35
Accès au bibtex
BibTex
titre
Analyse en norme Lp de l’algorithme d’itérations sur les valeurs avec approximations
auteur
Rémi Munos
article
Revue des Sciences et Technologies de l’Information – Série RIA : Revue d’Intelligence Artificielle, Lavoisier, 2007, 21
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00116987/file/avi_RIA_final.pdf BibTex
titre
Performance Bounds in Lp norm for Approximate Value Iteration
auteur
Rémi Munos
article
SIAM Journal on Control and Optimization, Society for Industrial and Applied Mathematics, 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00124685/file/avi_siam_final.pdf BibTex

Conference papers

titre
Consistent Minimization of Clustering Objective Functions
auteur
Ulrike Von Luxburg, Sébastien Bubeck, Stefanie Jegelka, Michael Kaufmann
article
Neural Information Processing Systems, Dec 2007, Vancouver, Canada. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00185777/file/LuxburgBubeckJegelka_nips07.pdf BibTex
titre
Monte-Carlo Tree Search in Crazy Stone
auteur
Rémi Coulom
article
Takeshi Ito and Akihiro Kishimoto. 12th Game Programming Workshop, Nov 2007, Hakone, Japan. 2007
Accès au bibtex
BibTex
titre
Computing Elo Ratings of Move Patterns in the Game of Go
auteur
Rémi Coulom
article
van den Herik, H. Jaap and Mark Winands and Jos Uiterwijk and Maarten Schadd. Computer Games Workshop, Jun 2007, Amsterdam, Netherlands. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00149859/file/MMGoPatterns.pdf BibTex
titre
A Unified View of TD Algorithms; Introducing Full-Gradient TD and Equi-Gradient Descent TD
auteur
Manuel Loth, Philippe Preux, Manuel Davy
article
European Symposium on Artificial Neural Networks, Apr 2007, Bruges, Belgium, Belgium. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00116936/file/unified.pdf BibTex
titre
A Dynamic Programming Approach to Viability Problems
auteur
Pierre-Arnaud Coquelin, Sophie Martin, Rémi Munos
article
IEEE ADPRL, Apr 2007, Hawai, United States. pp.178-184, 2007, Proceedings of the 2007 IEEE Symposium on Approximate Dynamic Programming and Reinforcement Learning (ADPRL 2007)
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00125423/file/viabilite.pdf BibTex
titre
Sparse Temporal Difference Learning using LASSO
auteur
Manuel Loth, Manuel Davy, Philippe Preux
article
IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, Apr 2007, Hawaï, USA, United States. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117075/file/lassoTd.pdf BibTex
titre
Bandit Algorithms for Tree Search
auteur
Pierre-Arnaud Coquelin, Rémi Munos
article
Uncertainty in Artificial Intelligence, 2007, Vancouver, Canada. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00150207/file/BAST.pdf BibTex
titre
Value-Iteration Based Fitted Policy Iteration: Learning with a Single Trajectory
auteur
Andras Antos, Csaba Szepesvari, Rémi Munos
article
IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007, Hawai, United States. pp.2007, 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00124833/file/sapi_adprl_final.pdf BibTex
titre
Fitted Q-iteration in continuous action-space MDPs
auteur
Andras Antos, Rémi Munos, Csaba Szepesvari
article
Neural Information Processing Systems, 2007, Vancouver, Canada. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00203359/file/rlca.pdf BibTex
titre
Tuning bandit algorithms in stochastic environments
auteur
Jean-Yves Audibert, Rémi Munos, Csaba Szepesvari
article
Algorithmic Learning Theory, 2007, Sendai, Japan. pp.150-165, 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00203487/file/ucb_alt.pdf BibTex
titre
Time Allocation of a Set of Radars in a Multitarget Environment
auteur
Emmanuel Duflos, Marie De Vilmorin, Philippe Vanheeghe
article
FUSION 2007, 2007, Québec, Canada. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00368905/file/fusion2007_final.pdf BibTex

Reports

titre
Optimal Policies Search for Sensor Management : Application to the AESA Radar
auteur
Thomas Bréhard, Pierre-Arnaud Coquelin, Emmanuel Duflos
article
[Research Report] RR-6361, INRIA. 2007, pp.21
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00188292/file/RR-6361.pdf BibTex
titre
Bandit Algorithms for Tree Search
auteur
Pierre-Arnaud Coquelin, Rémi Munos
article
[Research Report] RR-6141, INRIA. 2007, pp.20
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00136198/file/RR-6141.pdf BibTex
titre
Feature Discovery in Reinforcement Learning using Genetic Programming
auteur
Sertan Girgin, Philippe Preux
article
[Research Report] INRIA. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00187997/file/RR-6358.pdf BibTex
titre
Fitted Q-iteration in continuous action-space MDPs
auteur
Andras Antos, Rémi Munos, Csaba Szepesvari
article
[Technical Report] 2007, pp.24
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00185311/file/rlca.pdf BibTex
titre
Finite Time Bounds for Sampling-Based Fitted Value Iteration
auteur
Rémi Munos, Csaba Szepesvari
article
[Research Report] 2007, pp.46
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00120882/file/savi_1.5.pdf BibTex
titre
Numerical methods for sensitivity analysis of Feynman-Kac models
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
[Research Report] 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00125427/file/gradient.pdf BibTex

Preprints, Working Papers, …

titre
A Dynamic Programming Approach to Viability Problems
auteur
Pierre-Arnaud Coquelin, Sophie Martin, Rémi Munos
article
2007
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00125248/file/viabilite.pdf BibTex
titre
Numerical methods for sensitivity analysis of Feynman-Kac models
auteur
Pierre-Arnaud Coquelin, Romain Deguest, Rémi Munos
article
2007
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00125254/file/gradient.pdf BibTex

2006

Journal articles

titre
An anti-diffusive scheme for viability problems
auteur
Olivier Bokanowski, Sophie Martin, Rémi Munos, Hasnaa Zidani
article
Applied Numerical Mathematics, Elsevier, 2006, 56 (9), pp.1147-1162
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00112062/file/bokanowski.pdf BibTex
titre
Geometric Variance Reduction in Markov Chains: Application to Value Function and Gradient Estimation
auteur
Rémi Munos
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2006, 7, pp.413-427
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117153/file/fast_mc_jmlr.pdf BibTex
titre
Policy Gradient in Continuous Time
auteur
Rémi Munos
article
Journal of Machine Learning Research, Journal of Machine Learning Research, 2006, 7, pp.771-791
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117152/file/munos06b.pdf BibTex
titre
Bayesian Analysis of Polyphonic western tonal Music
auteur
Manuel Davy, Simon J. Godsill, Jérôme Idier
article
Journal of the Acoustical Society of America, Acoustical Society of America, 2006, 119 (4), pp.2498-2517
Accès au bibtex
BibTex
titre
Numerical methods for the pricing of Swing options: a stochastic control approach
auteur
Christophe Barrera-Esteve, Florent Bergeret, Charles Dossal, Emmanuel Gobet, Asma Meziou, Rémi Munos, Damien Reboul-Salze
article
Methodology and Computing in Applied Probability, Springer Verlag, 2006, Methodology and Computing in Applied Probability, 8 (4), pp.517-540
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117175/file/swing.pdf BibTex
titre
An Online Support Vector Machine for Abnormal Events Detection
auteur
Manuel Davy, Frederic Desobry, Arthur Gretton, Christian Doncarli
article
Signal Processing, Elsevier, 2006, 86 (8), pp.2009-2025
Accès au bibtex
BibTex

Conference papers

titre
A Comparison of Chief Complaints and Emergency Department Reports for Identifying Patients with Acute Lower Respiratory Syndrome
auteur
Wendy Chapman, John Dowling, Gregory F Cooper, Milos Hauskrecht, Michal Valko
article
International Society for Disease Surveillance, Oct 2006, Baltimore, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643495/file/chapman2006comparison.pdf BibTex
titre
Equi-Gradient Temporal Difference Learning
auteur
Manuel Loth, Manuel Davy, Rémi Coulom, Philippe Preux
article
Kernel Methods and Reinforcement Learning, workshop of ICML 2006, Jun 2006, Pittsburgh, USA, United States. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117178/file/Loth_ICML_KRL_2006.pdf BibTex
titre
Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
auteur
Andras Antos, Csaba Szepesvari, Rémi Munos
article
Conference On Learning Theory, Jun 2006, Pittsburgh, USA, 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117130/file/antos-colt06.pdf BibTex
titre
Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search
auteur
Rémi Coulom
article
Paolo Ciancarini and H. Jaap van den Herik. 5th International Conference on Computer and Games, May 2006, Turin, Italy. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00116992/file/CG2006.pdf BibTex
titre
Application des machines a vecteurs support mono-classe a l’indexation en locuteurs de documents audio
auteur
Belkacem Fergani, Manuel Davy, Amrane Houacine
article
Journees d’Etude sur la Parole 2006, 2006, Dinard, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119998/file/final-28.pdf BibTex
titre
JOINT SEGMENTATION OF PIECEWISE CONSTANT AUTOREGRESSIVE PROCESSES BY USING A HIERARCHICAL MODEL AND A BAYESIAN SAMPLING APPROACH
auteur
Nicolas Dobigeon, Jean-Yves Tourneret, Manuel Davy
article
IEEE ICASSP 2006, 2006, Toulouse, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119997/file/Dobigeon_ICASSP_2006.pdf BibTex
titre
Bayesian Inference for Dynamic Models with Dirichlet Process Mixtures
auteur
Francois Caron, Manuel Davy, Arnaud Doucet, Emmanuel Duflos, Philippe Vanheeghe
article
9th IEEE International Conference on Information Fusion, 2006, Florence, Italy. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119993/file/Caron_Fusion_2006.pdf BibTex
titre
MAXIMUM LIKELIHOOD PARAMETER ESTIMATION FOR LATENT VARIABLE MODELS USING SEQUENTIAL MONTE CARLO
auteur
Adam Johansen, Arnaud Doucet, Manuel Davy
article
2006 IEEE International Conference on Acoustics, Speech, and Signal Processing : conference proceedings, May 14-19, 2006, Toulouse, 2006, Toulouse, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119988/file/Johansen_ICASSP_2006.pdf BibTex
titre
ESTIMATION OF MINIMUM MEASURE SETS IN REPRODUCING KERNEL HILBERT SPACES AND APPLICATIONS.
auteur
Manuel Davy, Frederic Desobry, Stephane Canu
article
IEEE ICASSP 2006, 2006, Toulouse, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00119999/file/Desobry_ICASSP_2006.pdf BibTex

Book sections

titre
Feature Selection and Dimensionality Reduction in Genomics and Proteomics
auteur
Milos Hauskrecht, Richard Pelikan, Michal Valko, James Lyons-Weiler
article
Werner Dubitzky, Martin Granzow and Daniel Berrar. Fundamentals of Data Mining in Genomics and Proteomics, Springer, pp.149-172, 2006, <10.1007/978-0-387-47509-7>
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643496/file/chapter-Hauskrecht.pdf BibTex

Other publications

titre
Use of variance estimation in the multi-armed bandit problem
auteur
Jean-Yves Audibert, Rémi Munos, Csaba Szepesvari
article
NIPS Workshop on On-line Trading of Exploration and ExploitationWorkshop. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00203496/file/ucbtuned.pdf BibTex

Books

titre
Signal Processing Methods for Music Transcription
auteur
Anssi Klapuri, Manuel Davy
article
Springer, pp.456, 2006, 0-387-30667-6
Accès au bibtex
BibTex

Reports

titre
Modification of UCT with Patterns in Monte-Carlo Go
auteur
Sylvain Gelly, Yizao Wang, Rémi Munos, Olivier Teytaud
article
[Research Report] RR-6062, INRIA. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00117266/file/RR-6062.pdf BibTex

2005

Master thesis

titre
Evolving Neural Networks for Statistical Decision Theory
auteur
Michal Valko
article
Machine Learning [stat.ML]. 2005
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00646451/file/nesdt.pdf BibTex

Comments are closed