Please scroll-down a little bit to reach our publications, or click here.
Software
The Reinforcement Learning Gym Scool
Along the time, Scool members have developed a set of Gym environments for various tasks, to be used as RL environments.
- 2022: we collaborate on SofaGym which is a gym environment to control soft robots. Main development done in Defrost research group.
- 2021: gym-dssat: an easy to manipulate crop environment for Reinforcement Learning based on the celebrated “Decision Support System for Agrotechnology Transfer” (DSSAT)software
- 2021: rlberry: Our Scool-made Reinforcement Learning Library for Research and Education
- 2021: gym-barricades: a gym environment for the game Barricades to train an RL agent
- 2021: gym-morpion-solitaire: a gym environment for the game “morpion solitaire” to train an RL agent
- 2020: highway-env: A gym environment to learn to drive on a (simulated) highway
- 2019: gym-tdgammon: A gym environment for Backgammon
- 2019: gym-rubik: A gym environment for the Rubik’s cube
Other Scool software
Older software on SequeL website.
Publications
Previous publications are on our former group website (SequeL).
2023
Conference papers
- titre
- Farm-gym: A modular reinforcement learning platform for stochastic agronomic games
- auteur
- Odalric-Ambrym Maillard, Timothée Mathieu, Debabrota Basu
- article
- Artificial Intelligence for Agriculture and Food Systems (AIAFS), Feb 2023, Wahington DC, United States
- Accès au texte intégral et bibtex
-
- titre
- Learning crop management by reinforcement: gym-DSSAT
- auteur
- Romain Gautron, Emilio J Padrón, Philippe Preux, Julien Bigot, Odalric-Ambrym Maillard, Gerrit Hoogenboom, Julien Teigny
- article
- AIAFS 2023 – 2nd AAAI Workshop on AI for Agriculture and Food Systems, Feb 2023, Washignton DC, United States
- Accès au texte intégral et bibtex
-
- titre
- Soft Action Priors: Towards Robust Policy Transfer
- auteur
- Matheus Centa, Philippe Preux
- article
- AAAI 2023 – Thirty-Seventh AAAI Conference on Artificial Intelligence, Feb 2023, Washignton DC, United States
- Accès au texte intégral et bibtex
-
Preprints, Working Papers, …
- titre
- Online Instrumental Variable Regression: Regret Analysis and Bandit Feedback
- auteur
- Riccardo Della Vecchia, Debabrota Basu
- article
- 2023
- Accès au texte intégral et bibtex
-
- titre
- Adapting to game trees in zero-sum imperfect information games
- auteur
- Côme Fiegel, Pierre Ménard, Tadashi Kozuno, Rémi Munos, Vianney Perchet, Michal Valko
- article
- 2023
- Accès au bibtex
-
2022
Journal articles
- titre
- Reinforcement Learning for crop management
- auteur
- Romain Gautron, Odalric-Ambrym Maillard, Philippe Preux, Marc Corbeels, Régis Sabbadin
- article
- Computers and Electronics in Agriculture, 2022, 200, pp.107182. ⟨10.1016/j.compag.2022.107182⟩
- Accès au texte intégral et bibtex
-
- titre
- Efficient Change-Point Detection for Tackling Piecewise-Stationary Bandits
- auteur
- Lilian Besson, Emilie Kaufmann, Odalric-Ambrym Maillard, Julien Seznec
- article
- Journal of Machine Learning Research, 2022
- Accès au texte intégral et bibtex
-
- titre
- Concentration study of M-estimators using the influence function
- auteur
- Timothée Mathieu
- article
- Electronic Journal of Statistics , 2022, 16 (1), pp.3695-3750. ⟨10.1214/22-ejs2030⟩
- Accès au texte intégral et bibtex
-
- titre
- SofaGym: An open platform for Reinforcement Learning based on Soft Robot simulations
- auteur
- Etienne Ménager, Pierre Schegg, Elie Khairallah, Damien Marchal, Jérémie Dequidt, Philippe Preux, Christian Duriez
- article
- Soft Robotics, In press
- Accès au texte intégral et bibtex
-
- titre
- Topics in robust statistical learning
- auteur
- Claire Brécheteau, Edouard Genetay, Timothee Mathieu, Adrien Saumard
- article
- ESAIM: Proceedings and Surveys, In press
- Accès au texte intégral et bibtex
-
- titre
- Collaborative Algorithms for Online Personalized Mean Estimation
- auteur
- Mahsa Asadi, Aurélien Bellet, Odalric-Ambrym Maillard, Marc Tommasi
- article
- Transactions on Machine Learning Research, 2022
- Accès au texte intégral et bibtex
-
Conference papers
- titre
- Better state exploration using action sequence equivalence
- auteur
- Nathan Grinsztajn, Toby Johnstone, Johan Ferret, Philippe Preux
- article
- NeurIPS workshop on Deep Reinforcement Learning, Dec 2022, Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- When Privacy Meets Partial Information: A Refined Analysis of Differentially Private Bandits
- auteur
- Achraf Azize, Debabrota Basu
- article
- Advances in Neural Information Processing Systems, Dec 2022, New Orleans, United States
- Accès au texte intégral et bibtex
-
- titre
- Near-Optimal Collaborative Learning in Bandits
- auteur
- Clémence Réda, Sattar Vakili, Emilie Kaufmann
- article
- NeurIPS 2022 – 36th Conference on Neural Information Processing System, Dec 2022, New Orleans, United States
- Accès au texte intégral et bibtex
-
- titre
- On Elimination Strategies for Bandit Fixed-Confidence Identification
- auteur
- Andrea Tirinzoni, Rémy Degenne
- article
- NeurIPS 2022 – 36th Conference on Neural Information Processing System, Nov 2022, New Orleans, United States
- Accès au bibtex
-
- titre
- Top Two Algorithms Revisited
- auteur
- Marc Jourdan, Rémy Degenne, Dorian Baudry, Rianne de Heide, Emilie Kaufmann
- article
- NeurIPS 2022 – 36th Conference on Neural Information Processing System, Nov 2022, New Orleans, United States
- Accès au texte intégral et bibtex
-
- titre
- IMED-RL: Regret optimal learning of ergodic Markov decision processes
- auteur
- Fabien Pesquerel, Odalric-Ambrym Maillard
- article
- NeurIPS 2022 – Thirty-sixth Conference on Neural Information Processing Systems, Nov 2022, New-Orleans, United States
- Accès au texte intégral et bibtex
-
- titre
- Near Instance-Optimal PAC Reinforcement Learning for Deterministic MDPs
- auteur
- Andrea Tirinzoni, Aymen Al-Marjani, Emilie Kaufmann
- article
- NeurIPS 2022 – 36th Conference on Neural Information Processing System, Nov 2022, New Orleans, United States
- Accès au texte intégral et bibtex
-
- titre
- On Meritocracy in Optimal Set Selection
- auteur
- Thomas Kleine Buening, Meirav Segal, Debabrota Basu, Anne-Marie George, Christos Dimitrakakis
- article
- EAAMO 2022- Equity and Access in Algorithms, Mechanisms, and Optimization, ACM, Oct 2022, Arlington, United States
- Accès au bibtex
-
- titre
- Near Instance-Optimal PAC Reinforcement Learning for Deterministic MDPs
- auteur
- Andrea Tirinzoni, Aymen Al-Marjani, Emilie Kaufmann
- article
- EWRL 2022 – European Workshop on Reinforcement Learning, Sep 2022, Milan, Italy
- Accès au texte intégral et bibtex
-
- titre
- Risk-aware linear bandits with convex loss
- auteur
- Patrick Saux, Odalric-Ambrym Maillard
- article
- European Workshop on Reinforcement Learning, Sep 2022, Milan, Italy
- Accès au texte intégral et bibtex
-
- titre
- Optimistic PAC Reinforcement Learning: the Instance-Dependent View
- auteur
- Andrea Tirinzoni, Aymen Al-Marjani, Emilie Kaufmann
- article
- EWRL 2022 – European Workshop on Reinforcement Learning, Sep 2022, Milan, Italy
- Accès au texte intégral et bibtex
-
- titre
- Bilinear Exponential Family of MDPs: Frequentist Regret Bound with Tractable Exploration & Planning
- auteur
- Reda Ouhamma, Debabrota Basu, Odalric-Ambrym Maillard
- article
- EWRL 2022 – European Workshop on Reinforcement Learning, Sep 2022, Milan, Italy
- Accès au texte intégral et bibtex
-
- titre
- UDO: Universal Database Optimization using Reinforcement Learning
- auteur
- Junxiong Wang, Immanuel Trummer, Debabrota Basu
- article
- Proceedings of the VLDB Endowment, Sep 2022, Sydney, Australia. pp.3402-3414, ⟨10.14778/3484224.3484236⟩
- Accès au bibtex
-
- titre
- SENTINEL: Taming Uncertainty with Ensemble-based Distributional Reinforcement Learning
- auteur
- Hannes Eriksson, Debabrota Basu, Mina Alibeigi, Christos Dimitrakakis
- article
- UAI 2022- Proceedings of the Thirty-Eighth Conference on Uncertainty in Artificial Intelligence, Aug 2022, Eindhoven, Netherlands. pp.631-640
- Accès au texte intégral et bibtex
-
- titre
- Survey on Large Scale Neural Network Training
- auteur
- Julia Gusak, Daria Cherniuk, Alena Shilova, Alexandr Katrutsa, Daniel Bershatsky, Xunyi Zhao, Lionel Eyraud-Dubois, Oleh Shliazhko, Denis Dimitrov, Ivan Oseledets, Olivier Beaumont
- article
- IJCAI-ECAI 2022 – 31st International Joint Conference on Artificial Intelligence, Jul 2022, Vienna, Austria. pp.5494-5501, ⟨10.24963/ijcai.2022/769⟩
- Accès au texte intégral et bibtex
-
- titre
- Meta-learning from Learning Curves: Challenge Design and Baseline Results
- auteur
- Manh Hung Nguyen, Lisheng Sun-Hosoya, Nathan Grinsztajn, Isabelle Guyon
- article
- IJCNN 2022 – International Joint Conference on Neural Networks, Jul 2022, Padua, Italy. pp.1-8
- Accès au texte intégral et bibtex
-
- titre
- Choosing Answers in epsilon-Best-Answer Identification for Linear Bandits
- auteur
- Marc Jourdan, Rémy Degenne
- article
- 39th International Conference on Machine Learning (ICML 2022), Jul 2022, Baltimore, United States
- Accès au bibtex
-
- titre
- SAAC: Safe Reinforcement Learning as an Adversarial Game of Actor-Critics
- auteur
- Yannis Flet-Berliac, Debabrota Basu
- article
- RLDM 2022 – The Multi-disciplinary Conference on Reinforcement Learning and Decision Making, Jun 2022, Providence, United States
- Accès au texte intégral et bibtex
-
- titre
- MadPipe: Memory Aware Dynamic Programming Algorithm for Pipelined Model Parallelism
- auteur
- Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
- article
- ScaDL 2022 – Scalable Deep Learning over Parallel and Distributed Infrastructure – An IPDPS 2022 Workshop, Jun 2022, Lyon / Virtual, France
- Accès au texte intégral et bibtex
-
- titre
- Risk-Sensitive Bayesian Games for Multi-Agent Reinforcement Learning under Policy Uncertainty
- auteur
- Hannes Eriksson, Debabrota Basu, Mina Alibeigi, Christos Dimitrakakis
- article
- OptLearnMAS@AAMAS, May 2022, Virtual, New Zealand
- Accès au bibtex
-
- titre
- Automated planning for robotic guidewire navigation in the coronary arteries
- auteur
- Pierre Schegg, Jérémie Dequidt, Eulalie Coevoet, Edouard Leurent, Rémi Sabatier, Philippe Preux, Christian Duriez
- article
- Robosoft 2022 – International Conference on Soft Robotics, Apr 2022, Edimbourg, United Kingdom
- Accès au texte intégral et bibtex
-
- titre
- Efficient Algorithms for Extreme Bandits
- auteur
- Dorian Baudry, Yoan Russac, Emilie Kaufmann
- article
- International conferenece on Articifial Intelligence and Statistics (AISTATS), Mar 2022, Virtual Conference, Spain
- Accès au texte intégral et bibtex
-
- titre
- Algorithmic fairness verification with graphical models
- auteur
- Bishwamittra Ghosh, Debabrota Basu, Kuldeep S. Meel
- article
- AAAI-2022 – 36th AAAI Conference on Artificial Intelligence, Feb 2022, Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- Interpretable Knowledge Tracing: Simple and Efficient Student Modeling with Causal Relations
- auteur
- Sein Minn, Jill-Jênn Vie, Koh Takeuchi, Hisashi Kashima, Feida Zhu
- article
- Proceedings of the AAAI Conference on Artificial Intelligence, Feb 2022, Vancouver, Canada. pp.12810-12818, ⟨10.1609/aaai.v36i11.21560⟩
- Accès au texte intégral et bibtex
-
- titre
- Offline Reinforcement Learning as Anti-Exploration
- auteur
- Shideh Rezaeifar, Robert Dadashi, Nino Vieillard, Léonard Hussenot, Olivier Bachem, Olivier Pietquin, Matthieu Geist
- article
- AAAI 2022 – 36th AAAI Conference on Artificial Intelligence, Association for the Advancement of Artificial Intelligence (AAAI), Feb 2022, Vancouver, Canada
- Accès au bibtex
-
- titre
- Procrastinated Tree Search: Black-box Optimization with Delayed, Noisy, and Multi-fidelity Feedback
- auteur
- Junxiong Wang, Debabrota Basu, Immanuel Trummer
- article
- AAAI Conference on Artificial Intelligence, Feb 2022, Virtual, United States. pp.10381-10390
- Accès au texte intégral et bibtex
-
Book sections
- titre
- Foundations and state of the art
- auteur
- Nathalie Mitton, Ludovic Brossard, Tassadit Bouadi, Frédérick Garcia, Romain Gautron, Nadine Hilgert, Dino Ienco, Christine Largouët, Evelyne Lutton, Véronique Masson, Roger Martin-Clouaire, Marie-Laure Mugnier, Pascal Neveu, Philippe Preux, Helene Raynal, Catherine Roussey, Alexandre Termier, Véronique Bellon Maurel
- article
- Agriculture and Digital Technology: Getting the most out of digital technology to contribute to the transition to sustainable agriculture and food systems, 6, INRIA, pp.30-75, 2022, White book Inrira
- Accès au texte intégral et bibtex
-
Poster communications
- titre
- Petits jeux de données et prédiction en Intelligence Artificielle, vers une meilleure cohabitation : Application à la gestion durable de l’enherbement des systèmes agricoles à La Réunion
- auteur
- Frédérick Fabre Ferber, Jean Diatta, Jean-Christophe Soulié, Dominique Gay, Odalric-Ambrym Maillard, Thomas Le Bourgeois, Sandrine Auzoux
- article
- Comité scientifique et technique du DPP CapTerre, Nov 2022, Saint-Leu de La Réunion, Réunion
- Accès au texte intégral et bibtex
-
Reports
- titre
- Entropy Regularized Reinforcement Learning with Cascading Networks
- auteur
- Riccardo Della Vecchia, Alena Shilova, Philippe Preux, Riad Akrour
- article
- [Research Report] 7003, Inria Lille Nord Europe – Laboratoire CRIStAL – Université de Lille. 2022, pp.16
- Accès au texte intégral et bibtex
-
- titre
- gym-DSSAT: a crop model turned into a Reinforcement Learning environment
- auteur
- Romain Gautron, Emilio J. Padrón, Philippe Preux, Julien Bigot, Odalric-Ambrym Maillard, David Emukpere
- article
- [Research Report] RR-9460, Inria Lille. 2022, pp.31
- Accès au texte intégral et bibtex
-
- titre
- An Integer Linear Programming Approach for Pipelined Model Parallelism
- auteur
- Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
- article
- [Research Report] RR-9452, Inria. 2022
- Accès au texte intégral et bibtex
-
Theses
- titre
- Non-Parametric Algorithms for Multi-Armed Bandits
- auteur
- Dorian Baudry
- article
- Computer Science [cs]. Université de Lille, 2022. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
- titre
- Combination of gene regulatory networks and sequential machine learning for drug repurposing
- auteur
- Clémence Réda
- article
- Artificial Intelligence [cs.AI]. Université Paris Cité, 2022. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
- titre
- Exploration in Reinforcement Learning: Beyond Finite State-Spaces
- auteur
- Omar Darwiche Domingues
- article
- Machine Learning [cs.LG]. Université de Lille, 2022. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
Preprints, Working Papers, …
- titre
- Non-Asymptotic Analysis of a UCB-based Top Two Algorithm
- auteur
- Marc Jourdan, Rémy Degenne
- article
- 2022
- Accès au bibtex
-
- titre
- How Biased is Your Feature?: Computing Fairness Influence Functions with Global Sensitivity Analysis
- auteur
- Bishwamittra Ghosh, Debabrota Basu, Kuldeep S. Meel
- article
- 2022
- Accès au bibtex
-
- titre
- Meta-learning from Learning Curves Challenge: Lessons learned from the First Round and Design of the Second Round
- auteur
- Manh Hung Nguyen, Lisheng Sun, Nathan Grinsztajn, Isabelle Guyon
- article
- 2022
- Accès au texte intégral et bibtex
-
- titre
- Bandits Corrupted by Nature: Lower Bounds on Regret and Robust Optimistic Algorithm
- auteur
- Debabrota Basu, Odalric-Ambrym Maillard, Timothée Mathieu
- article
- 2022
- Accès au texte intégral et bibtex
-
- titre
- Weight Offloading Strategies for Training Large DNN Models
- auteur
- Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova, Xunyi Zhao
- article
- 2022
- Accès au texte intégral et bibtex
-
2021
Journal articles
- titre
- Mixture Martingales Revisited with Applications to Sequential Tests and Confidence Intervals
- auteur
- Emilie Kaufmann, Wouter M. Koolen
- article
- Journal of Machine Learning Research, 2021
- Accès au texte intégral et bibtex
-
- titre
- Non-Asymptotic Sequential Tests for Overlapping Hypotheses and application to near optimal arm identification in bandit models
- auteur
- Aurélien Garivier, Emilie Kaufmann
- article
- Sequential Analysis, 2021
- Accès au texte intégral et bibtex
-
- titre
- Deep Learning for Deep Waters: An Expert-in-the-Loop Machine Learning Framework for Marine Sciences
- auteur
- Igor Ryazanov, Amanda Nylund, Debabrota Basu, Ida-Maja Hassellöv, Alexander Schliep
- article
- Journal of Marine Science and Engineering, 2021, 9 (2), pp.169. ⟨10.3390/jmse9020169⟩
- Accès au bibtex
-
- titre
- Fast sampling from beta-ensembles
- auteur
- Guillaume Gautier, Rémi Bardenet, Michal Valko
- article
- Statistics and Computing, 2021, 31 (7), ⟨10.1007/s11222-020-09984-0⟩
- Accès au bibtex
-
- titre
- On Multi-Armed Bandit Designs for Dose-Finding Trials
- auteur
- Maryam Aziz, Emilie Kaufmann, Marie-Karelle Riviere
- article
- Journal of Machine Learning Research, 2021
- Accès au texte intégral et bibtex
-
Conference papers
- titre
- Stochastic bandits with groups of similar arms
- auteur
- Fabien Pesquerel, Hassan Saber, Odalric-Ambrym Maillard
- article
- NeurIPS 2021 – Thirty-fifth Conference on Neural Information Processing Systems, Dec 2021, Sydney, Australia
- Accès au texte intégral et bibtex
-
- titre
- Online Sign Identification: Minimization of the Number of Errors in Thresholding Bandits
- auteur
- Reda Ouhamma, Rémy Degenne, Pierre Gaillard, Vianney Perchet
- article
- NeurIPS 2021 – 35th International Conference on Neural Information Processing Systems, Dec 2021, Virtual, Canada. pp.1-25
- Accès au texte intégral et bibtex
-
- titre
- From Optimality to Robustness: Dirichlet Sampling Strategies in Stochastic Bandits
- auteur
- Dorian Baudry, Patrick Saux, Odalric-Ambrym Maillard
- article
- NeurIPS 2021 – 35th International Conference on Neural Information Processing Systems, Dec 2021, Sydney, Australia
- Accès au texte intégral et bibtex
-
- titre
- Stochastic Online Linear Regression: the Forward Algorithm to Replace Ridge
- auteur
- Reda Ouhamma, Odalric Maillard, Vianney Perchet
- article
- NeurIPS 2021 – 35th International Conference on Neural Information Processing Systems, Dec 2021, Virtual, Canada
- Accès au texte intégral et bibtex
-
- titre
- Stochastic Shortest Path: Minimax, Parameter-Free and Towards Horizon-Free Regret
- auteur
- Jean Tarbouriech, Runlong Zhou, Simon S Du, Matteo Pirotta, Michal Valko, Alessandro Lazaric
- article
- Neural Information Processing Systems (NeurIPS), Dec 2021, Virtual/Sydney, Australia
- Accès au texte intégral et bibtex
-
- titre
- A Provably Efficient Sample Collection Strategy for Reinforcement Learning
- auteur
- Jean Tarbouriech, Matteo Pirotta, Michal Valko, Alessandro Lazaric
- article
- Neural Information Processing Systems (NeurIPS), Dec 2021, Virtual/Sydney, Australia
- Accès au texte intégral et bibtex
-
- titre
- There Is No Turning Back: A Self-Supervised Approach for Reversibility-Aware Reinforcement Learning
- auteur
- Nathan Grinsztajn, Johan Ferret, Olivier Pietquin, Philippe Preux, Matthieu Geist
- article
- Neural Information Processing Systems (2021), Dec 2021, Virtual, France
- Accès au texte intégral et bibtex
-
- titre
- Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection
- auteur
- Matteo Papini, Andrea Tirinzoni, Aldo Pacchiano, Marcello Restilli, Alessandro Lazaric, Matteo Pirotta
- article
- Thirty-Fifth Conference on Neural Information Processing Systems, Dec 2021, Virtual, France
- Accès au texte intégral et bibtex
-
- titre
- Indexed Minimum Empirical Divergence for Unimodal Bandits
- auteur
- Hassan Saber, Pierre Ménard, Odalric-Ambrym Maillard
- article
- NeurIPS 2021 – International Conference on Neural Information Processing Systems, Dec 2021, Virtual-only Conference, United States
- Accès au texte intégral et bibtex
-
- titre
- Routine Bandits: Minimizing Regret on Recurring Problems
- auteur
- Hassan Saber, Léo Saci, Odalric-Ambrym Maillard, Audrey Durand
- article
- ECML-PKDD 2021, Sep 2021, Bilbao, Spain
- Accès au texte intégral et bibtex
-
- titre
- MetaREVEAL: RL-based Meta-learning from Learning Curves
- auteur
- Manh Hung Nguyen, Nathan Grinsztajn, Isabelle Guyon, Lisheng Sun-Hosoya
- article
- Workshop on Interactive Adaptive Learning co-located with European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD 2021), Sep 2021, Bilbao/Virtual, Spain
- Accès au texte intégral et bibtex
-
- titre
- READYS: A Reinforcement Learning Based Strategy for Heterogeneous Dynamic Scheduling
- auteur
- Nathan Grinsztajn, Olivier Beaumont, Emmanuel Jeannot, Philippe Preux
- article
- IEEE Cluster 2021, Sep 2021, Portland / Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- Mean Field Games Flock! The Reinforcement Learning Way
- auteur
- Sarah Perrin, Mathieu Laurière, Julien Pérolat, Matthieu Geist, Romuald Élie, Olivier Pietquin
- article
- IJCAI, Aug 2021, Montreal, Canada
- Accès au bibtex
-
- titre
- Don’t Do What Doesn’t Matter: Intrinsic Motivation with Action Usefulness
- auteur
- Mathieu Seurin, Florian Strub, Philippe Preux, Olivier Pietquin
- article
- Internationnal Joint Conference on Artificial Intelligence (IJCAI), Aug 2021, Montreal, Canada. pp.2950–2956
- Accès au texte intégral et bibtex
-
- titre
- Fast active learning for pure exploration in reinforcement learning
- auteur
- Pierre Ménard, Omar Darwiche Domingues, Emilie Kaufmann, Anders Jonsson, Edouard Leurent, Michal Valko
- article
- International Conference on Machine Learning, Jul 2021, Vienna, Austria
- Accès au texte intégral et bibtex
-
- titre
- Kernel-based reinforcement Learning: A finite-time analysis
- auteur
- Omar D Domingues, Pierre Ménard, Matteo Pirotta, Emilie Kaufmann, Michal Valko
- article
- International Conference on Machine Learning, Jul 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- On Limited-Memory Subsampling Strategies for Bandits
- auteur
- Dorian Baudry, Yoan Russac, Olivier Cappé
- article
- ICML 2021- International Conference on Machine Learning, Jul 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Optimal Thompson Sampling strategies for support-aware CVaR bandits
- auteur
- Dorian Baudry, Romain Gautron, Emilie Kaufmann, Odalric-Ambrym Maillard
- article
- 38th International Conference on Machine Learning, Jul 2021, Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- UCB Momentum Q-learning: Correcting the bias without forgetting
- auteur
- Pierre Ménard, Omar Darwiche Domingues, Xuedong Shang, Michal Valko
- article
- International Conference on Machine Learning, Jul 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Offline Reinforcement Learning with Pseudometric Learning
- auteur
- Robert Dadashi, Shideh Rezaeifar, Nino Vieillard, Léonard Hussenot, Olivier Pietquin, Matthieu Geist
- article
- ICML 2021 – 38th International Conference on Machine Learning, Jun 2021, virtual, France
- Accès au bibtex
-
- titre
- Demonstrating UDO: A Unified Approach for Optimizing Transaction Code, Physical Design, and System Parameters via Reinforcement Learning
- auteur
- Junxiong Wang, Immanuel Trummer, Debabrota Basu
- article
- SIGMOD/PODS ’21: International Conference on Management of Data, Jun 2021, Virtual Event, China. pp.2794-2797, ⟨10.1145/3448016.3452754⟩
- Accès au bibtex
-
- titre
- Low-Rank Projections of GCNs Laplacian
- auteur
- Nathan Grinsztajn, Philippe Preux, Edouard Oyallon
- article
- ICLR 2021 Workshop GTRL, May 2021, Online, France
- Accès au texte intégral et bibtex
-
- titre
- Learning Value Functions in Deep Policy Gradients using Residual Variance
- auteur
- Yannis Flet-Berliac, Reda Ouhamma, Odalric-Ambrym Maillard, Philippe Preux
- article
- ICLR 2021 – International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Primal Wasserstein Imitation Learning
- auteur
- Robert Dadashi, Léonard Hussenot, Matthieu Geist, Olivier Pietquin
- article
- ICLR 2021 – Ninth International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Adversarially Guided Actor-Critic
- auteur
- Yannis Flet-Berliac, Johan Ferret, Olivier Pietquin, Philippe Preux, Matthieu Geist
- article
- ICLR 2021 – International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study
- auteur
- Marcin Andrychowicz, Anton Raichuk, Piotr Stańczyk, Manu Orsini, Sertan Girgin, Raphaël Marinier, Léonard Hussenot, Matthieu Geist, Olivier Pietquin, Marcin Michalski, Sylvain Gelly, Olivier Bachem
- article
- ICLR 2021 – Ninth International Conference on Learning Representations, May 2021, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Self-Imitation Advantage Learning
- auteur
- Johan Ferret, Olivier Pietquin, Matthieu Geist
- article
- AAMAS 2021 – 20th International Conference on Autonomous Agents and Multiagent Systems, May 2021, Londres / Virtual, United Kingdom
- Accès au texte intégral et bibtex
-
- titre
- Show me the Way: Intrinsic Motivation from Demonstrations
- auteur
- Léonard Hussenot, Robert Dadashi, Matthieu Geist, Olivier Pietquin
- article
- AAMAS 2021 – 20th International Conference on Autonomous Agents and Multiagent Systems, May 2021, Virtual, United Kingdom
- Accès au texte intégral et bibtex
-
- titre
- A kernel-based approach to non-stationary reinforcement learning in metric spaces
- auteur
- Omar D Domingues, Pierre Ménard, Matteo Pirotta, Emilie Kaufmann, Michal Valko
- article
- International Conference on Artificial Intelligence and Statistics, Apr 2021, San Diego / Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- Episodic reinforcement learning in finite MDPs: Minimax lower bounds revisited
- auteur
- Omar Darwiche Domingues, Pierre Ménard, Emilie Kaufmann, Michal Valko
- article
- Algorithmic Learning Theory, Mar 2021, Paris / Virtual, France
- Accès au texte intégral et bibtex
-
- titre
- Evaluating DAS3H on the EdNet Dataset
- auteur
- Benoît Choffin, Fabrice Popineau, Yolaine Bourda, Jill-Jênn Vie
- article
- AAAI 2021 – The 35th Conference on Artificial Intelligence / Imagining Post-COVID Education with AI, Feb 2021, Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- Justicia: A Stochastic SAT Approach to Formally Verify Fairness
- auteur
- Bishwamittra Ghosh, Debabrota Basu, Kuldeep S. Meel
- article
- AAAI Conference on Artificial Intelligence, Feb 2021, Virtual, Canada. pp.7554-7563
- Accès au bibtex
-
- titre
- Improved Exploration in Factored Average-Reward MDPs
- auteur
- Sadegh Talebi, Anders Jonsson, Odalric-Ambrym Maillard
- article
- 24th International Conference on Artificial Intelligence and Statistics, 2021, San diego (virtual), United States
- Accès au texte intégral et bibtex
-
- titre
- Dealing With Misspecification In Fixed-Confidence Linear Top-m Identification
- auteur
- Clémence Réda, Andrea Tirinzoni, Rémy Degenne
- article
- 35th Conference on Neural Information Processing Systems, 2021, Virtual, France
- Accès au texte intégral et bibtex
-
- titre
- Sample complexity bounds for stochastic shortest path with a generative model
- auteur
- Jean Tarbouriech, Matteo Pirotta, Michal Valko, Alessandro Lazaric
- article
- Algorithmic Learning Theory, 2021, Paris, France
- Accès au texte intégral et bibtex
-
- titre
- Reinforcement Learning in Parametric MDPs with Exponential Families
- auteur
- Sayak Ray Chowdhury, Aditya Gopalan, Odalric-Ambrym Maillard
- article
- International Conference on Artificial Intelligence and Statistics, 2021, San diego, United States. pp.1855-1863
- Accès au texte intégral et bibtex
-
- titre
- Top-m identification for linear bandits
- auteur
- Clémence Réda, Emilie Kaufmann, Andrée Delahaye-Duriez
- article
- Proceedings of the 24th International Conference on Artificial Intelligence and Statistics (AISTATS), 2021, Virtual, United States
- Accès au texte intégral et bibtex
-
- titre
- Adaptive reward-free exploration
- auteur
- Emilie Kaufmann, Pierre Ménard, Omar Darwiche Domingues, Anders Jonsson, Edouard Leurent, Michal Valko
- article
- Algorithmic Learning Theory, 2021, Paris, France
- Accès au texte intégral et bibtex
-
Book sections
- titre
- Federated Learning of Oligonucleotide Drug Molecule Thermodynamics with Differentially Private ADMM-Based SVM
- auteur
- Shirin Tavara, Alexander Schliep, Debabrota Basu
- article
- Machine Learning and Principles and Practice of Knowledge Discovery in Databases, 1525, Springer International Publishing; Springer International Publishing, pp.459-467, 2021, Communications in Computer and Information Science, ⟨10.1007/978-3-030-93733-1_34⟩
- Accès au bibtex
-
Theses
- titre
- Sample-Efficient Deep Reinforcement Learning for Control, Exploration and Safety
- auteur
- Yannis Flet-Berliac
- article
- Computer Science [cs]. Université de Lille – Faculté des Sciences et Technologies, 2021. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
- titre
- Adaptive methods for optimization in stochastic environments
- auteur
- Xuedong Shang
- article
- Artificial Intelligence [cs.AI]. Université de Lille, 2021. English. ⟨NNT : 2021LILUB007⟩
- Accès au texte intégral et bibtex
-
- titre
- Learning to Interact, Interacting to Learn Action-centric Reinforcement Learning
- auteur
- Mathieu Seurin
- article
- Machine Learning [cs.LG]. Université de Lille – Faculté des Sciences et Technologies, 2021. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
Preprints, Working Papers, …
- titre
- VISUALHINTS: A Visual-Lingual Environment for Multimodal Reinforcement Learning
- auteur
- Thomas Carta, Subhajit Chaudhury, Kartik Talamadupula, Michiaki Tatsubori
- article
- 2021
- Accès au texte intégral et bibtex
-
- titre
- Solving N-player dynamic routing games with congestion: a mean field approach
- auteur
- Theophile Cabannes, Mathieu Lauriere, Julien Perolat, Raphael Marinier, Sertan Girgin, Sarah Perrin, Olivier Pietquin, Alexandre M. Bayen, Eric Goubault, Romuald Elie
- article
- 2021
- Accès au bibtex
-
- titre
- Generalization in Mean Field Games by Learning Master Policies
- auteur
- Sarah Perrin, Mathieu Laurière, Julien Pérolat, Romuald Élie, Matthieu Geist, Olivier Pietquin
- article
- 2021
- Accès au bibtex
-
- titre
- Scaling up Mean Field Games with Online Mirror Descent
- auteur
- Julien Perolat, Sarah Perrin, Romuald Elie, Mathieu Laurière, Georgios Piliouras, Matthieu Geist, Karl Tuyls, Olivier Pietquin
- article
- 2021
- Accès au bibtex
-
- titre
- Concave Utility Reinforcement Learning: the Mean-field Game viewpoint
- auteur
- Matthieu Geist, Julien Pérolat, Mathieu Laurière, Romuald Elie, Sarah Perrin, Olivier Bachem, Rémi Munos, Olivier Pietquin
- article
- 2021
- Accès au bibtex
-
- titre
- Interferometric Graph Transform for Community Labeling
- auteur
- Nathan Grinsztajn, Louis Leconte, Philippe Preux, Edouard Oyallon
- article
- 2021
- Accès au texte intégral et bibtex
-
2020
Journal articles
- titre
- International electronic health record-derived COVID-19 clinical course profiles: the 4CE consortium
- auteur
- Gabriel A. Brat, Griffin M. Weber, Nils Gehlenborg, Paul Avillach, Nathan P. Palmer, Luca Chiovato, James Cimino, Brett K. Beaulieu-Jones, Sehi L’Yi, Mark S. Keller, Douglas S. Bell, Robert W. Follett, Lav P. Patel, Anne Sophie Jannot, Lemuel R. Waitman, Gilbert Omenn, Alberto Malovini, Jason H. Moore, Valentina Tibollo, Shawn N Murphy, Riccardo Bellazzi, David A Hanauer, Arnaud Serret-Larmande, Alba Gutierrez-Sacristan, John J Holmes, Douglas Bell, Kenneth D. Mandl, Jeffrey G Klann, Douglas A Murad, Luigia Scudeller, Mauro Bucalo, Katie Kirchoff, Jean Craig, Jihad Obeid, Vianney Jouhet, Romain Griffier, Sébastien Cossin, Bertrand Moal, Antonio Bellasi, Hans U Prokosch, Detlef Kraska, Piotr Sliz, Amelia L.M. Tan, Kee Yuan Ngiam, Alberto Zambelli, Danielle L Mowery, Emily Schiver, Batsal Devkota, Robert Bradford, Mohamad Daniar, Christel Daniel, Vincent Benoit, Romain Bey, Nicolas Paris, Patricia Serre, Nina Orlova, Julien Dubiel, Martin Hilka, Stephane Breant, Judith Leblanc, Nicolas Griffon, Anita Burgun, Melodie Bernaux, Arnaud Sandrin, Elisa Salamanca, Sylvie Cormont, Thomas Ganslandt, Tobias Gradinger, Julien Champ, Martin Boeker, Patricia Martel, Loïc Estève, Alexandre Gramfort, Olivier Grisel, Damien Leprovost, Thomas Moreau, Gael Varoquaux, Jill-Jênn Vie, Demian Wassermann, Arthur Mensch, Charlotte Caucheteux, Christian Haverkamp, Guillaume Lemaître, Silvano Bosari, Andrew South, Tianxi Cai, Isaac Kohane
- article
- npj Digital Medicine, 2020, 3 (1), pp.#109. ⟨10.1038/s41746-020-00308-0⟩
- Accès au texte intégral et bibtex
-
- titre
- Interdisciplinary Research in Artificial Intelligence: Challenges and Opportunities
- auteur
- Remy Kusters, Dusan Misevic, Hugues Berry, Antoine Cully, Yann Le Cunff, Loic Dandoy, Natalia Díaz-Rodríguez, Marion Ficher, Jonathan Grizou, Alice Othmani, Themis Palpanas, Matthieu Komorowski, Patrick Loiseau, Clément Moulin-Frier, Santino Nanini, Daniele Quercia, Michele Sebag, Françoise Soulié Fogelman, Sofiane Taleb, Liubov Tupikina, Vaibhav Sahu, Jill-Jênn Vie, Fatima Wehbi
- article
- Frontiers in Big Data, 2020, 3, ⟨10.3389/fdata.2020.577974⟩
- Accès au texte intégral et bibtex
-
- titre
- Spectral bandits
- auteur
- Tomáš Kocák, Rémi Munos, Branislav Kveton, Shipra Agrawal, Michal Valko
- article
- Journal of Machine Learning Research, 2020
- Accès au texte intégral et bibtex
-
- titre
- Machine learning applications in drug development
- auteur
- Clémence Réda, Emilie Kaufmann, Andrée Delahaye-Duriez
- article
- Computational and Structural Biotechnology Journal, 2020, 18, pp.241-252. ⟨10.1016/j.csbj.2019.12.006⟩
- Accès au texte intégral et bibtex
-
- titre
- The challenge of controlling microgrids in the presence of rare events with Deep Reinforcement Learning
- auteur
- Tanguy Levent, Philippe Preux, Gonzague Henri, Réda Alami, Philippe Cordier, Yvan Bonnassieux
- article
- IET Smart Grid, In press, ⟨10.1049/stg2.12003⟩
- Accès au texte intégral et bibtex
-
Conference papers
- titre
- Robust-Adaptive Interval Predictive Control for Linear Uncertain Systems
- auteur
- Edouard Leurent, Denis Efimov, Odalric-Ambrym Maillard
- article
- CDC 2020 – 59th IEEE Conference on Decision and Control, Dec 2020, Jeju Island / Virtual, South Korea
- Accès au texte intégral et bibtex
-
- titre
- Inferential Induction: A Novel Framework for Bayesian Reinforcement Learning
- auteur
- Emilio Jorge, Hannes Eriksson, Christos Dimitrakakis, Debabrota Basu, Divya Grover
- article
- “I Can’t Believe It’s Not Better!” at NeurIPS Workshops, Dec 2020, Vancouver, Canada. pp.43-52
- Accès au texte intégral et bibtex
-
- titre
- Sub-sampling for Efficient Non-Parametric Bandit Exploration
- auteur
- Dorian Baudry, Emilie Kaufmann, Odalric-Ambrym Maillard
- article
- NeurIPS 2020, Dec 2020, Vancouver, Canada
- Accès au texte intégral et bibtex
-
- titre
- Robust-Adaptive Control of Linear Systems: beyond Quadratic Costs
- auteur
- Edouard Leurent, Denis Efimov, Odalric-Ambrym Maillard
- article
- NeurIPS 2020 – 34th Conference on Neural Information Processing Systems, Dec 2020, Vancouver / Virtual, Canada
- Accès au texte intégral et bibtex
-
- titre
- Statistical efficiency of Thompson sampling for combinatorial semi-bandits
- auteur
- Pierre Perrault, Etienne Boursier, Vianney Perchet, Michal Valko
- article
- Neural Information Processing Systems, Dec 2020, Virtual, France
- Accès au bibtex
-
- titre
- Geometric Deep Reinforcement Learning for Dynamic DAG Scheduling
- auteur
- Nathan Grinsztajn, Olivier Beaumont, Emmanuel Jeannot, Philippe Preux
- article
- IEEE SSCI 2020 – Symposium Series on Computational Intelligence, Dec 2020, Canberra / Virtual, Australia
- Accès au texte intégral et bibtex
-
- titre
- HIGhER: Improving instruction following with Hindsight Generation for Experience Replay
- auteur
- Geoffrey Cideron, Mathieu Seurin, Florian Strub, Olivier Pietquin
- article
- ADPRL 2020 – IEEE SSCI Conference on Adaptive Dynamic Programming and Reinforcement Learning, Dec 2020, Camberra / Virtual, Australia
- Accès au texte intégral et bibtex
-
- titre
- Confidentialité différentielle à risque : Relier les sources d’aléa et un budget de confidentialité
- auteur
- Ashish Dandekar, Debabrota Basu, Pierre Senellart, Stéphane Bressan
- article
- BDA 2020 – 36ème Conférence sur la Gestion de Données – Principes, Technologies et Applications, Oct 2020, Paris / Virtuel, France
- Accès au texte intégral et bibtex
-
- titre
- A Machine of Few Words Interactive Speaker Recognition with Reinforcement Learning
- auteur
- Mathieu Seurin, Florian Strub, Philippe Preux, Olivier Pietquin
- article
- Conference of the International Speech Communication Association (INTERSPEECH), Oct 2020, Shanghai, China. ⟨10.21437/Interspeech.2020-2892⟩
- Accès au texte intégral et bibtex
-
- titre
- A Practical Algorithm for Multiplayer Bandits when Arm Means Vary Among Players
- auteur
- Etienne Boursier, Emilie Kaufmann, Abbas Mehrabian, Vianney Perchet
- article
- AISTATS 2020 – 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo, Italy
- Accès au texte intégral et bibtex
-
- titre
- A single algorithm for both restless and rested rotting bandits
- auteur
- Julien Seznec, Pierre Menard, Alessandro Lazaric, Michal Valko
- article
- International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo / Virtual, Italy
- Accès au texte intégral et bibtex
-
- titre
- I’m sorry Dave, I’m afraid I can’t do that” Deep Q-Learning From Forbidden Actions
- auteur
- Mathieu Seurin, Philippe Preux, Olivier Pietquin
- article
- Internationnal Joint Conference on Neural Networks, Jul 2020, Glasgow, United Kingdom
- Accès au texte intégral et bibtex
-
- titre
- Self-Attentional Credit Assignment for Transfer in Reinforcement Learning
- auteur
- Johan Ferret, Raphaël Marinier, Matthieu Geist, Olivier Pietquin
- article
- IJCAI 2020 – 29th International Joint Conference on Artificial Intelligence, Jul 2020, Yokohama / Virtual, Japan
- Accès au texte intégral et bibtex
-
- titre
- Only Relevant Information Matters: Filtering Out Noisy Samples to Boost RL
- auteur
- Yannis Flet-Berliac, Philippe Preux
- article
- IJCAI 2020 – International Joint Conference on Artificial Intelligence, Jul 2020, Yokohama, Japan. ⟨10.24963/ijcai.2020/376⟩
- Accès au texte intégral et bibtex
-
- titre
- The Influence of Shape Constraints on the Thresholding Bandit Problem
- auteur
- James Cheshire, Pierre Ménard, Alexandra Carpentier
- article
- COLT 2020 – Thirty Third Conference on Learning Theory, Jul 2020, Graz / Virtual, Austria. pp.1228-1275
- Accès au texte intégral et bibtex
-
- titre
- Tightening Exploration in Upper Confidence Reinforcement Learning
- auteur
- Hippolyte Bourel, Odalric-Ambrym Maillard, Mohammad Sadegh Talebi
- article
- International Conference on Machine Learning, Jul 2020, Vienna, Austria
- Accès au texte intégral et bibtex
-
- titre
- Restarted Bayesian Online Change-point Detector achieves Optimal Detection Delay
- auteur
- Réda Alami, Odalric-Ambrym Maillard, Raphael Féraud
- article
- International Conference on Machine Learning, Jul 2020, Wien, Austria
- Accès au texte intégral et bibtex
-
- titre
- CopyCAT: Taking Control of Neural Policies with Constant Attacks
- auteur
- Léonard Hussenot, Matthieu Geist, Olivier Pietquin
- article
- AAMAS 2020 – 19th International Conference on Autonomous Agents and Multi-Agent Systems, May 2020, Virtual, New Zealand
- Accès au texte intégral et bibtex
-
- titre
- Solving Bernoulli Rank-One Bandits with Unimodal Thompson Sampling
- auteur
- Cindy Trinh, Emilie Kaufmann, Claire Vernade, Richard Combes
- article
- ALT 2020 – 31st International Conference on Algorithmic Learning Theory, Feb 2020, San Diego, United States. pp.1 – 28
- Accès au texte intégral et bibtex
-
- titre
- Gamification of pure exploration for linear bandits
- auteur
- Rémy Degenne, Pierre Ménard, Xuedong Shang, Michal Valko
- article
- International Conference on Machine Learning, 2020, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Sampling from a k-DPP without looking at all items
- auteur
- Daniele Calandriello, Michał Dereziński, Michal Valko
- article
- Neural Information Processing Systems, 2020, Montréal, Canada
- Accès au texte intégral et bibtex
-
- titre
- No-regret exploration in goal-oriented reinforcement learning
- auteur
- Jean Tarbouriech, Evrard Garcelon, Michal Valko, Matteo Pirotta, Alessandro Lazaric
- article
- International Conference on Machine Learning, 2020, Vienna / Virtual, Austria
- Accès au texte intégral et bibtex
-
- titre
- Fixed-confidence guarantees for Bayesian best-arm identification
- auteur
- Xuedong Shang, Rianne de Heide, Emilie Kaufmann, Pierre Ménard, Michal Valko
- article
- International Conference on Artificial Intelligence and Statistics, 2020, Palermo, Italy
- Accès au texte intégral et bibtex
-
- titre
- Covariance-adapting algorithm for semi-bandits with application to sparse outcomes
- auteur
- Pierre Perrault, Vianney Perchet, Michal Valko
- article
- Conference on Learning Theory, 2020, Graz, Austria
- Accès au texte intégral et bibtex
-
- titre
- Adaptive multi-fidelity optimization with fast learning rates
- auteur
- Côme Fiegel, Victor Gabillon, Michal Valko
- article
- International Conference on Artificial Intelligence and Statistics, 2020, Palermo, Italy
- Accès au texte intégral et bibtex
-
- titre
- Planning in Markov Decision Processes with Gap-Dependent Sample Complexity
- auteur
- Anders Jonsson, Emilie Kaufmann, Pierre Ménard, Omar D Domingues, Edouard Leurent, Michal Valko
- article
- Neural Information Processing Systems, 2020, Vancouver, France
- Accès au texte intégral et bibtex
-
- titre
- Budgeted online influence maximization
- auteur
- Pierre Perrault, Jennifer Healey, Zheng Wen, Michal Valko
- article
- International Conference on Machine Learning, 2020, Vienna, Austria
- Accès au texte intégral et bibtex
-
- titre
- Reward-free exploration beyond finite-horizon
- auteur
- Jean Tarbouriech, Matteo Pirotta, Michal Valko, Alessandro Lazaric
- article
- ICML 2020 Workshop on Theoretical Foundations of Reinforcement Learning, 2020, Vienna, France
- Accès au texte intégral et bibtex
-
- titre
- Improved sample complexity for incremental autonomous exploration in MDPs
- auteur
- Jean Tarbouriech, Matteo Pirotta, Michal Valko, Alessandro Lazaric
- article
- Neural Information Processing Systems, 2020, Montréal, Canada
- Accès au texte intégral et bibtex
-
Habilitation à diriger des recherches
- titre
- Contributions to the Optimal Solution of Several Bandit Problems
- auteur
- Emilie Kaufmann
- article
- Machine Learning [stat.ML]. Université de Lille, 2020
- Accès au texte intégral et bibtex
-
Theses
- titre
- Sequential machine learning for intelligent tutoring systems
- auteur
- Julien Seznec
- article
- Machine Learning [cs.LG]. Université de Lille, 2020. English. ⟨NNT : 2020LILUI084⟩
- Accès au texte intégral et bibtex
-
- titre
- Efficient Learning in Stochastic Combinatorial Semi-Bandits
- auteur
- Pierre Perrault
- article
- Mathematics [math]. Univeristé Paris-Saclay, 2020. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
- titre
- Safe and Efficient Reinforcement Learning for Behavioural Planning in Autonomous Driving
- auteur
- Edouard Leurent
- article
- Computer Science [cs]. Université de Lille, 2020. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
- titre
- Multimodal and Interactive Models for Visually Grounded Language Learning
- auteur
- Florian Strub
- article
- Neural and Evolutionary Computing [cs.NE]. Université de Lille; École doctorale, ED SPI 074 : Sciences pour l’Ingénieur, 2020. English. ⟨NNT : ⟩
- Accès au texte intégral et bibtex
-
Preprints, Working Papers, …
- titre
- Adversarial Attacks on Linear Contextual Bandits
- auteur
- Evrard Garcelon, Baptiste Roziere, Laurent Meunier, Jean Tarbouriech, Olivier Teytaud, Alessandro Lazaric, Matteo Pirotta
- article
- 2020
- Accès au bibtex
-
- titre
- Stochastic bandits with vector losses: Minimizing $\ell^\infty$-norm of relative losses
- auteur
- Xuedong Shang, Han Shao, Jian Qian
- article
- 2020
- Accès au texte intégral et bibtex
-
- titre
- Fictitious Play for Mean Field Games: Continuous Time Analysis and Applications
- auteur
- Sarah Perrin, Julien Pérolat, Mathieu Laurière, Matthieu Geist, Romuald Elie, Olivier Pietquin
- article
- 2020
- Accès au bibtex
-
- titre
- Optimal Strategies for Graph-Structured Bandits
- auteur
- Hassan Saber, Pierre Ménard, Odalric-Ambrym Maillard
- article
- 2020
- Accès au texte intégral et bibtex
-
- titre
- Forced-exploration free Strategies for Unimodal Bandits
- auteur
- Hassan Saber, Pierre Ménard, Odalric-Ambrym Maillard
- article
- 2020
- Accès au texte intégral et bibtex
-