Return to Alumni

Simon Leglaive

Since February 2018 to August 2019 I have been a postdoctoral researcher in the PERCEPTION team at Inria Grenoble Rhône-Alpes. I am mainly working on audio source separation and speech enhancement.

You can visit my web page at this address: https://sleglaive.github.io/


Publications

Publications HAL de Leglaive

2024

Journal articles

titre
A Multimodal Dynamical Variational Autoencoder for Audiovisual Speech Representation Learning
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Séguier
article
Neural Networks, 2024, 172, pp.106120. ⟨10.1016/j.neunet.2024.106120⟩
Accès au bibtex
https://arxiv.org/pdf/2305.03582 BibTex

Conference papers

titre
TOWARDS IMPROVING SPEECH EMOTION RECOGNITION USING SYNTHETIC DATA AUGMENTATION FROM EMOTION CONVERSION
auteur
Karim M Ibrahim, Antony Perzo, Simon Leglaive
article
International Conference on Acoustics, Speech, and Signal Processing, 2024, Seoul, South Korea
Accès au texte intégral et bibtex
https://hal.science/hal-04364976/file/ICASSP2024-1.pdf BibTex

Preprints, Working Papers, …

titre
Objective and subjective evaluation of speech enhancement methods in the UDASE task of the 7th CHiME challenge
auteur
Simon Leglaive, Matthieu Fraticelli, Hend ElGhazaly, Léonie Borne, Mostafa Sadeghi, Scott Wisdom, Manuel Pariente, John R. Hershey, Daniel Pressnitzer, Jon P. Barker
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-04430786/file/CHiME_7_UDASE.pdf BibTex

2023

Journal articles

titre
Learning and controlling the source-filter representation of speech with a variational autoencoder
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Séguier
article
Speech Communication, 2023, 148, pp.53-65. ⟨10.1016/j.specom.2023.02.005⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03650569/file/sadok2023learning.pdf BibTex

Conference papers

titre
Motion-DVAE: Unsupervised learning for fast human motion denoising
auteur
Guénolé Fiche, Simon Leglaive, Xavier Alameda-Pineda, Renaud Séguier
article
ACM SIGGRAPH Conference on Motion, Interaction and Games (ACM MIG), Nov 2023, Rennes, France. ⟨10.1145/3623264.3624454⟩
Accès au bibtex
https://arxiv.org/pdf/2306.05846 BibTex
titre
Étude sur l’inversion de StyleGAN dans un contexte de détection d’hypertrucages
auteur
Matthieu Delmas, Amine Kacete, Stephane Paquelet, Simon Leglaive, Renaud Seguier
article
XXIXe Colloque GRETSI, GRETSI – Groupe de Recherche en Traitement du Signal et des Images, Aug 2023, Grenoble, France
Accès au texte intégral et bibtex
https://hal.science/hal-04258240/file/2023_delmas1363.pdf BibTex
titre
The CHiME-7 UDASE task: Unsupervised domain adaptation for conversational speech enhancement
auteur
Simon Leglaive, Léonie Borne, Efthymios Tzinis, Mostafa Sadeghi, Matthieu Fraticelli, Scott Wisdom, Manuel Pariente, Daniel Pressnitzer, John R. Hershey
article
7th International Workshop on Speech Processing in Everyday Environments (CHiME), Aug 2023, Dublin, Ireland. ⟨10.21437/CHiME.2023-2⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04156930/file/main.pdf BibTex
titre
Unsupervised speech enhancement with deep dynamical generative speech and noise models
auteur
Xiaoyu Lin, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda
article
Interspeech 2023 – 24th Annual Conference of the International Speech Communication Association, ISCA, Aug 2023, Dublin, Ireland. pp.1-5
Accès au bibtex
https://arxiv.org/pdf/2306.07820 BibTex
titre
Speech Modeling with a Hierarchical Transformer Dynamical VAE
auteur
Xiaoyu Lin, Xiaoyu Bie, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda
article
ICASSP 2023 – IEEE International Conference on Acoustics, Speech and Signal Processing, Jun 2023, Rhodes, Greece. pp.1-5, ⟨10.1109/ICASSP49357.2023.10096751⟩
Accès au bibtex
https://arxiv.org/pdf/2303.09404 BibTex
titre
A vector quantized masked autoencoder for speech emotion recognition
auteur
Samir Sadok, Simon Leglaive, Renaud Séguier
article
IEEE ICASSP 2023 Workshop on Self-Supervision in Audio, Speech and Beyond (SASB), Jun 2023, Rhodes, Greece
Accès au texte intégral et bibtex
https://hal.science/hal-04080024/file/2304.11117.pdf BibTex

Preprints, Working Papers, …

titre
The CHiME-7 UDASE task: Unsupervised domain adaptation for conversational speech enhancement
auteur
Simon Leglaive, Léonie Borne, Efthymios Tzinis, Mostafa Sadeghi, Matthieu Fraticelli, Scott Wisdom, Manuel Pariente, Daniel Pressnitzer, John Hershey
article
2023
Accès au texte intégral et bibtex
https://hal.science/hal-04305759/file/2307.03533.pdf BibTex

2022

Journal articles

titre
Unsupervised Speech Enhancement using Dynamical Variational Autoencoders
auteur
Xiaoyu Bie, Simon Leglaive, Xavier Alameda-Pineda, Laurent Girin
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, 2022, 30, pp.2993 – 3007. ⟨10.1109/TASLP.2022.3207349⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03295630/file/Bie%20et%20al-2022-Unsupervised%20Speech%20Enhancement%20Using%20Dynamical%20Variational%20Autoencoders.pdf BibTex

Conference papers

titre
Expectation-Maximization Based Defense Mechanism for Distributed Model Predictive Control
auteur
Rafael Accácio Nogueira, Romain Bourdais, Simon Leglaive, Hervé Guéguen
article
9th IFAC Conference on Networked Systems (NecSys22), Jul 2022, Zürich, Switzerland
Accès au texte intégral et bibtex
https://centralesupelec.hal.science/hal-03723298/file/article.pdf BibTex
titre
Les auto-encodeurs variationnels dynamiques et leur application à la modélisation de spectrogrammes de parole
auteur
Laurent Girin, Xiaoyu Bie, Simon Leglaive, Thomas Hueber, Xavier Alameda-Pineda
article
JEP 2022 – 34e Journées d’Études sur la Parole, Université de Nantes, Jun 2022, Noirmoutier, France. pp.655-663, ⟨10.21437/JEP.2022-69⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03978396/file/Girin_et_al-JEP2022.pdf BibTex
titre
Learning and controlling the source-filter representation of speech with a variational autoencoder
auteur
Samir Sadok, Simon Leglaive, Laurent Girin, Xavier Alameda-Pineda, Renaud Seguier
article
CFA 2022 – 16ème Congrès Français d’Acoustique, Société Française d’Acoustique (SFA), Apr 2022, Marseille, France
Accès au bibtex
BibTex

2021

Journal articles

titre
Dynamical Variational Autoencoders: A Comprehensive Review
auteur
Laurent Girin, Simon Leglaive, Xiaoyu Bie, Julien Diard, Thomas Hueber, Xavier Alameda-Pineda
article
Foundations and Trends in Machine Learning, 2021, 15 (1-2), pp.1-175. ⟨10.1561/2200000089⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02926215/file/Girin_at_al_DVAE_review_2021_arXiv_version.pdf BibTex

Conference papers

titre
On Speech Sparsity for Computational Efficiency and Noise Reduction in Hearing Aids
auteur
Adrien Llave, Simon Leglaive
article
13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference, Dec 2021, Tokyo, Japan
Accès au texte intégral et bibtex
https://hal.science/hal-03330307/file/llave21_apsipa.pdf BibTex
titre
A Benchmark of Dynamical Variational Autoencoders applied to Speech Spectrogram Modeling
auteur
Xiaoyu Bie, Laurent Girin, Simon Leglaive, Thomas Hueber, Xavier Alameda-Pineda
article
Interspeech 2021 – 22nd Annual Conference of the International Speech Communication Association, Aug 2021, Brno, Czech Republic. pp.46-50, ⟨10.21437/Interspeech.2021-256⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03295657/file/Bie_et_al_Interspeech_2021_DVAE.pdf BibTex

2020

Journal articles

titre
Audio-Visual Speech Enhancement Using Conditional Variational Auto-Encoders
auteur
Mostafa Sadeghi, Simon Leglaive, Xavier Alameda-Pineda, Laurent Girin, Radu Horaud
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, 2020, 28, pp.1788-1800. ⟨10.1109/TASLP.2020.3000593⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02364900/file/av_vae-R2.pdf BibTex

Conference papers

titre
Localization cues preservation in hearing aids by combining noise reduction and dynamic range compression
auteur
Adrien Llave, Simon Leglaive, Renaud Seguier
article
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Dec 2020, Auckland, New Zealand
Accès au texte intégral et bibtex
https://hal.science/hal-02962287/file/llave2020_apsipa.pdf BibTex
titre
A Recurrent Variational Autoencoder for Speech Enhancement
auteur
Simon Leglaive, Xavier Alameda-Pineda, Laurent Girin, Radu Horaud
article
ICASSP 2020 – IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE, May 2020, Barcelone (virtual), Spain. pp.371-375, ⟨10.1109/ICASSP40776.2020.9053164⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02329000/file/LAGH_2020.pdf BibTex

2019

Journal articles

titre
Audio-noise Power Spectral Density Estimation Using Long Short-term Memory
auteur
Xiaofei Li, Simon Leglaive, Laurent Girin, Radu Horaud
article
IEEE Signal Processing Letters, 2019, 26 (6), pp.918-922. ⟨10.1109/LSP.2019.2911879⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02100059/file/noise_psd.pdf BibTex

Conference papers

titre
Notes on the use of variational autoencoders for speech and audio spectrogram modeling
auteur
Laurent Girin, Fanny Roche, Thomas Hueber, Simon Leglaive
article
DAFx 2019 – 22nd International Conference on Digital Audio Effects, Sep 2019, Birmingham, United Kingdom. pp.1-8
Accès au texte intégral et bibtex
https://hal.science/hal-02349385/file/Girin_et_al_DAFx2019.pdf BibTex
titre
Semi-supervised multichannel speech enhancement with variational autoencoders and non-negative matrix factorization
auteur
Simon Leglaive, Laurent Girin, Radu Horaud
article
ICASSP 2019 – IEEE International Conference on Acoustics, Speech and Signal Processing, May 2019, Brighton, United Kingdom. pp.101-105, ⟨10.1109/ICASSP.2019.8683704⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02005102/file/LGH-icassp2019.pdf BibTex
titre
Speech enhancement with variational autoencoders and alpha-stable distributions
auteur
Simon Leglaive, Umut Şimşekli, Antoine Liutkus, Laurent Girin, Radu Horaud
article
ICASSP 2019 – 44th IEEE International Conference on Acoustics, Speech and Signal Processing, May 2019, Brighton, United Kingdom. pp.541-545, ⟨10.1109/ICASSP.2019.8682546⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02005106/file/LSLGH-icassp2019.pdf BibTex

2018

Journal articles

titre
Student’s t Source and Mixing Models for Multichannel Audio Source Separation
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, 2018, 26 (6), pp.1150-1164
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01584755/file/FinalManuscript.pdf BibTex

Conference papers

titre
A variance modeling framework based on variational autoencoders for speech enhancement
auteur
Simon Leglaive, Laurent Girin, Radu Horaud
article
MLSP 2018 – IEEE 28th International Workshop on Machine Learning for Signal Processing, Sep 2018, Aalborg, Denmark. pp.1-6, ⟨10.1109/MLSP.2018.8516711⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01832826/file/LGH_MLSP2018_final.pdf BibTex
titre
Alpha-stable low-rank plus residual decomposition for speech enhancement
auteur
Umut Şimşekli, Halil Erdogan, Simon Leglaive, Antoine Liutkus, Roland Badeau, Gael Richard
article
ICASSP: International Conference on Acoustics, Speech, and Signal Processing, Apr 2018, Calgary, Canada. pp.651-655, ⟨10.1109/ICASSP.2018.8461539⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01714909/file/2017102794510_839706_2832.pdf BibTex

2017

Conference papers

titre
Separating Time-Frequency Sources from Time-Domain Convolutive Mixtures Using Non-negative Matrix Factorization
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2017, New Paltz, New York, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01548469/file/LeglaiveBadeauRichard.pdf BibTex
titre
Séparation de sources audio en milieu réverbérant : Factorisation en matrices non-négatives et représentation temporelle du mélange convolutif
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
Colloque GRETSI, Sep 2017, Juan-Les-Pins, France
Accès au texte intégral et bibtex
https://hal.science/hal-01540481/file/LeglaiveBadeauRichard_final.pdf BibTex
titre
Semi-Blind Student’s t Source Separation for Multichannel Audio Convolutive Mixtures
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
25th European Signal Processing Conference (EUSIPCO), Aug 2017, Kos, Greece. pp.2323-2327
Accès au texte intégral et bibtex
https://hal.science/hal-01531243/file/LeglaiveBadeauRichard_final.pdf BibTex
titre
Multichannel audio source separation: variational inference of time-frequency sources from time-domain observations
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, Mar 2017, La Nouvelle Orléans, LA, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01416347/file/LeglaiveBadeauRichard.pdf BibTex
titre
Alpha-Stable Multichannel Audio Source Separation
auteur
Simon Leglaive, Umut Şimşekli, Antoine Liutkus, Roland Badeau, Gael Richard
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01416366/file/alphaStableMASS-ICASSP17.pdf BibTex

Theses

titre
Modèles de mélange pour la séparation multicanale de sources sonores en milieu réverbérant
auteur
Simon Leglaive
article
Traitement du signal et de l’image [eess.SP]. Télécom ParisTech, 2017. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01721933/file/these_Simon_Leglaive.pdf BibTex
titre
Modèles de mélange pour la séparation multicanale de sources sonores en milieu réverbérant
auteur
Simon Leglaive
article
Traitement du signal et de l’image [eess.SP]. Télécom ParisTech, 2017. Français. ⟨NNT : 2017ENST0068⟩
Accès au texte intégral et bibtex
https://pastel.hal.science/tel-03158307/file/these_Simon_Leglaive.pdf BibTex

2016

Journal articles

titre
Multichannel Audio Source Separation with Probabilistic Reverberation Priors
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, 2016, 24 (12), pp.2453-2465
Accès au texte intégral et bibtex
https://hal.science/hal-01370051/file/Leglaive-Badeau-Richard-TASLP16.pdf BibTex

Conference papers

titre
Autoregressive Moving Average Modeling of Late Reverberation in the Frequency Domain
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
European Signal Processing Conference (EUSIPCO), Aug 2016, Budapest, Hungary. pp.1478-1482
Accès au texte intégral et bibtex
https://hal.science/hal-01322937/file/eusipco_16.pdf BibTex

2015

Conference papers

titre
MULTICHANNEL AUDIO SOURCE SEPARATION WITH PROBABILISTIC REVERBERATION MODELING
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2015, New Paltz, NY, United States. pp.5
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01219635/file/Leglaive-WASPAA-2015.pdf BibTex
titre
A priori probabiliste anéchoïque pour la séparation sous-déterminée de sources sonores en milieu réverbérant
auteur
Simon Leglaive, Roland Badeau, Gael Richard
article
Colloque GRETSI, Sep 2015, Lyon, France
Accès au texte intégral et bibtex
https://imt.hal.science/hal-01206808/file/inproceedings-2015-15534-3.pdf BibTex
titre
Singing voice detection with deep recurrent neural networks
auteur
Simon Leglaive, Romain Hennequin, Roland Badeau
article
40th International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2015, Brisbane, Australia. pp.121-125
Accès au texte intégral et bibtex
https://hal.science/hal-01110035/file/Leglaive-ICASSP-2015.pdf BibTex