Return to Members

Mostafa Sadeghi

Since August 2018 I have been a postdoctoral researcher in the PERCEPTION team at Inria Grenoble Rhône-Alpes.

My research interests lie at the intersection of machine learning and signal processing. In particular,  I am interested in deploying unsupervised probabilistic generative models, e.g., variational autoencoder (VAE), to solve inverse problems. One such problem that I am currently working on is that of audio-visual speech enhancement using VAEs.

You can visit my web page at this address.

Contact

  • INRIA Grenoble Rhone-Alpes
    655, avenue de l’Europe
    38330 Montbonnot Saint-Martin
    France
  • Email: mostafa dot sadeghi at inria dot fr

Publications

Publications HAL de Mostafa Sadeghi

2024

Journal articles

titre
Unsupervised Performance Analysis of 3D Face Alignment with a Statistically Robust Confidence Test
auteur
Mostafa Sadeghi, Xavier Alameda-Pineda, Radu Horaud
article
Neurocomputing, 2024, 564, pp.1-16. ⟨10.1016/j.neucom.2023.126941⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04265797/file/Sadeghi-Neurocomputing-arxiv.pdf BibTex

Conference papers

titre
A weighted-variance variational autoencoder model for speech enhancement
auteur
Ali Golmakani, Mostafa Sadeghi, Xavier Alameda-Pineda, Romain Serizel
article
ICASSP 2024 – International Conference on Acoustics Speech and Signal Processing, IEEE, Apr 2024, Seoul (Korea), South Korea. pp.1-5
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03833827/file/St_VAE_ICASSP2024.pdf BibTex
titre
Unsupervised speech enhancement with diffusion-based generative models
auteur
Berné Nortier, Mostafa Sadeghi, Romain Serizel
article
International Conference on Acoustics Speech and Signal Processing (ICASSP), IEEE, Apr 2024, Seoul (Korea), South Korea. ⟨10.48550/arXiv.2309.10450⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04210707/file/NORTIER_UDiffSE_ICASSP24.pdf BibTex
titre
Posterior sampling algorithms for unsupervised speech enhancement with recurrent variational autoencoder
auteur
Mostafa Sadeghi, Romain Serizel
article
International Conference on Acoustics Speech and Signal Processing (ICASSP), IEEE, Apr 2024, Seoul (Korea), South Korea. ⟨10.48550/arXiv.2309.10439⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04210679/file/EfficientVAE_SE_ICASSP24.pdf BibTex
titre
Diffusion-based speech enhancement with a weighted generative-supervised learning loss
auteur
Jean-Eudes Ayilo, Mostafa Sadeghi, Romain Serizel
article
International Conference on Acoustics Speech and Signal Processing (ICASSP), IEEE, Apr 2024, Seoul (Korea), South Korea. ⟨10.48550/arXiv.2309.10457⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04210729/file/AYILO_AVDiffSE_ICASSP24.pdf BibTex

Preprints, Working Papers, …

titre
Improving Speaker Assignment in Speaker-Attributed ASR for Real Meeting Applications
auteur
Can Cui, Imran Ahamad Sheikh, Mostafa Sadeghi, Emmanuel Vincent
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-04495886/file/Odyssey2024_LatexTemplate.pdf BibTex
titre
Objective and subjective evaluation of speech enhancement methods in the UDASE task of the 7th CHiME challenge
auteur
Simon Leglaive, Matthieu Fraticelli, Hend ElGhazaly, Léonie Borne, Mostafa Sadeghi, Scott Wisdom, Manuel Pariente, John R. Hershey, Daniel Pressnitzer, Jon P. Barker
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-04430786/file/CHiME_7_UDASE.pdf BibTex

2023

Journal articles

titre
Expression-preserving face frontalization improves visually assisted speech processing
auteur
Zhiqi Kang, Mostafa Sadeghi, Radu Horaud, Xavier Alameda-Pineda
article
International Journal of Computer Vision, 2023, 131 (5), pp.1122-1140. ⟨10.1007/s11263-022-01742-1⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03902610/file/Kang-IJCV2022.pdf BibTex

Conference papers

titre
End-to-end Multichannel Speaker-Attributed ASR: Speaker Guided Decoder and Input Feature Analysis
auteur
Can Cui, Imran Ahamad Sheikh, Mostafa Sadeghi, Emmanuel Vincent
article
2023 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2023), Dec 2023, Taipei, Taiwan. ⟨10.1109/ASRU57964.2023.10389729⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04235774/file/Template_Blind.pdf BibTex
titre
The CHiME-7 UDASE task: Unsupervised domain adaptation for conversational speech enhancement
auteur
Simon Leglaive, Léonie Borne, Efthymios Tzinis, Mostafa Sadeghi, Matthieu Fraticelli, Scott Wisdom, Manuel Pariente, Daniel Pressnitzer, John R. Hershey
article
7th International Workshop on Speech Processing in Everyday Environments (CHiME), Aug 2023, Dublin, Ireland. ⟨10.21437/CHiME.2023-2⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04156930/file/main.pdf BibTex
titre
Fast and efficient speech enhancement with variational autoencoders
auteur
Mostafa Sadeghi, Romain Serizel
article
International Conference on Acoustics Speech and Signal Processing (ICASSP), IEEE, Jun 2023, Rhodes island, Greece
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03833836/file/SADEGHI_LDEM_ICASSP23b.pdf BibTex
titre
Audio-visual speech enhancement with a deep kalman filter generative model
auteur
Ali Golmakani, Mostafa Sadeghi, Romain Serizel
article
International Conference on Acoustics Speech and Signal Processing (ICASSP), IEEE, Jun 2023, Rhodes island, Greece
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03833814/file/GOLMAKANI_AVDKF_ICASSP23.pdf BibTex

Poster communications

titre
End-to-end Multichannel Speaker-Attributed ASR: Speaker Guided Decoder and Input Feature Analysis
auteur
Can Cui, Imran Ahamad Sheikh, Mostafa Sadeghi, Emmanuel Vincent
article
Rencontre des Jeunes Chercheurs en Parole 2023 – 10E Edition, Nov 2023, Grenoble, France
Accès au texte intégral et bibtex
https://hal.science/hal-04321252/file/ASRU_poster_v4.pdf BibTex

Preprints, Working Papers, …

titre
The CHiME-7 UDASE task: Unsupervised domain adaptation for conversational speech enhancement
auteur
Simon Leglaive, Léonie Borne, Efthymios Tzinis, Mostafa Sadeghi, Matthieu Fraticelli, Scott Wisdom, Manuel Pariente, Daniel Pressnitzer, John Hershey
article
2023
Accès au texte intégral et bibtex
https://hal.science/hal-04305759/file/2307.03533.pdf BibTex
titre
End-to-end Joint Rich and Normalized ASR with a limited amount of rich training data
auteur
Can Cui, Imran Ahamad Sheikh, Mostafa Sadeghi, Emmanuel Vincent
article
2023
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04304642/file/Template.pdf BibTex

2022

Journal articles

titre
Non-Smooth Regularization: Improvement to Learning Framework through Extrapolation
auteur
Sajjad Amini, Mohammad Soltanian, Mostafa Sadeghi, Shahrokh Ghaemmaghami
article
IEEE Transactions on Signal Processing, 2022, 70, pp.1213 – 1223. ⟨10.1109/TSP.2022.3154969⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03586153/file/Amini_TSP_2021.pdf BibTex

Conference papers

titre
A Sparsity-promoting Dictionary Model for Variational Autoencoders
auteur
Mostafa Sadeghi, Paul Magron
article
INTERSPEECH 2022, Sep 2022, Incheon, South Korea
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03623769/file/main.pdf BibTex
titre
The Impact of Removing Head Movements on Audio-visual Speech Enhancement
auteur
Zhiqi Kang, Mostafa Sadeghi, Radu Horaud, Xavier Alameda-Pineda, Jacob Donley, Anurag Kumar
article
ICASSP 2022 – IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE Signal Processing Society, May 2022, Singapore, Singapore. pp.1-5, ⟨10.1109/ICASSP43922.2022.9746401⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03551610/file/Kang-ICASSP22-CR.pdf BibTex

2021

Journal articles

titre
Mixture of Inference Networks for VAE-based Audio-visual Speech Enhancement
auteur
Mostafa Sadeghi, Xavier Alameda-Pineda
article
IEEE Transactions on Signal Processing, 2021, 69, pp.1899-1909. ⟨10.1109/TSP.2021.3066038⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02926172/file/main.pdf BibTex

Conference papers

titre
Deep Variational Generative Models for Audio-visual Speech Separation
auteur
Viet-Nhat Nguyen, Mostafa Sadeghi, Elisa Ricci, Xavier Alameda-Pineda
article
MLSP 2021 – IEEE International Workshop on Machine Learning for Signal Processing, Oct 2021, Gold Coast, Australia. ⟨10.1109/MLSP52302.2021.9596406⟩
Accès au bibtex
https://arxiv.org/pdf/2008.07191 BibTex
titre
Robust Face Frontalization For Visual Speech Recognition
auteur
Zhiqi Kang, Radu Horaud, Mostafa Sadeghi
article
ICCVW 2021 – International Conference on Computer Vision Workshops, IEEE, Oct 2021, Montreal – Virtual, Canada. pp.2485-2495, ⟨10.1109/ICCVW54120.2021.00281⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03326002/file/Kang-ICCV21W-HAL.pdf BibTex
titre
Switching Variational Auto-Encoders for Noise-Agnostic Audio-visual Speech Enhancement
auteur
Mostafa Sadeghi, Xavier Alameda-Pineda
article
ICASSP 2021 – 46th International Conference on Acoustics, Speech, and Signal Processing, Jun 2021, Toronto / Virtual, Canada. pp.1-5, ⟨10.1109/ICASSP39728.2021.9414097⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03155445/file/robust_vae.pdf BibTex

2020

Journal articles

titre
Audio-Visual Speech Enhancement Using Conditional Variational Auto-Encoders
auteur
Mostafa Sadeghi, Simon Leglaive, Xavier Alameda-Pineda, Laurent Girin, Radu Horaud
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, 2020, 28, pp.1788-1800. ⟨10.1109/TASLP.2020.3000593⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02364900/file/av_vae-R2.pdf BibTex

Conference papers

titre
Low Mutual and Average Coherence Dictionary Learning Using Convex Approximation
auteur
Javad Parsa, Mostafa Sadeghi, Massoud Babaie-Zadeh, Christian Jutten
article
ICASSP 2020 – IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE, May 2020, Barcelone (virtual), Spain. pp.3417-3421, ⟨10.1109/ICASSP40776.2020.9052901⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02560161/file/paper.pdf BibTex
titre
Robust Unsupervised Audio-visual Speech Enhancement Using a Mixture of Variational Autoencoders
auteur
Mostafa Sadeghi, Xavier Alameda-Pineda
article
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), May 2020, Barcelona, Spain. pp.7534-7538, ⟨10.1109/ICASSP40776.2020.9053730⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02534911/file/mix_vae_conf_v2.pdf BibTex

Preprints, Working Papers, …

titre
Face Frontalization Based on Robustly Fitting a Deformable Shape Model to 3D Landmarks
auteur
Zhiqi Kang, Mostafa Sadeghi, Radu Horaud
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02980346/file/Kang-arxiv2020-V1.pdf BibTex
titre
Unsupervised Performance Analysis of 3D Face Alignment
auteur
Mostafa Sadeghi, Sylvain Guy, Adrien Raison, Xavier Alameda-Pineda, Radu Horaud
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02543069/file/Sadeghi-arxiv2020-v1.pdf BibTex

2018

Journal articles

titre
Sparse Signal Recovery Using Iterative Proximal Projection
auteur
Fatemeh Ghayyem, Mostafa Sadeghi, Massoud Babaie-Zadeh, Saikat Chatterjee, Mikael Skoglund, Christian Jutten
article
IEEE Transactions on Signal Processing, 2018, 66 (4), pp.879 – 894. ⟨10.1109/TSP.2017.2778695⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01707062/file/IPP_Final_Feb2018.pdf BibTex

2017

Conference papers

titre
Accelerated Dictionary Learning for Sparse Signal Representation
auteur
Fateme Ghayem, Mostafa Sadeghi, Massoud Babaie-Zadeh, Christian Jutten
article
LVA/ICA 2017 – 13th International Conference on Latent Variable Analysis and Signal Separation, Olivier Michel; Nadège Thirion-Moreau, Feb 2017, Grenoble, France. pp.531 – 541, ⟨10.1007/978-3-319-53547-0_50⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01479437/file/Fateme-LVA_ICA_final.pdf BibTex

2014

Journal articles

titre
Learning Overcomplete Dictionaries Based on Atom-by-Atom Updating
auteur
Mostafa Sadeghi, Massoud Babaie-Zadeh, Christian Jutten
article
IEEE Transactions on Signal Processing, 2014, 62 (4), pp.883-891. ⟨10.1109/TSP.2013.2295062⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00960222/file/SadeghiBabaiezadehJutten_DicLearningAtomByAtomUpdating_IEEE_TSP_NonOfficialVersion.pdf BibTex

2013

Journal articles

titre
Dictionary Learning for Sparse Decomposition: A Novel Approach
auteur
Mostafa Sadeghi, Massoud Babaie-Zadeh, Christian Jutten
article
IEEE Signal Processing Letters, 2013, 20 (12), pp.1195-1198. ⟨10.1109/LSP.2013.2285218⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00934308/file/IEEESPL-Sadeghi2013.pdf BibTex

Conference papers

titre
Learning overcomplete dictionaries based on parallel atom-updating
auteur
Mostafa Sadeghi, Massoud Babaie-Zadeh, Christian Jutten
article
MLSP 2013 – IEEE 23rd International Workshop on Machine Learning for Signal Processing, Sep 2013, Southampton, United Kingdom. 5 p
Accès au texte intégral et bibtex
https://hal.science/hal-00867170/file/Mostafa-MLSP-final.pdf BibTex
titre
Sequential subspace finding: a new algorithm for learning low-dimensional linear subspaces
auteur
Mostafa Sadeghi, Mohsen Joneidi, Massoud Babaie-Zadeh, Christian Jutten
article
EUSIPCO 2013 – 21th European Signal Processing Conference, Sep 2013, Marrakech, Morocco. pp.EUSIPCO 2013 1569746207
Accès au texte intégral et bibtex
https://hal.science/hal-00867075/file/Mostafa-Subspace-Eusipco13.pdf BibTex
titre
A new algorithm for learning overcomplete dictionaries
auteur
Mostafa Sadeghi, Massoud Babaie-Zadeh, Christian Jutten
article
EUSIPCO 2013 – 21th European Signal Processing Conference, Sep 2013, Marrakech, Morocco. pp.EUSIPCO 2013 1569746047
Accès au texte intégral et bibtex
https://hal.science/hal-00867093/file/Mostafa-DictLear-Eusipco2013.pdf BibTex