Publications

Publications HAL du labo/EPI hiepacs

2024

Journal articles

titre
Optimal checkpointing for heterogeneous chains: how to train deep neural networks with limited memory
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Julien Herrmann, Alexis Joly, Alena Shilova
article
ACM Transactions on Mathematical Software, In press
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02352969/file/paper.pdf BibTex

2023

Journal articles

titre
Combining reduction with synchronization barrier on multi‐core processors
auteur
Aboul‐karim Mohamed El Maarouf, Luc Giraud, Abdou Guermouche, Thomas Guignon
article
Concurrency and Computation: Practice and Experience, 2023, 35 (1), pp.e7402. ⟨10.1002/cpe.7402⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03948901/file/Article_Reduction_and_Synchro_vfinal.pdf BibTex
titre
Task-based parallel programming for scalable matrix product algorithms
auteur
Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Julien Herrmann, Antoine Jego
article
ACM Transactions on Mathematical Software, 2023, ⟨10.1145/3583560⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03936659/file/journal-nocopy.pdf BibTex

2022

Journal articles

titre
Towards EXtreme scale technologies and accelerators for euROhpc hw/Sw supercomputing applications for exascale: The TEXTAROSSA approach
auteur
Giovanni Agosta, Marco Aldinucci, Carlos Alvarez, Roberto Ammendola, Yasir Arfat, Olivier Beaumont, Massimo Bernaschi, Andrea Biagioni, Tommaso Boccali, Bérenger Bramas, Carlo Brandolese, Barbara Cantalupo, Mauro Carrozzo, Daniele Cattaneo, Alessandro Celestini, Massimo Celino, Iacopo Colonnelli, Paolo Cretaro, Pasqua D’ambra, Marco Danelutto, Roberto Esposito, Lionel Eyraud-Dubois, Antonio Filgueras, William Fornaciari, Ottorino Frezza, Andrea Galimberti, Francesco Giacomini, Brice Goglin, Daniele Gregori, Abdou Guermouche, Francesco Iannone, Michal Kulczewski, Francesca Lo Cicero, Alessandro Lonardo, Alberto Martinelli, Michele Martinelli, Xavier Martorell, Giuseppe Massari, Simone Montangero, Gianluca Mittone, Raymond Namyst, Ariel Oleksiak, Paolo Palazzari, Pier Stanislao Paolucci, Federico Reghenzani, Cristian Rossi, Sergio Saponara, Francesco Simula, Federico Terraneo, Samuel Thibault, Massimo Torquati, Matteo Turisini, Piero Vicini, Miquel Vidal, Davide Zoni, Giuseppe Zummo
article
Microprocessors and Microsystems: Embedded Hardware Design , 2022, 95, pp.104679. ⟨10.1016/j.micpro.2022.104679⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03936864/file/2021_TEXTAROSSA_MICPRO.pdf BibTex
titre
A block minimum residual norm subspace solver with partial convergence management for sequences of linear systems
auteur
Luc Giraud, Yan-Fei Jing, Yanfei Xiang
article
SIAM Journal on Matrix Analysis and Applications, 2022, 43 (2), pp.710-739. ⟨10.1137/21m1401127⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03546496/file/simax_v2.pdf BibTex

Conference papers

titre
Symmetric Block-Cyclic Distribution: Fewer Communications Leads to Faster Dense Cholesky Factorization
auteur
Olivier Beaumont, Philippe Duchon, Lionel Eyraud-Dubois, Julien Langou, Mathieu Vérité
article
SC 2022 – Supercomputing, Nov 2022, Dallas, Texas, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03768910/file/final_version_no_copyright.pdf BibTex
titre
Programming Heterogeneous Architectures Using Hierarchical Tasks
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Raymond Namyst, Samuel Thibault, Pierre-André Wacrenier
article
HeteroPar 2022 – twentieth international workshop, Aug 2022, Glasgow, United Kingdom. pp.12
Accès au texte intégral et bibtex
https://hal.science/hal-03789625/file/paper%20%281%29.pdf BibTex
titre
Survey on Large Scale Neural Network Training
auteur
Julia Gusak, Daria Cherniuk, Alena Shilova, Alexandr Katrutsa, Daniel Bershatsky, Xunyi Zhao, Lionel Eyraud-Dubois, Oleh Shliazhko, Denis Dimitrov, Ivan Oseledets, Olivier Beaumont
article
IJCAI-ECAI 2022 – 31st International Joint Conference on Artificial Intelligence, Jul 2022, Vienna, Austria. pp.5494-5501, ⟨10.24963/ijcai.2022/769⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03952171/file/ijcai2022_survey_large_scale_model_training-1.pdf BibTex
titre
I/O-Optimal Algorithms for Symmetric Linear Algebra Kernels
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Mathieu Vérité, Julien Langou
article
ACM Symposium on Parallelism in Algorithms and Architectures, Association for Computing Machinery : SIGACT, SIGARCH, Jul 2022, Philadelphie, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03580531/file/article.pdf BibTex
titre
Programmation des architectures hétérogènes à l’aide de tâches hiérarchiques
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Samuel Thibault, Pierre-André Wacrenier
article
COMPAS 2022 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2022, Amiens, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03773486/file/ComPAS2022_paper_10.pdf BibTex
titre
MulTreePrio: Scheduling task-based applications for heterogeneous computing systems
auteur
Hayfa Tayeb, Bérenger Bramas, Abdou Guermouche, Mathieu Faverge
article
COMPAS 2022 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2022, Amiens, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03763824/file/ComPAS2022_paper_11-2.pdf BibTex
titre
MadPipe: Memory Aware Dynamic Programming Algorithm for Pipelined Model Parallelism
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
article
ScaDL 2022 – Scalable Deep Learning over Parallel and Distributed Infrastructure – An IPDPS 2022 Workshop, Jun 2022, Lyon / Virtual, France
Accès au texte intégral et bibtex
https://hal.science/hal-03025305/file/MadPipeRR.pdf BibTex
titre
Direct solution of larger coupled sparse/dense linear systems using low-rank compression on single-node multi-core machines in an industrial context
auteur
Emmanuel Agullo, Marek Felšöci, Guillaume Sylvand
article
IPDPS 2022 – 36th IEEE International Parallel and Distributed Processing Symposium, May 2022, Lyon, France. pp.11, ⟨10.1109/IPDPS53621.2022.00012⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03774145/file/article-ipdps2022.pdf BibTex

Reports

titre
Task-based randomized singular value decomposition and multidimensional scaling
auteur
Emmanuel Agullo, Olivier Coulaud, Alexandre Denis, Mathieu Faverge, Alain Franc, Jean-Marc Frigerio, Nathalie Furmento, Adrien Guilbaud, Emmanuel Jeannot, Romain Peressoni, Florent Pruvost, Samuel Thibault
article
[Research Report] RR-9482, Inria Bordeaux – Sud Ouest; Inrae – BioGeCo. 2022, pp.37
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03773985/file/RR-9482%20%281%29.pdf BibTex
titre
Reaching the Quality of SVD for Low-Rank Compression Through QR Variants
auteur
Esragul Korkmaz, Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
[Research Report] RR-9476, Inria Bordeaux – Sud Ouest. 2022, pp.43
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03718312/file/RR-9476.pdf BibTex
titre
Programming Heterogeneous Architectures Using Hierarchical Tasks
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Raymond Namyst, Samuel Thibault, Pierre-André Wacrenier
article
[Research Report] RR-9466, Inria Bordeaux Sud-Ouest. 2022, pp.21
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03609275/file/RR-9466.pdf BibTex
titre
Direct solution of larger coupled sparse/dense linear systems using low-rank compression on single-node multi-core machines in an industrial context
auteur
Emmanuel Agullo, Marek Felšöci, Guillaume Sylvand
article
[Research Report] RR-9453, Inria Bordeaux Sud-Ouest. 2022, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03557692/file/RR-9453.pdf BibTex
titre
Guix-HPC Activity Report 2020-2021
auteur
Pierre-Antoine Bouttier, Ludovic Courtès, Yann Dupont, Marek Felšöci, Felix Gruber, Konrad Hinsen, Arun Isaac, Pjotr Prins, Philippe Swartvagher, Simon Tournier, Ricardo Wurmus
article
[Technical Report] Inria Bordeaux – Sud-Ouest; Université Grenoble – Alpes; Université Paris. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03565692/file/activity-report-2021.pdf BibTex
titre
Task-Based Parallel Programming for Scalable Algorithms: application to Matrix Multiplication
auteur
Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Julien Herrmann, Antoine Jego
article
[Research Report] RR-9461, Inria Bordeaux – Sud-Ouest. 2022, pp.29
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03588491/file/RR-9461.pdf BibTex
titre
Study of the processor and memory power consumption of coupled sparse/dense solvers
auteur
Emmanuel Agullo, Marek Felšöci, Amina Guermouche, Hervé Mathieu, Guillaume Sylvand, Bastien Tagliaro
article
[Research Report] RR-9463, Inria Bordeaux Sud-Ouest. 2022, pp.17
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03589695/file/RR-9463.pdf BibTex
titre
Decentralized in-order execution of a sequential task-based code for shared-memory architectures
auteur
Charly Castes, Emmanuel Agullo, Olivier Aumage, Emmanuelle Saillard
article
[Research Report] RR-9450, Inria Bordeaux – Sud Ouest. 2022, pp.30
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03547334/file/RR-9450.pdf BibTex
titre
An Integer Linear Programming Approach for Pipelined Model Parallelism
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
article
[Research Report] RR-9452, Inria. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03549009/file/RR-9452.pdf BibTex

Software

titre
Experimental code and results for the paper “Symmetric Block-Cyclic Distribution: Fewer Communications leads to Faster Dense Cholesky Factorization
auteur
Olivier Beaumont, Philippe Duchon, Julien Langou, Lionel Eyraud-Dubois, Mathieu Verite
article
2022, ⟨swh:1:dir:ec92870dfc2a7e7c8a6e87914823e25bc651a5b7;origin=https://hal.archives-ouvertes.fr/hal-03643569;visit=swh:1:snp:6b8402b24d2133d01fc48d0f01d83f605cc77898;anchor=swh:1:rel:3068c5a3c30d3a673a553d033029929a03ddb4cf;path=/⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03643569/file/sc2022-artifact.zip BibTex

Theses

titre
Static Allocation Algorithms for Scheduling High-Performance Applications
auteur
Mathieu Vérité
article
Calcul parallèle, distribué et partagé [cs.DC]. Université de Bordeaux, 2022. Français. ⟨NNT : 2022BORD0349⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-03956040/file/VERITE_MATHIEU_2022.pdf BibTex
titre
Improving the memory and time overhead of low-rank parallel linear sparse direct solvers
auteur
Esragul Korkmaz
article
Data Structures and Algorithms [cs.DS]. Université de Bordeaux, 2022. English. ⟨NNT : 2022BORD0254⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-03875858/file/KORKMAZ_ESRAGUL_2022.pdf BibTex

Preprints, Working Papers, …

titre
Weight Offloading Strategies for Training Large DNN Models
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova, Xunyi Zhao
article
2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03580767/file/rr.pdf BibTex

2021

Journal articles

titre
Resiliency in numerical algorithm design for extreme scale simulations
auteur
Emmanuel Agullo, Mirco Altenbernd, Hartwig Anzt, Leonardo Bautista-Gomez, Tommaso Benacchio, Luca Bonaventura, Hans-Joachim Bungartz, Sanjay Chatterjee, Florina M Ciorba, Nathan Debardeleben, Daniel Drzisga, Sebastian Eibl, Christian Engelmann, Wilfried N Gansterer, Luc Giraud, Dominik Göddeke, Marco Heisig, Fabienne Jézéquel, Nils Kohl, Sherry Xiaoye, Romain Lion, Miriam Mehl, Paul Mycek, Michael Obersteiner, Enrique S Quintana-Ortí, Francesco Rizzi, Ulrich Rüde, Martin Schulz, Fred Fung, Robert Speck, Linda Stals, Keita Teranishi, Samuel Thibault, Dominik Thönnes, Andreas Wagner, Barbara Wohlmuth
article
International Journal of High Performance Computing Applications, 2021, pp.10943420211055188. ⟨10.1177/10943420211055188⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03348787/file/2010.13342.pdf BibTex
titre
High Order Singular Value Decomposition for Plant Biodiversity Estimation
auteur
Alessandra Bernardi, Martina Iannacito, Duccio Rocchini
article
Bollettino dell’Unione Matematica Italiana, 2021, ⟨10.1007/s40574-021-00300-w⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02385304/file/Art.pdf BibTex
titre
rasterdiv-An Information Theory tailored R package for measuring ecosystem heterogeneity from space: To the origin and back
auteur
Duccio Rocchini, Elisa Thouverai, Matteo Marcantonio, Martina Iannacito, Daniele da Re, Michele Torresani, Giovanni Bacaro, Manuele Bazzichetto, Alessandra Bernardi, Giles M. Foody, Reinhard Furrer, David Kleijn, Stefano Larsen, Jonathan Roger Michel Henri Lenoir, Marco Malavasi, Elisa Marchetto, Filippo Messori, Alessandro Montaghi, Vitezslav Moudry, Babak Naimi, Carlo Ricotta, Micol Rossini, Francesco Santi, Maria J. Santos, Michael E. Schaepman, Fabian D. Schneider, Leila Schuh, Sonia Silvestri, Petra Simova, Andrew K. Skidmore, Clara Tattoni, Enrico Tordoni, Saverio Vicario, Piero Zannini, Martin Wegmann
article
Methods in Ecology and Evolution, 2021, 12 (6), pp.1093-1102. ⟨10.1111/2041-210X.13583⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03244722/file/Rochini-2021-rasterdiv%20An%20Information%20Theory%20tailored%20R%20package.pdf BibTex
titre
The JOREK non-linear extended MHD code and applications to large-scale instabilities and their control in magnetically confined fusion plasmas
auteur
Matthias Hoelzl, Guido Huijsmans, Stanislas Pamela, Marina Bécoulet, Eric Nardon, Francisco Javier Artola, Boniface Nkonga, Calin Vlad Atanasiu, Vinodh Bandaru, Ashish Bhole, Daniele Bonfiglio, Andres Cathey, Olivier Czarny, Anastasia Dvornova, Tamas Fehér, Alexandre Fil, Emmanuel Franck, Shimpei Futatani, Marta Gruca, Hervé Guillard, Willem J. Haverkort, Ihor Holod, Di Hu, S.K. Kim, Sven Q. Korving, Leon Kos, Isabel Krebs, Lukas Kripner, Guillaume Latu, Franklin Liu, Peter Merkel, Dmytro Meshcheriakov, Verena Mitterauer, Serhiy Mochalskyy, Jorge A. Morales, Richard Nies, Nikita Nikulsin, François Orain, Jane Pratt, Rohan Ramasamy, Pierre Ramet, Cédric Reux, Konsta Särkimäki, N. Schwarz, Prabal Singh Verma, Siobhan Smith F., Cristian Sommariva, Erika Strumberger, Daan C. van Vugt, M. Verbeek, Egbert Westerhof, Fabian Wieschollek, Jeffery Zielinski
article
Nuclear Fusion, 2021, 61 (6), pp.065001. ⟨10.1088/1741-4326/abf99f⟩
Accès au bibtex
https://arxiv.org/pdf/2011.09120 BibTex
titre
Resilience and fault tolerance in high-performance computing for numerical weather and climate prediction
auteur
Tommaso Benacchio, Luca Bonaventura, Mirco Altenbernd, Chris D Cantwell, Peter D Düben, Mike Gillard, Luc Giraud, Dominik Göddeke, Erwan Raffin, Keita Teranishi, Nils Wedi
article
International Journal of High Performance Computing Applications, 2021, 35 (4), pp.285-311. ⟨10.1177/1094342021990433⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03138061/file/1094342021990433.pdf BibTex

Conference papers

titre
Deciding Non-Compressible Blocks in Sparse Direct Solvers using Incomplete Factorization
auteur
Esragul Korkmaz, Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
HiPC 2021 – 28th IEEE International Conference on High Performance Computing, Data, and Analytics, Dec 2021, Bangalore, India. pp.1-10, ⟨10.1109/HiPC53243.2021.00024⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03361299/file/main.pdf BibTex
titre
Efficient Combination of Rematerialization and Offloading for Training DNNs
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
article
NeurIPS 2021 – Thirty-fifth Conference on Neural Information Processing Systems, Dec 2021, Virtual-only Conference, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03359793/file/offchkpt.pdf BibTex
titre
READYS: A Reinforcement Learning Based Strategy for Heterogeneous Dynamic Scheduling
auteur
Nathan Grinsztajn, Olivier Beaumont, Emmanuel Jeannot, Philippe Preux
article
IEEE Cluster 2021, Sep 2021, Portland / Virtual, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03313229/file/cluster.pdf BibTex
titre
TEXTAROSSA: Towards EXtreme scale Technologies and Accelerators for euROhpc hw/Sw Supercomputing Applications for exascale
auteur
Giovanni Agosta, Daniele Cattaneo, William Fornaciari, Andrea Galimberti, Giuseppe Massari, Federico Reghenzani, Federico Terraneo, Davide Zoni, Carlo Brandolese, Massimo Celino, Francesco Iannone, Paolo Palazzari, Giuseppe Zummo, Massimo Bernaschi, Pasqua d’Ambra, Sergio Saporana, Marco Danelutto, Massimo Torquati, Marco Aldinucci, Yasir Arfat, Barbara Cantalupo, Iacopo Colonnelli, Roberto Esposito, Alberto Riccardo Martinelli, Gianluca Mittone, Olivier Beaumont, Bérenger Bramas, Lionel Eyraud-Dubois, Brice Goglin, Abdou Guermouche, Raymond Namyst, Samuel Thibault, Antonio Filgueras, Miquel Vidal, Carlos Alvarez, Xavier Martorell, Ariel Oleksiak, Ottorino Frezza, Michal Kulczewski, Alessandro Lonardo, Piero Vicini, Francesca Lo Cicero, Francesca Simula, Andrea Biagioni, Paolo Cretaro, Pier Stanislao Paolucci, Matteo Turisini, Francesco Giacomini, Tommaso Boccali, Simone Montangero, Roberto Ammendola
article
DSD 2021 – 24th Euromicro Conference on Digital System Design, Sep 2021, Palermo / Virtual, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03329640/file/DSD.pdf BibTex
titre
Pipelined Model Parallelism: Complexity Results and Memory Considerations
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
article
Europar 2021, Aug 2021, Lisbon, Portugal
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02968802/file/paperRR.pdf BibTex
titre
Comparison of coupled solvers for FEM/BEM linear systems arising from discretization of aeroacoustic problems
auteur
Emmanuel Agullo, Marek Felšöci, Guillaume Sylvand
article
COMPAS 2021 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2021, Lyon / Virtuel, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03264472/file/article-compas-2021.pdf BibTex

Reports

titre
Enseigner avec GitLab
auteur
Aurélien Esnard
article
[Travaux universitaires] Université de Bordeaux (UB). 2021
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03623374/file/Enseigner%20avec%20GitLab.pdf BibTex
titre
Extension of Correspondence Analysis to multiway data-sets through High Order SVD: a geometric framework
auteur
Olivier Coulaud, Alain Franc, Martina Iannacito
article
[Research Report] RR-9429, Inria Bordeaux – Sud-Ouest; Inrae. 2021
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03418404/file/RR-9429.pdf BibTex
titre
Recycling Krylov subspace strategies for sequences of sampled stochastic elliptic equations
auteur
Nicolas Venkovic, Paul Mycek, Luc Giraud, Olivier Le Maitre
article
[Research Report] RR-9425, Inria Bordeaux – Sud Ouest. 2021
Accès au texte intégral et bibtex
https://hal.science/hal-03366966/file/RR-9425.pdf BibTex
titre
A note on the strong parallel scalability of numerically scalable Poisson linear solvers
auteur
Emmanuel Agullo, Luc Giraud, Valentin Joncquieres, Gilles Marait, Louis Poirel, Olivier Vermorel, Wilca Villafana
article
[Research Report] RR-9423, Inria Bordeaux – Sud Ouest. 2021, pp.31
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03352049/file/RR_9423.pdf BibTex
titre
A comparison of selected solvers for coupled FEM/BEM linear systems arising from discretization of aeroacoustic problems
auteur
Emmanuel Agullo, Marek Felšöci, Guillaume Sylvand
article
[Research Report] RR-9412, Inria Bordeaux Sud-Ouest. 2021, pp.52
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03263603/file/RR-9412.pdf BibTex
titre
A comparison of selected solvers for coupled FEM/BEM linear systems arising from discretization of aeroacoustic problems: literate and reproducible environment
auteur
Emmanuel Agullo, Marek Felšöci, Guillaume Sylvand
article
[Technical Report] RT-0513, Inria Bordeaux Sud-Ouest. 2021, pp.100
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03263620/file/RT-0513.pdf BibTex
titre
A block minimum residual norm subspace solver for sequences of multiple left and right-hand side linear systems
auteur
Luc Giraud, Yan-Fei Jing, Yanfei Xiang
article
[Research Report] RR-9393, Inria Bordeaux Sud-Ouest. 2021, pp.60
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03146213/file/RR-9393.pdf BibTex
titre
Deciding Non-Compressible Blocks in Sparse Direct Solvers using Incomplete Factorization
auteur
Esragul Korkmaz, Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
[Research Report] RR-9396, Inria Bordeaux – Sud Ouest. 2021, pp.16
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03152932/file/RR-9396.pdf BibTex

2020

Journal articles

titre
On soft errors in the conjugate gradient method: sensitivity and robust numerical detection
auteur
Emmanuel Agullo, Siegfried Cools, Emrullah Fatih-Yetkin, Luc Giraud, Nick Schenkels, Wim Vanroose
article
SIAM Journal on Scientific Computing, 2020, 42 (6), ⟨10.1137/18M122858X⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03022845/file/siam_paper_final.pdf BibTex
titre
Performance Analysis and Optimality Results for Data-Locality Aware Tasks Scheduling with Replicated Inputs
auteur
Olivier Beaumont, Thomas Lambert, Loris Marchal, Bastien Thomas
article
Future Generation Computer Systems, 2020, 111, pp.582-598. ⟨10.1016/j.future.2019.08.024⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02275473/file/paper_revision%20%281%29.pdf BibTex
titre
Scheduling on Two Types of Resources: a Survey
auteur
Olivier Beaumont, Louis-Claude Canon, Lionel Eyraud-Dubois, Giorgio Lucarelli, Loris Marchal, Clement Mommessin, Bertrand Simon, Denis Trystram
article
ACM Computing Surveys, 2020, 53 (3), ⟨10.1145/3387110⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02432381/file/Survey.pdf BibTex
titre
Fast BEM Solution for 2-D Scattering Problems Using Quantized Tensor-Train Format
auteur
Jean-René Poirier, Olivier Coulaud, Oguz Kaya
article
IEEE Transactions on Magnetics, 2020, 56 (3), pp.1-4. ⟨10.1109/TMAG.2019.2954584⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03150956/file/long_hal.pdf BibTex
titre
A Plane Wave Scattering Dedicated Integral Equation
auteur
Benjamin Alzaix, Luc Giraud, Bastiaan Michielsen, Jean-René Poirier
article
IEEE Transactions on Antennas and Propagation, 2020, pp.1-10. ⟨10.1109/TAP.2019.2948390⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02448907/file/DEMR18098.1580727354_postprint.pdf BibTex
titre
Nonlinear mapping and distance geometry
auteur
Alain Franc, Pierre Blanchard, Olivier Coulaud
article
Optimization Letters, 2020, 14 (2), pp.453-467. ⟨10.1007/s11590-019-01431-y⟩
Accès au bibtex
https://arxiv.org/pdf/1810.08661 BibTex
titre
Using computed infrared intensities for the reduction of vibrational configuration interaction bases
auteur
Vincent Le Bris, Marc Odunlami, Didier Bégué, Isabelle Baraille, Olivier Coulaud
article
Physical Chemistry Chemical Physics, 2020, ⟨10.1039/D0CP00593B⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02524533/file/d0cp00593b.pdf BibTex

Conference papers

titre
Algorithms for Preemptive Co-scheduling of Kernels on GPUs
auteur
Lionel Eyraud-Dubois, Cristiana Bentes
article
HiPC 2020 : 27th IEEE International Conference on High Performance Computing, Data, and Analytics, Dec 2020, Pune / Virtual, India
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03148711/file/ProblemStatement.submitted.pdf BibTex
titre
Geometric Deep Reinforcement Learning for Dynamic DAG Scheduling
auteur
Nathan Grinsztajn, Olivier Beaumont, Emmanuel Jeannot, Philippe Preux
article
IEEE SSCI 2020 – Symposium Series on Computational Intelligence, Dec 2020, Canberra / Virtual, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03028981/file/HPC_ADPRL.pdf BibTex
titre
2D Static Resource Allocation for Compressed Linear Algebra and Communication Constraints
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Mathieu Verite
article
HIPC 2020: 27th IEEE International Conference on High Performance Computing, Data, and Analytics, Dec 2020, (virtual), India
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02900244/file/HIPC-RR-v2.pdf BibTex
titre
Approximation Algorithm for Estimating Distances in Distributed Virtual Environments
auteur
Olivier Beaumont, Tobias Castanet, Nicolas Hanusse, Corentin Travers
article
Euro-Par 2020 – 26th International European Conference on Parallel and Distributed Computing, Aug 2020, Warsaw / Virtual, Poland. ⟨10.1007/978-3-030-57675-2_23⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02486218/file/Approximation_Algorithm_for_Estimating_Distances_in_Distributed_Virtual_Environments.pdf BibTex
titre
Optimal GPU-CPU Offloading Strategies for Deep Neural Network Training
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Alena Shilova
article
Euro-Par 2020 – 26th International Conference on Parallel and Distributed Computing, Aug 2020, Warsaw / Virtual, Poland. pp.151-166, ⟨10.1007/978-3-030-57675-2_10⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02316266/file/report.pdf BibTex
titre
Improving mapping for sparse direct solvers: A trade-off between data locality and load balancing
auteur
Changjiang Gou, Ali Al Zoobi, Anne Benoit, Mathieu Faverge, Loris Marchal, Grégoire Pichon, Pierre Ramet
article
EuroPar 2020 – 26th International European Conference on Parallel and Distributed Computing, Aug 2020, Warsaw / Virtual, Poland. pp.1-16
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02973315/file/paper.pdf BibTex
titre
A Makespan Lower Bound for the Scheduling of the Tiled Cholesky Factorization based on ALAP Schedule
auteur
Olivier Beaumont, Julien Langou, Willy Quach, Alena Shilova
article
EuroPar 2020 – 26th International European Conference on Parallel and Distributed Computing, Aug 2020, Warsaw / Virtual, Poland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02487920/file/CholeskyRR.pdf BibTex
titre
Statistical learning for OTUs identification
auteur
Mohamed Anwar Abouabdallah, Olivier Coulaud, Alain Franc, Nathalie Peyrard
article
ISEC 2020 – International Statistical Ecology Conference, Jun 2020, Sydney / Virtual, Australia
Accès au bibtex
BibTex
titre
Tiled Algorithms for Efficient Task-Parallel H-Matrix Solvers
auteur
Rocío Carratalá-Sáez, Mathieu Faverge, Grégoire Pichon, Guillaume Sylvand, Enrique S Quintana-Ortí
article
PDSEC 2020 – 21st IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing, May 2020, News Orleans, United States. pp.1-10
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02513433/file/paper_final.pdf BibTex
titre
Analysis of a List Scheduling Algorithm for Task Graphs on Two Types of Resources
auteur
Lionel Eyraud-Dubois, Suraj Kumar
article
IPDPS 2020 – 34th IEEE International Parallel and Distributed Procesing Symposium, May 2020, New Orleans / Virtual, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02431810/file/pap418s3.pdf BibTex
titre
Recent Developments Around the Block Low-Rank PaStiX Solver
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet
article
PP 2020 – SIAM Conference on Parallel Processing for Scientific Computing, Feb 2020, Seattle, United States
Accès au bibtex
BibTex
titre
Exploiting Generic Tiled Algorithms Toward Scalable H-Matrices Factorizations on Top of Runtime Systems
auteur
Rocío Carratalá-Sáez, Mathieu Faverge, Grégoire Pichon, Enrique Salvador Quintana-Ortí, Guillaume Sylvand
article
SIAM PP20 – SIAM Conference on Parallel Processing for Scientific Computing, Feb 2020, Seattle, United States
Accès au bibtex
BibTex

Reports

titre
A complementary note on soft errors in the Conjugate Gradient method: the persistent error case
auteur
Emmanuel Agullo, Siegfried Cools, Emrullah Fatih-Yetkin, Luc Giraud, Nick Schenkels, Wim Vanroose
article
[Research Report] RR-9360, Inria Bordeaux Sud-Ouest. 2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02921669/file/RR-9360.pdf BibTex
titre
Exploring variable accuracy storage through lossy compression techniques in numerical linear algebra: a first application to flexible GMRES
auteur
Emmanuel Agullo, Franck Cappello, Sheng Di, Luc Giraud, Xin Liang, Nick Schenkels
article
[Research Report] RR-9342, Inria Bordeaux Sud-Ouest. 2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02572910/file/RR-9342.pdf BibTex
titre
On soft errors in the Conjugate Gradient method: sensitivity and robust numerical detection -revised
auteur
Emmanuel Agullo, Siegfried Cools, Emrullah Fatih-Yetkin, Luc Giraud, Nick Schenkels, Wim Vanroose
article
[Research Report] RR-9330, Inria Bordeaux Sud-Ouest. 2020, pp.43
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02495301/file/RR-9330.pdf BibTex
titre
Tiled Algorithms for Efficient Task-Parallel H-Matrix Solvers
auteur
Rocío Carratalá-Sáez, Mathieu Faverge, Grégoire Pichon, Guillaume Sylvand, Enrique S Quintana-Ortí
article
[Research Report] RR-9327, Inria. 2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02489269/file/RR-9327.pdf BibTex
titre
Improving mapping for sparse direct solvers: A trade-off between data locality and load balancing
auteur
Changjiang Gou, Ali Al Zoobi, Anne Benoit, Mathieu Faverge, Loris Marchal, Grégoire Pichon, Pierre Ramet
article
[Research Report] RR-9328, Inria Rhône-Alpes. 2020, pp.21
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02491495/file/rr9328.pdf BibTex
titre
Comparative study of harmonic and Rayleigh-Ritz procedures with applications to deflated conjugate gradients
auteur
Nicolas Venkovic, Paul Mycek, Luc Giraud, Olivier Le Maitre
article
[Research Report] Cerfacs. 2020
Accès au texte intégral et bibtex
https://hal.science/hal-02434043/file/TR-PA-20-3.pdf BibTex

Preprints, Working Papers, …

titre
Independent tasks on 2 resources with co-scheduling effects
auteur
Lionel Eyraud-Dubois, Cristiana Bentes
article
2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02431897/file/ProblemStatement.pdf BibTex

2019

Journal articles

titre
High order HDG method and domain decomposition solvers for frequency‐domain electromagnetics
auteur
Emmanuel Agullo, Luc Giraud, Alexis Gobé, Matthieu Kuhn, Stephane Lanteri, Ludovic Moya
article
International Journal of Numerical Modelling: Electronic Networks, Devices and Fields, 2019, ⟨10.1002/jnm.2678⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02327982/file/hdgfd_maxw.pdf BibTex
titre
Efficient Parallel Solution of the 3D Stationary Boltzmann Transport Equation for Diffusive Problems
auteur
Salli Moustafa, François Févotte, Mathieu Faverge, Laurent Plagne, Pierre Ramet
article
Journal of Computational Physics, 2019, ⟨10.1016/j.jcp.2019.03.019⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02080624/file/main.pdf BibTex
titre
Robust preconditioners via generalized eigenproblems for hybrid sparse linear solvers
auteur
Emmanuel Agullo, Luc Giraud, Louis Poirel
article
SIAM Journal on Matrix Analysis and Applications, 2019, 40 (2), pp.417-439. ⟨10.1137/17M1153765⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02074474/file/m115376R.pdf BibTex
titre
Optimal Memory-aware Backpropagation of Deep Join Networks
auteur
Olivier Beaumont, Julien Herrmann, Guillaume Pallez, Alena Shilova
article
Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, In press
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02401105/file/rsta_rev2.pdf BibTex

Conference papers

titre
Leveraging Task-Based Polar Decomposition Using PARSEC on Massively Parallel Systems
auteur
Dalal Sukkari, Hatem Ltaief, David Keyes, Mathieu Faverge
article
IEEE Cluster 2019, Sep 2019, Albuquerque, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02272946/file/qdwh-1file.pdf BibTex
titre
Performance Models for Data Transfers: A Case Study with Molecular Chemistry Kernels
auteur
Suraj Kumar, Lionel Eyraud-Dubois, Sriram Krishnamoorthy
article
ICPP 2019 – 48th International Conference on Parallel Processing, Aug 2019, Kyoto, Japan. ⟨10.1145/3337821.3337921⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02431877/file/dataTransferModels.pdf BibTex
titre
Fast BEM solution for scattering problems using Quantized Tensor Train format
auteur
Jean-René Poirier, Ayoub Bellouch, Olivier Coulaud, Oguz Kaya
article
COMPUMAG 2019 – 22nd International Conference on the Computation of Electromagnetic Field, Jul 2019, Paris, France
Accès au texte intégral et bibtex
https://hal.science/hal-02264277/file/TTBEM.pdf BibTex
titre
Rank Revealing QR Methods for Sparse Block Low Rank Solvers
auteur
Esragul Korkmaz, Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
Sparse Days 2019, Jul 2019, Toulouse, France
Accès au bibtex
BibTex
titre
Rank Revealing QR Methods for Sparse Block Low Rank Solvers
auteur
Esragul Korkmaz, Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
COMPAS 2019 – Conférence d’informatique en Parallélisme, Architecture et Système, Jun 2019, Anglet, France
Accès au bibtex
BibTex
titre
Sizing and Partitioning Strategies for Burst-Buffers to Reduce IO Contention
auteur
Guillaume Aupy, Olivier Beaumont, Lionel Eyraud-Dubois
article
IPDPS 2019 – 33rd IEEE International Parallel and Distributed Processing Symposium, May 2019, Rio de Janeiro, Brazil
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02141616/file/main2.pdf BibTex
titre
Clustering de données OTU par modèle SBM
auteur
Mohamed Anwar Abouabdallah, Nathalie Peyrard, Alain Franc, Olivier Coulaud
article
Réunion annuelle du GDR Ecologie Statistique, May 2019, Avignon, France
Accès au bibtex
BibTex
titre
H-Matrix Solver Applied to Coupled FEM-BEM Aeroacoustics Simulations
auteur
Guillaume Sylvand
article
Journées Ondes Sud-Ouest (JOSO), Mar 2019, Le Barp, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02140403/file/H-matrix%20FEM-BEM%20JOSO%2012%20mars%202019.pdf BibTex
titre
Block Low Rank Algebraic Clustering for Sparse Direct Solvers
auteur
Pierre Ramet
article
Journées Ondes Sud-Ouest (JOSO), Mar 2019, Le Barp, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02139186/file/joso.pdf BibTex
titre
Numerical Analysis of the Maximal Attainable Accuracy in Communication-hiding Pipelined Conjugate Gradients
auteur
Siegfried Cools, Jeffrey Cornelis, Emmanuel Agullo, Emrullah Fatih-Yetkin, Luc Giraud, Wim Vanroose
article
CSE19 – SIAM Conference on Computational Science and Engineering, Feb 2019, Spokane, United States
Accès au bibtex
BibTex
titre
On Soft Errors in the Conjugate Gradient: Sensitivity and Robust Numerical Detection
auteur
Emmanuel Agullo, Siegfried Cools, Luc Giraud, Emrullah Fatih-Yetkin, Wim Vanroose
article
CSE19 – SIAM Conference on Computational Science and Engineering, Feb 2019, Spokane, United States
Accès au bibtex
BibTex
titre
Block Low-rank Algebraic Clustering for Sparse Direct Solvers
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Conference on Computational Science and Engineering (CSE19), Feb 2019, Spokane, United States
Accès au bibtex
BibTex
titre
Exploiting Parameterized Task-graph in Sparse Direct Solvers
auteur
Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
SIAM Conference on Computational Science and Engineering (CSE19), Feb 2019, Spokane, United States
Accès au bibtex
BibTex
titre
Simulation of a Sparse Direct Solver on Heterogeneous Systems using Starpu and Simgrid
auteur
Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Arnaud Legrand, Ian Masliah, Luka Stanisic
article
SIAM Conference on Computational Science and Engineering (CSE 2019), Feb 2019, Spokane, United States
Accès au bibtex
BibTex
titre
Energy Analysis of a Solver Stack for Frequency-Domain Electromagnetics
auteur
Emmanuel Agullo, Luc Giraud, Stephane Lanteri, Gilles Marait, Anne-Cécile Orgerie, Louis Poirel
article
PDP 2019 – 27th Euromicro International Conference on Parallel, Distributed and Network-Based Processing, Feb 2019, Pavia, Italy. pp.385-391, ⟨10.1109/EMPDP.2019.8671555⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02191331/file/paper_formatted.pdf BibTex

Documents associated with scientific events

titre
Sparse supernodal solver using block low-rank compression: Design, performance and analysis
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Esragul Korkmaz, Pierre Ramet, Jean Roman
article
JOREK development meeting, Nov 2019, Cadarache, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02326407/file/jorek.pdf BibTex

Reports

titre
A hierarchical fast direct solver for distributed memory machines with manycore nodes
auteur
Cédric Augonnet, David Goudin, Matthieu Kuhn, Xavier Lacoste, Raymond Namyst, Pierre Ramet
article
[Research Report] CEA/DAM; Total E&P; Université de Bordeaux. 2019
Accès au texte intégral et bibtex
https://cea.hal.science/cea-02304706/file/HMAT-CEA-RR.pdf BibTex
titre
Optimal Memory-aware Backpropagation of Deep Join Networks
auteur
Olivier Beaumont, Julien Herrmann, Guillaume Pallez, Alena Shilova
article
[Research Report] RR-9273, Inria. 2019
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02131552/file/research_report.pdf BibTex

Software

titre
Experimental code and data for the paper “Scheduling on Two Types of Resources: a Survey
auteur
Lionel Eyraud-Dubois, Louis-Claude Canon
article
2019, ⟨swh:1:dir:fe5a230ec88d49ecd9790d2199f23b5c5b72abbe;origin=https://hal.archives-ouvertes.fr/hal-02159005;visit=swh:1:snp:6c6bd2ef190e40d7026749369725dd954c1c75d6;anchor=swh:1:rev:b2af27e129fad7558d725e6b60da7aaea5b0c86f;path=/⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02159005/file/Survey_Heterogeneity_experiments.zip BibTex

Theses

titre
Combler l’écart entre H-Matrices et méthodes directes creuses pour la résolution de systèmes linéaires de grandes tailles
auteur
Aurélien Falco
article
Other [cs.OH]. Université de Bordeaux, 2019. English. ⟨NNT : 2019BORD0090⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-02183902/file/FALCO_AURELIEN_2019.pdf BibTex

Preprints, Working Papers, …

titre
Using computed infrared intensities for fast computation of vibrational spectra
auteur
Vincent Le Bris, Marc Odunlami, Didier Bégué, Isabelle Baraille, Olivier Coulaud
article
2019
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02518243/file/avci3.pdf BibTex

2018

Journal articles

titre
Low-Rank Factorizations in Data Sparse Hierarchical Algorithms for Preconditioning Symmetric Positive Definite Matrices
auteur
Emmanuel Agullo, Eric Darve, Luc Giraud, Yuval Harness
article
SIAM Journal on Matrix Analysis and Applications, 2018, 39 (4), pp.1701-1725
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01940053/file/SPD_WHODLR_Precond_new3.pdf BibTex
titre
Resource aggregation for task-based Cholesky Factorization on top of modern architectures
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
Parallel Computing, 2018
Accès au bibtex
BibTex
titre
Sparse supernodal solver using block low-rank compression: Design, performance and analysis
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
International Journal of Computational Science and Engineering, 2018, 27, pp.255 – 270. ⟨10.1016/J.JOCS.2018.06.007⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01824275/file/blr.pdf BibTex
titre
Guest editorial: Special issue on parallel matrix algorithms and applications (PMAA’16)
auteur
Emmanuel Agullo, Peter Arbenz, Luc Giraud, Olaf Schenk
article
Parallel Computing, 2018, 74, pp.1 – 2. ⟨10.1016/j.parco.2018.01.003⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01927721/file/edito.pdf BibTex
titre
Analyzing the Effect of Local Rounding Error Propagation on the Maximal Attainable Accuracy of the Pipelined Conjugate Gradient Method
auteur
Siegfried Cools, Emrullah Fatih Yetkin, Emmanuel Agullo, Luc Giraud, Wim Vanroose
article
SIAM Journal on Matrix Analysis and Applications, 2018, 39 (1), pp.426 – 450. ⟨10.1137/17M1117872⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01753411/file/simax_2018_pipelinedAccuracy.pdf BibTex
titre
Evaluation of Dataflow Programming Models for Electronic Structure Theory
auteur
Heike Jagode, Anthony Danalis, Reazul Hoque, Mathieu Faverge, Jack Dongarra
article
Concurrency and Computation: Practice and Experience, In press, pp.23
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01725804/file/paper.pdf BibTex

Conference papers

titre
A semi-automatic 2D/3D annotation framework for the geometric analysis of heritage artefacts
auteur
Adeline Manuel, Anas Alaoui M’Darhri, Violette Abergel, Fabien Rozar, Livio De Luca
article
3rd Digital Heritage International Congress (Digital Heritage) held jointly with 2018 24th International Conference on Virtual Systems & Multimedia (VSMM 2018), Oct 2018, San Francisco, United States. pp.1-7, ⟨10.1109/DigitalHeritage.2018.8810114⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02326770/file/A%20semi-automatic%202D3D%20annotation%20framework%20for%20the%20geometric%20analysis%20of%20heritage%20artefacts.pdf BibTex
titre
Hierarchical Symbolic Factorization for Sparse Matrices
auteur
Aurélien Falco, Emmanuel Agullo, Luc Giraud, Guillaume Sylvand
article
Sparse Days 2018, Sep 2018, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01999895/file/sparse_days_2018_presentation.pdf BibTex
titre
Utilisation de la compression Block Low-Rank pour accélérer un solveur direct creux supernodal
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
COMPAS 2018 – Conférence d’informatique en Parallélisme, Architecture et Système, Jul 2018, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01956959/file/slides.pdf BibTex
titre
Supernodes ordering to enhance Block Low-Rank compression in sparse direct solvers
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
PMAA 2018 – 10th International Workshop on Parallel Matrix Algorithms and Applications, Jun 2018, Zurich, Switzerland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01956960/file/pmaa18.pdf BibTex
titre
Dislocation Dynamics Simulation : Large scale simulations with Numodis
auteur
Arnaud Durocher, Laurent Dupuy, Olivier Coulaud
article
Journées scientifiques de la DANS, May 2018, Saclay, France
Accès au bibtex
BibTex

Documents associated with scientific events

titre
Utilisation de la compression low-rank pour réduire la complexité du solveur PaStiX
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet, Jean Roman
article
JCAD 2018 – Journées Calcul et Données, Oct 2018, Lyon, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01956928/file/3_Faverge.pdf BibTex

Reports

titre
Energy analysis of a solver stack for frequency-domain electromagnetics
auteur
Emmanuel Agullo, Luc Giraud, Stéphane Lanteri, Gilles Marait, Anne-Cécile Orgerie, Louis Poirel
article
[Research Report] RR-9240, Inria Bordeaux Sud-Ouest. 2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01962629/file/RR_9240.pdf BibTex
titre
Supernodes ordering to enhance Block Low-Rank compression in sparse direct solvers
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
[Research Report] RR-9238, Inria Bordeaux Sud-Ouest. 2018, pp.1-31
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01961675/file/RR-9238.pdf BibTex
titre
On soft errors in the Conjugate Gradient method: sensitivity and robust numerical detection
auteur
Emmanuel Agullo, Siegfried Cools, Emrullah Fatih-Yetkin, Luc Giraud, Wim Vanroose
article
[Research Report] RR-9226, Inria Bordeaux Sud-Ouest. 2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01929738/file/RR-9226.pdf BibTex
titre
Nonlinear Mapping and Distance Geometry
auteur
Alain Franc, Pierre Blanchard, Olivier Coulaud
article
[Research Report] RR-9210, Inria Bordeaux Sud-Ouest. 2018, pp.14
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01897104/file/RR-9210.pdf BibTex
titre
Low-rank Factorizations in Data Sparse Hierarchical Algorithms for Preconditioning Symmetric Positive Definite Matrices
auteur
Emmanuel Agullo, Eric Darve, Luc Giraud, Yuval Harness
article
[Research Report] RR-9200, Inria Bordeaux Sud-Ouest. 2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01856399/file/RR-9200.pdf BibTex
titre
Partitioning and Communication Strategies for Sparse Non-negative Matrix Factorization
auteur
Oguz Kaya, Ramakrishnan Kannan, Grey Ballard
article
[Research Report] RR-9198, Inria Bordeaux Sud-Ouest. 2018
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01849084/file/RR-9198.pdf BibTex
titre
A geometric view of Biodiversity: scaling to metagenomics
auteur
Pierre Blanchard, Philippe Chaumeil, Jean-Marc Frigerio, Frédéric Rimet, Franck Salin, Sylvie Thérond, Olivier Coulaud, Alain Franc
article
[Research Report] RR-9144, INRIA; INRA. 2018, pp.1-16
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01685711/file/RR-9144.pdf BibTex

Theses

titre
Large scale Dislocation Dynamics simulations : performance and reliability on parallel and distributed architectures.
auteur
Arnaud Durocher
article
Algorithme et structure de données [cs.DS]. Université de Bordeaux, 2018. Français. ⟨NNT : 2018BORD0423⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-02012109/file/DUROCHER_ARNAUD_2018.pdf BibTex
titre
On the use of low-rank arithmetic to reduce the complexity of parallel sparse linear solvers based on direct factorization techniques
auteur
Grégoire Pichon
article
Data Structures and Algorithms [cs.DS]. Université de Bordeaux, 2018. English. ⟨NNT : 2018BORD0249⟩
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01953908/file/PICHON_GREGOIRE_2018.pdf BibTex

2017

Journal articles

titre
Asynchronous Task-Based Polar Decomposition on Single Node Manycore Architectures
auteur
Dalal Sukkari, Hatem Ltaief, Mathieu Faverge, David Keyes
article
IEEE Transactions on Parallel and Distributed Systems, 2017, XX, ⟨10.1109/TPDS.2017.2755655⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01585079/file/qdwh-tb-1file.pdf BibTex
titre
A-VCI: A flexible method to efficiently compute vibrational spectra
auteur
Marc Odunlami, Vincent Le Bris, Didier Bégué, Isabelle Baraille, Olivier Coulaud
article
The Journal of Chemical Physics, 2017, 146 (21), ⟨10.1063/1.4984266⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01534134/file/JCPSA6-000146-214108_1.pdf BibTex
titre
Bridging the gap between OpenMP and task-based runtime systems for the fast multipole method
auteur
Emmanuel Agullo, Olivier Aumage, Bérenger Bramas, Olivier Coulaud, Samuel Pitoiset
article
IEEE Transactions on Parallel and Distributed Systems, 2017, pp.14. ⟨10.1109/TPDS.2017.2697857⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01517153/file/tpds_kstar_scalfmm_print.pdf BibTex
titre
ASIS v1.0: an adaptive solver for the simulation of atmospheric chemistry
auteur
Daniel Cariolle, Philippe Moinat, Hubert Teyssèdre, Luc Giraud, Béatrice Josse, Franck Lefèvre
article
Geoscientific Model Development, 2017, 10, pp.1467 – 1485. ⟨10.5194/gmd-10-1467-2017⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01507392/file/gmd-10-1467-2017.pdf BibTex
titre
Reordering Strategy for Blocking Optimization in Sparse Linear Solvers
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Journal on Matrix Analysis and Applications, 2017, SIAM Journal on Matrix Analysis and Applications, 38 (1), pp.226 – 248. ⟨10.1137/16M1062454⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01485507/file/M106245.pdf BibTex
titre
Design and Analysis of a Task-based Parallelization over a Runtime System of an Explicit Finite-Volume CFD Code with Adaptive Time Stepping
auteur
Jean Marie Couteyen Carpaye, Jean Roman, Pierre Brenner
article
International Journal of Computational Science and Engineering, 2017, pp.1 – 22. ⟨10.1016/j.jocs.2017.03.008⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01507613/file/flusepa-task-hal-inria-preprint.pdf BibTex
titre
Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
IEEE Transactions on Parallel and Distributed Systems, In press, ⟨10.1109/TPDS.2017.2766064⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01618526/file/tpds14.pdf BibTex
titre
Comparison of initial partitioning methods for multilevel direct k-way graph partitioning with fixed vertices
auteur
Maria Predari, Aurélien Esnard, Jean Roman
article
Parallel Computing, 2017, ⟨10.1016/j.parco.2017.05.002⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01538600/file/parco16.pdf BibTex

Conference papers

titre
Sparse Supernodal Solver exploiting Low-Rankness Property
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
Sparse Days 2017, Sep 2017, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01585622/file/S01E02-Pichon.pdf BibTex
titre
Soft Error in Classical PCG and its Variants: Sensitivity, Numerical Detections and Possible Recovery Policies
auteur
Emmanuel Agullo, Siegfried Cools, Luc Giraud, Wim Vanroose, Emrullah Fatih Yetkin
article
SIAM Annual meeting 2017, AN’17, Jul 2017, Pittsburgh, United States
Accès au bibtex
BibTex
titre
A new parallelization scheme for the Hermite interpolation based gyroaverage operator
auteur
Nicolas Bouzat, Fabien Rozar, Guillaume Latu, Jean Roman
article
ISPDC 2017 – 16th International Symposium on Parallel and Distributed Computing, Jul 2017, Innsbruck, Austria. pp.1-8, ⟨10.1109/ISPDC.2017.12⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01687727/file/paper.pdf BibTex
titre
Vers une factorisation symbolique hiérarchique de rang faible pour des matrices creuses
auteur
Emmanuel Agullo, Aurélien Falco, Luc Giraud, Guillaume Sylvand
article
Conférence d’informatique en Parallélisme, Architecture et Système (ComPAS’17), Jun 2017, Sophia Antipolis, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01597072/file/report.pdf BibTex
titre
Utilisation de la compression Block Low-Rank pour accélérer un solveur direct creux supernodal
auteur
Grégoire Pichon
article
Conférence d’informatique en Parallélisme, Architecture et Système (ComPAS’17), Jun 2017, Sophia Antipolis, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01585660/file/blr.pdf BibTex
titre
Sparse Supernodal Solver Using Block Low-Rank Compression
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
18th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing (PDSEC 2017), Jun 2017, Orlando, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01502215/file/blr-final.pdf BibTex
titre
Approximation Proofs of a Fast and Efficient List Scheduling Algorithm for Task-Based Runtime Systems on Multicores and GPUs
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS), May 2017, Orlando, United States. ⟨10.1109/IPDPS.2017.71⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01386174/file/heteroPrioApproxProofsRR.pdf BibTex
titre
Bidiagonalization and R-Bidiagonalization: Parallel Tiled Algorithms, Critical Paths and Distributed-Memory Implementation
auteur
Mathieu Faverge, Julien Langou, Yves Robert, Jack Dongarra
article
IPDPS’17 – 31st IEEE International Parallel and Distributed Processing Symposium , May 2017, Orlando, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01484113/file/ipdps-final.pdf BibTex
titre
Automatic Collapsing of Non-Rectangular Loops
auteur
Philippe Clauss, Ervin Altintas, Matthieu Kuhn
article
Parallel and Distributed Processing Symposium (IPDPS), 2017, May 2017, Orlando, United States. pp.778 – 787, ⟨10.1109/IPDPS.2017.34⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01581081/file/paper.pdf BibTex
titre
Soft Error in PCG: Sensitivity, Numerical Detections and Possible Recoveries
auteur
Emmanuel Agullo, Luc Giraud, Emrullah Fatih Yetkin
article
SIAM Conference on Computational Science and Engineering, CSE’17, Feb 2017, Atlanta, United States
Accès au bibtex
BibTex
titre
Sparse Supernodal Solver Using Hierarchical Compression over Runtime System
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Conference on Computation Science and Engineering (CSE’17), Feb 2017, Atlanta, United States
Accès au bibtex
BibTex
titre
Exploiting Modern Manycore Architecture in Sparse Direct Solver with Runtime Systems
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet
article
SIAM Conference on Computation Science and Engineering (CSE’17), Feb 2017, Atlanta, United States
Accès au bibtex
BibTex
titre
Impact of Blocking Strategies for Sparse Direct Solvers on Top of Generic Runtimes
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Conference on Computation Science and Engineering (CSE’17), Feb 2017, Atlanta, United States
Accès au bibtex
BibTex
titre
Robust coarse spaces for abstract Schwarz preconditioners via generalized eigenproblems
auteur
Emmanuel Agullo, Luc Giraud, Louis Poirel
article
International conference on domain decomposition methods, DD24, Feb 2017, Svalbard, Norway
Accès au bibtex
BibTex

Habilitation à diriger des recherches

titre
Heterogeneous architectures, Hybrid methods, Hierarchical matrices for Sparse Linear Solvers
auteur
Pierre Ramet
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2017
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01668740/file/hdr%20%281%29.pdf BibTex

Master thesis

titre
Critical resources management and scheduling under StarPU
auteur
Arthur Chevalier
article
Distributed, Parallel, and Cluster Computing [cs.DC]. 2017
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01718280/file/Memoire.pdf BibTex

Documents associated with scientific events

titre
Sparse supernodal solver with low-rank compression for solving the frequency-domain Maxwell equations discretized by a high order HDG method
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Stéphane Lanteri, Pierre Ramet, Jean Roman
article
Journées jeunes chercheur-e-s – Résolution de problèmes d’ondes harmoniques de grande taille, Nov 2017, PARIS, France. pp.1-55, 2017
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01660653/file/slides.pdf BibTex

Reports

titre
Sparse Supernodal Solver Using Block Low-Rank Compression: design, performance and analysis
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
[Research Report] RR-9130, Inria Bordeaux Sud-Ouest. 2017, pp.1-32
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01660665/file/RR-9130.pdf BibTex
titre
Efficient Parallel Solution of the 3D Stationary Boltzmann Transport Equation for Diffusive Problems
auteur
Salli Moustafa, François Févotte, Mathieu Faverge, Laurent Plagne, Pierre Ramet
article
[Research Report] RR-9116, Inria; EDF Lab. 2017, pp.22
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01630208/file/RR-9116.pdf BibTex
titre
A new parallelization scheme for the Hermite interpolation based gyroaverage operator
auteur
Nicolas Bouzat, Fabien Rozar, Guillaume Latu, Jean Roman
article
[Research Report] RR-9054, Inria. 2017, pp.22
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01502513/file/RR-9054.pdf BibTex
titre
A-VCI: a flexible method to efficiently compute vibrational spectra
auteur
Isabelle Baraille, Didier Bégué, Olivier Coulaud, Vincent Le Bris, Marc Odunlami
article
[Research Report] RR-9043, Inria. 2017, pp.35
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01485877/file/RR-9043.pdf BibTex
titre
Task-based fast multipole method for clusters of multicore processors
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Martin Khannouz, Luka Stanisic
article
[Research Report] RR-8970, Inria Bordeaux Sud-Ouest. 2017, pp.15
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01387482/file/report-8970.pdf BibTex
titre
Modeling Irregular Kernels of Task-based codes: Illustration with the Fast Multipole Method
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Luka Stanisic, Samuel Thibault
article
[Research Report] RR-9036, INRIA Bordeaux. 2017, pp.35
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01474556/file/rapport.pdf BibTex
titre
Achieving high-performance with a sparse direct solver on Intel KNL
auteur
Emmanuel Agullo, Alfredo Buttari, Mikko Byckling, Abdou Guermouche, Ian Masliah
article
[Research Report] RR-9035, Inria Bordeaux Sud-Ouest; CNRS-IRIT; Intel corporation; Université Bordeaux. 2017, pp.15
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01473475/file/RR-9035.pdf BibTex
titre
Sparse Supernodal Solver Using Block Low-Rank Compression
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
[Research Report] RR-9022, Inria Bordeaux Sud-Ouest. 2017, pp.24
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01450732/file/RR-9022%20%281%29.pdf BibTex

Software

titre
StarPU
auteur
Simon Archipoff, Cédric Augonnet, Olivier Aumage, Guillaume Beauchamp, Bérenger Bramas, Alfredo Buttari, Adrien Cassagne, Jérôme Clet-Ortega, Terry Cojean, Nicolas Collin, Vincent Danjean, Alexandre Denis, Lionel Eyraud-Dubois, Nathalie Furmento, Sylvain Henry, Andra Hugo, Mehdi Juhoor, Alexis Juven, Maël Keryell-Even, Yanis Khorsi, Thibaut Lambert, Erwan Leria, Benoît Lizé, Mariem Makni, Stojce Nakov, Raymond Namyst, Leandro Nesi Lucas, Pablo Joris, Damien Pasqualinotto, Samuel Pitoiset, Quôc-Dinh Nguyen, Cyril Roelandt, Chiheb Sakka, Corentin Salingue, Lucas Mello Schnorr, Marc Sergent, Anthony Simonet, Luka Stanisic, Bérangère Subervie, François Tessier, Samuel Thibault, Brice Videau, Leo Villeveygoux, Pierre-André Wacrenier
article
2017, ⟨swh:1:dir:b6e19d99449a78805e7a55a341fbaba2bc431973;origin=https://hal.archives-ouvertes.fr/hal-02443512;visit=swh:1:snp:c21d3dfbd96e4fb502c534e59644dba14c542100;anchor=swh:1:rev:31be198773f103324593d26369f135fbde5b97f8;path=/⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01730321/file/starpu-1.3.3.zip BibTex

Theses

titre
Mathematical and numerical analysis of the Herberthson integral equation dedicated to electromagnetic plane wave scattering
auteur
Benjamin Alzaix
article
Mathématiques générales [math.GM]. Université de Bordeaux, 2017. Français. ⟨NNT : 2017BORD0578⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01558135/file/ALZAIX_BENJAMIN_2017.pdf BibTex
titre
Scheduling of Dense Linear Algebra Kernels on Heterogeneous Resources
auteur
Suraj Kumar
article
Other [cs.OH]. Université de Bordeaux, 2017. English. ⟨NNT : 2017BORD0572⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01538516/file/KUMAR_SURAL_2017.pdf BibTex

2016

Journal articles

titre
Numerical recovery strategies for parallel resilient Krylov linear solvers
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman, Mawussi Zounon
article
Numerical Linear Algebra with Applications, 2016, 23 (5), pp.888–905. ⟨10.1002/nla.2059⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01323192/file/final_nlaa.pdf BibTex
titre
Implementing multifrontal sparse solvers for multicore architectures with Sequential Task Flow runtime systems
auteur
Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Florent Lopez
article
ACM Transactions on Mathematical Software, 2016, ⟨10.1145/2898348⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01333645/file/toms_qrm_starpu.pdf BibTex
titre
Robust memory-aware mappings for parallel multifrontal factorizations
auteur
Emmanuel Agullo, Patrick Amestoy, Alfredo Buttari, Abdou Guermouche, Jean-Yves L’Excellent, François-Henry Rouet
article
SIAM Journal on Scientific Computing, 2016, 38 (3), pp.C256 – C279. ⟨10.1137/130938505⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01334113/file/article.pdf BibTex
titre
Task-based FMM for heterogeneous architectures
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
Concurrency and Computation: Practice and Experience, 2016, 28 (9), ⟨10.1002/cpe.3723⟩
Accès au bibtex
BibTex
titre
Adaptive vibrational configuration interaction (A-VCI): a posteriori error estimation to efficiently compute anharmonic IR spectra
auteur
Romain Garnier, Marc Odunlami, Vincent Le Bris, Didier Bégué, Isabelle Baraille, Olivier Coulaud
article
The Journal of Chemical Physics, 2016, 144 (20), ⟨10.1063/1.4952414⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01310708/file/avci.pdf https://inria.hal.science/hal-01310708/file/avciSuppInfo.pdf BibTex
titre
Optimization of the gyroaverage operator based on hermite interpolation
auteur
Fabien Rozar, Christophe Steiner, Guillaume Latu, Michel Mehrenberger, Virginie Grandgirard, Julien Bigot, T Cartier-Michaud, Jean Roman
article
ESAIM: Proceedings and Surveys, 2016, ⟨10.1051/proc/201653012⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01261427/file/gyroaverage-esaim.pdf BibTex
titre
Interpolation-restart strategies for resilient eigensolvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Mawussi Zounon
article
SIAM Journal on Scientific Computing, 2016, 38 (5), pp.C560-C583. ⟨10.1137/15M1042115⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01347793/file/revised2_sisc_vp.pdf BibTex

Conference papers

titre
Scheduling of Linear Algebra Kernels on Multiple Heterogeneous Resources
auteur
Olivier Beaumont, Terry Cojean, Lionel Eyraud-Dubois, Abdou Guermouche, Suraj Kumar
article
International Conference on High Performance Computing, Data, and Analytics (HiPC 2016), Dec 2016, Hyderabad, India. ⟨10.1109/HiPC.2016.045⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01361992/file/HiPC.pdf BibTex
titre
Analyzing Dynamic Task-Based Applications on Hybrid Platforms: An Agile Scripting Approach
auteur
Vinicius Garcia Pinto, Luka Stanisic, Arnaud Legrand, Lucas Mello Schnorr, Samuel Thibault, Vincent Danjean
article
VPA 2016 – 3rd Workshop on Visual Performance Analysis, Nov 2016, Salt Lake City, United States. pp.17-24, ⟨10.1109/VPA.2016.008⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01353962/file/vpa2016-submitted.pdf BibTex
titre
Sparse Supernodal Solver Using Hierarchical Compression
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
Workshop on Fast Direct Solvers, Nov 2016, Purdue, United States
Accès au bibtex
BibTex
titre
Two New Block Krylov Methods for Linear Systems with Multiple Right-hand Sides
auteur
Yan-Fei Jing, Emmanuel Agullo, Bruno Carpentieri, Luc Giraud, Ting-Zhu Huang
article
IMA Conference on Numerical Linear Algebra and Optimization, Sep 2016, Birmingham, United Kingdom
Accès au bibtex
BibTex
titre
Numerical fault tolerant strategies for resilient parallel eigensolvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Mawussi Zounon
article
IMA Conference on Numerical Linear Algebra and Optimization, Sep 2016, Birmingham, United Kingdom
Accès au bibtex
BibTex
titre
Exploiting a Parametrized Task Graph model for the parallelization of a sparse direct multifrontal solver
auteur
Emmanuel Agullo, George Bosilca, Alfredo Buttari, Abdou Guermouche, Florent Lopez
article
Euro-Par 2016: Parallel Processing Workshops, Aug 2016, Grenoble, France. ⟨10.1007/978-3-319-58943-5_14⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01337748/file/iwmse16_round1.pdf BibTex
titre
Resource aggregation in task-based applications over accelerator-based multicore machines
auteur
Terry Cojean, Abdou Guermouche, Andra-Ecaterina Hugo, Raymond Namyst, Pierre-André Wacrenier
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France
Accès au bibtex
BibTex
titre
Resource aggregation for task-based Cholesky Factorization on top of heterogeneous machines
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01181135/file/papier%20%281%29.pdf BibTex
titre
Task-based sparse hybrid linear solver for distributed memory heterogeneous architectures
auteur
Emmanuel Agullo, Luc Giraud, Stojce Nakov
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France
Accès au bibtex
BibTex
titre
Task-based Conjugate Gradient: from multi-GPU towards heterogeneous architectures
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Stojce Nakov, Jean Roman
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France. ⟨10.1007/978-3-319-58943-5⟩
Accès au bibtex
BibTex
titre
On the use of low rank approximations for sparse direct solvers
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Annual Meeting (AN’16), Jul 2016, Boston, United States
Accès au bibtex
BibTex
titre
Exploiting Kepler architecture in sparse direct solver with runtime systems
auteur
Mathieu Faverge, Grégoire Pichon, Pierre Ramet
article
9th International Workshop on Parallel Matrix Algorithms and Applications (PMAA’2016), Jul 2016, Bordeaux, France
Accès au bibtex
BibTex
titre
Coarse Grid Correction for the MaPHyS Algebraic Domain Decomposition Solver
auteur
Emmanuel Agullo, Luc Giraud, Louis Poirel
article
Sparse Days 2016, Jun 2016, Toulouse, France
Accès au bibtex
BibTex
titre
Hard faults and soft errors: possible numerical remedies in linear algebra solvers
auteur
Emmanuel Agullo, Siegfried Cools, Luc Giraud, Alexandre Moreau, Pablo Salas, Wim Vanroose, Emrullah Fatih Yetkin, Mawussi Zounon
article
VecPar – International meeting on High Performance Computing for Computational science, Jun 2016, Porto, Portugal
Accès au bibtex
BibTex
titre
High order scalable HDG method fro frequency-domain electromagnetics
auteur
Emmanuel Agullo, Matthieu Kuhn, Stéphane Lanteri, Ludovic Moya
article
Icosahom 2016 – International Conference on Spectral and High Order Methods , Jun 2016, Rio de Janeiro, Brazil
Accès au bibtex
BibTex
titre
An Efficient Interpolation Based FMM for Dislocation Dynamics Simulations
auteur
Pierre Blanchard, Olivier Coulaud, Arnaud Etcheverry, Laurent Dupuy, Eric Darve
article
Platform for Advanced Scientific Computing, USI; CSCS; EPFL, Jun 2016, Lausanne, Switzerland
Accès au bibtex
BibTex
titre
Coarse Grid Correction for Algebraic Domain Decomposition Solvers
auteur
Louis Poirel, Emmanuel Agullo, Luc Giraud
article
ECCOMAS Congress 2016, Jun 2016, Hersonissos, Greece
Accès au bibtex
BibTex
titre
Towards an efficient Task-based Parallelization over a Runtime System of an Explicit Finite-Volume CFD Code with Adaptive Time Stepping
auteur
Jean Marie Couteyen Carpaye, Jean Roman, Pierre Brenner
article
International Parallel and Distributed Processing Symposium, May 2016, Chicago, IL, United States. pp.10, ⟨10.1109/IPDPSW.2016.125⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01324331/file/PDSEC-06.pdf BibTex
titre
Are Static Schedules so Bad ? A Case Study on Cholesky Factorization
auteur
Emmanuel Agullo, Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2016), May 2016, Chicago, IL, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01223573/file/heteroprioCameraReady-ieeeCompatiable.pdf BibTex
titre
On rounding error resilience, maximal attainable accuracy and parallel performance of the pipelined Conjugate Gradients method for large-scale linear systems in PETSc
auteur
Siegfried Cools, Wim Vanroose, Emrullah Fatih Yetkin, Emmanuel Agullo, Luc Giraud
article
EASC 2016 – Exascale Applications and Software Conference, Apr 2016, Stockholm, Sweden. pp.1-10, ⟨10.1145/2938615.2938621⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01734422/file/cools2016.pdf BibTex
titre
Exploiting H-Matrices in Sparse Direct Solvers
auteur
Grégoire Pichon, Eric Darve, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
Impact of Blocking Strategies for Sparse Direct Solvers on Top of Generic Runtimes
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet, Jean Roman
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
Soft errors in PCG: detection and correction
auteur
Emmanuel Agullo, Siegfried Cools, Luc Giraud, Wim Vanroose, Emrullah Fatih Yetkin
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
Optimizing numerical simulations of elastodynamic wave propagation thanks to task-based parallel programming
auteur
Lionel Boillot, Corentin Rossignon, George Bosilca, Emmanuel Agullo, Henri Calandra
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
Combining Software Pipelining with Numerical Pipelining in the Conjugate Gradient Algorithm
auteur
Emmanuel Agullo, Luc Giraud, Stojce Nakov
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
Semi-Algebraic Coarse Space for Parallel Sparse Hybrid Solvers
auteur
Emmanuel Agullo, Louis Poirel, Luc Giraud
article
Journée Calcul Haute Performance et Décomposition de Domaines, Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
Handling clusters with a task-based runtime system: application to Geophysics
auteur
Lionel Boillot, Corentin Rossignon, George Bosilca, Emmanuel Agullo, Henri Calandra, Hélène Barucq, Julien Diaz
article
Rice – Oil & Gas HPC Workshop, Mar 2016, Houston, United States
Accès au bibtex
BibTex
titre
A k-way Greedy Graph Partitioning with Initial Fixed Vertices for Parallel Applications
auteur
Maria Predari, Aurélien Esnard
article
24th Euromicro International Conference on Parallel, Distributed, and Network-Based Processing, Feb 2016, Heraklion, Greece. pp.8
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01277392/file/conf15.pdf BibTex

Poster communications

titre
Graph partitioning techniques for load balancing of coupled simulations
auteur
Maria Predari, Aurélien Esnard
article
SIAM Workshop on Combinatorial Scientific Computing , Oct 2016, Albuquerque, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01399392/file/poster.pdf BibTex
titre
FMR: Fast randomized algorithms for covariance matrix computations
auteur
Pierre Blanchard, Olivier Coulaud, Eric Darve, Alain Franc
article
Platform for Advanced Scientific Computing (PASC), Jun 2016, Lausanne, Switzerland. 2016
Accès au texte intégral et bibtex
https://hal.science/hal-01334747/file/poster-projet.pdf BibTex

Reports

titre
Interior penalty discontinuous Galerkin method for coupled elasto-acoustic media
auteur
Yohann Dudouit, Luc Giraud, Florence Millot, Sébastien Pernet
article
[Research Report] RR-8986, Inria Bordeaux Sud-Ouest. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01406158/file/RR-8986.pdf BibTex
titre
Nearly optimal fast preconditioning of symmetric positive definite matrices
auteur
Emmanuel Agullo, Eric Darve, Luc Giraud, Yuval Harness
article
[Research Report] RR-8984, Inria Bordeaux Sud-Ouest. 2016, pp.34
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01403480/file/RR-8984.pdf BibTex
titre
Robust coarse spaces for Abstract Schwarz preconditioners via generalized eigenproblems
auteur
Emmanuel Agullo, Luc Giraud, Louis Poirel
article
[Research Report] RR-8978, INRIA Bordeaux. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01399203/file/RR-8978.pdf BibTex
titre
Asynchronous Task-Based Polar Decomposition on Manycore Architectures
auteur
Dalal Sukkari, Hatem Ltaief, Mathieu Faverge, David Keyes
article
[Research Report] KAUST. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01387575/file/qdwh-tb.pdf BibTex
titre
Hierarchical hybrid sparse linear solver for multicore platforms
auteur
Emmanuel Agullo, Luc Giraud, Stojce Nakov, Jean Roman
article
[Research Report] RR-8960, INRIA Bordeaux. 2016, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01379227/file/RR-8960.pdf BibTex
titre
Bidiagonalization with Parallel Tiled Algorithms
auteur
Mathieu Faverge, Julien Langou, Yves Robert, Jack Dongarra
article
[Research Report] RR-8969, INRIA. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01389232/file/bidiag_RRv2.pdf BibTex
titre
Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
[Research Report] RR-8927, Inria Bordeaux Sud-Ouest; Bordeaux INP; CNRS; Université de Bordeaux; CEA. 2016, pp.27
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01332774/file/RR-8927.pdf BibTex
titre
Task-based Conjugate Gradient: from multi-GPU towards heterogeneous architectures
auteur
E Agullo, L Giraud, A Guermouche, S Nakov, Jean Roman
article
[Research Report] RR-8912, Inria. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01316982/file/RR-8912.pdf BibTex
titre
Task-based hybrid linear solver for distributed memory heterogeneous architectures
auteur
Emmanuel Agullo, Luc Giraud, Stojce Nakov
article
[Research Report] RR-8913, Inria Bordeaux Sud-Ouest. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01316783/file/RR-8913.pdf BibTex
titre
Bridging the gap between OpenMP 4.0 and native runtime systems for the fast multipole method
auteur
Emmanuel Agullo, Olivier Aumage, Berenger Bramas, Olivier Coulaud, Samuel Pitoiset
article
[Research Report] RR-8953, Inria. 2016, pp.49
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01372022/file/RR-8953.pdf BibTex
titre
Reordering strategy for blocking optimization in sparse linear solvers
auteur
Grégoire Pichon, Mathieu Faverge, Pierre Ramet, Jean Roman
article
[Research Report] RR-8860, Inria Bordeaux Sud-Ouest; LaBRI – Laboratoire Bordelais de Recherche en Informatique; Bordeaux INP; Université de Bordeaux. 2016, pp.26
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01276746/file/RR-8860-v1.pdf BibTex
titre
Analysis of rounding error accumulation in Conjugate Gradients to improve the maximal attainable accuracy of pipelined CG
auteur
Siegfried Cools, Emrullah Fatih Yetkin, Emmanuel Agullo, Luc Giraud, Wim Vanroose
article
[Research Report] RR-8849, Inria Bordeaux Sud-Ouest. 2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01262716/file/RR-8849_v2.pdf BibTex

Theses

titre
Contributions to the parallelization and the scalability of the FLUSEPA code
auteur
Jean Marie Couteyen Carpaye
article
Autre [cs.OH]. Université de Bordeaux, 2016. Français. ⟨NNT : 2016BORD0073⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01399952/file/COUTEYEN_CARPAYE_JEAN-MARIE_2016.pdf BibTex
titre
Optimization and parallelization of the boundary element method for the wave equation in time domain
auteur
Bérenger Bramas
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2016. English. ⟨NNT : 2016BORD0022⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01306571/file/BRAMAS_BERENGER_2016.pdf BibTex

Preprints, Working Papers, …

titre
Resource aggregation for task-based Cholesky Factorization on top of modern architectures
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01409965/file/submission.pdf BibTex

2015

Journal articles

titre
Mixing LU and QR factorization algorithms to design high-performance dense linear algebra solvers
auteur
Mathieu Faverge, Julien Herrmann, Julien Langou, Bradley Lowery, Yves Robert, Jack Dongarra
article
Journal of Parallel and Distributed Computing, 2015, IPDPS 2014 Selected Papers on Numerical and Combinatorial Algorithms, 85, pp.15. ⟨10.1016/j.jpdc.2015.06.007⟩
Accès au bibtex
BibTex
titre
Time-domain BEM for the wave equation on distributed-heterogeneous architectures: A blocking approach
auteur
Bérenger Bramas, Olivier Coulaud, Guillaume Sylvand
article
Parallel Computing, 2015, 49, pp.66-82. ⟨10.1016/j.parco.2015.07.005⟩
Accès au bibtex
BibTex
titre
Passage à l’Échelle Mémoire et Impact des Allocations Dynamiques dans l’Application GYSELA
auteur
Fabien Rozar
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2015, Parallélisme, Architecture et Systèmes, 34 (1-2), pp.125-152. ⟨10.3166/tsi.34.125-152⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01176700/file/article.pdf BibTex
titre
Pangolin v1.0, a conservative 2-D advection model towards large-scale parallel calculation
auteur
Alexis Praga, Daniel Cariolle, Luc Giraud
article
Geoscientific Model Development, 2015, 8, pp.205 – 220. ⟨10.5194/gmd-8-205-2015⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01117048/file/gmd-8-205-2015.pdf BibTex
titre
Spectral recycling strategies for the solution of nonlinear eigenproblems in thermoacoustics
auteur
Pablo Salas, Luc Giraud, Yousef Saad, Stéphane Moreau
article
Numerical Linear Algebra with Applications, 2015, 22 (6), pp.1039-1058. ⟨10.1002/nla.1995⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01238263/file/paper.pdf BibTex
titre
Gyroaverage operator for a polar mesh
auteur
Christophe Steiner, Michel Mehrenberger, Nicolas Crouseilles, Virginie Grandgirard, Guillaume Latu, Fabien Rozar
article
The European Physical Journal D : Atomic, molecular, optical and plasma physics, 2015, 69 (1), pp.221. ⟨10.1140/epjd/e2014-50211-7⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01090681/file/gyromoyenne_vlasovia13.pdf BibTex

Conference papers

titre
Task-based multifrontal QR solver for GPU-accelerated multicore architectures
auteur
Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Florent Lopez
article
22rd IEEE International Conference on High Performance Computing (HiPC 2015), Dec 2015, Bangalore, India. ⟨10.1109/HiPC.2015.27⟩
Accès au bibtex
BibTex
titre
On the resilience of parallel sparse hybrid solvers
auteur
Emmanuel Agullo, Luc Giraud, Mawussi Zounon
article
HiPC 2015 – IEEE International Conference on High Performance Computing, Dec 2015, Bangalore, India
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01256316/file/Paper_HiPC.pdf BibTex
titre
Fast and Accurate Simulation of Multithreaded Sparse Linear Algebra Solvers
auteur
Luka Stanisic, Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Arnaud Legrand, Florent Lopez, Brice Videau
article
The 21st IEEE International Conference on Parallel and Distributed Systems, Dec 2015, Melbourne, Australia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01180272/file/QRMSTARSG_article.pdf BibTex
titre
Portable task-based programming for Seismic Imaging
auteur
Lionel Boillot, George Bosilca, Emmanuel Agullo, Henri Calandra
article
MATHIAS – TOTAL Symposium on Mathematics, Oct 2015, Paris, France
Accès au bibtex
BibTex
titre
Hierarchical Randomized Low-Rank Approximations
auteur
Pierre Blanchard, Olivier Coulaud, E Darve, B Bramas
article
SIAM Conference on Applied Linear Algebra (SIAM LA), SIAM, Oct 2015, Atlanta, United States
Accès au bibtex
BibTex
titre
Comparison of Static and Dynamic Resource Allocation Strategies for Matrix Multiplication
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Abdou Guermouche, Thomas Lambert
article
26th IEEE International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), 2015, Oct 2015, Florianopolis, Brazil
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01163936/file/PID3840069%20%281%29.pdf BibTex
titre
Portable task-based programming for seismic wave propagation simulation in time domain
auteur
Emmanuel Agullo, Hélène Barucq, Lionel Boillot, George Bosilca, Henri Calandra, Julien Diaz
article
HOSCAR – 5th Brazil-French workshop on High performance cOmputing and SCientific dAta management dRiven by highly demanding applications (INRIA-CNPq), Sep 2015, Sophia Antipolis, France
Accès au bibtex
BibTex
titre
Efficient basis selection for the computation of vibrational spectrum
auteur
Romain Garnier, Vincent Le Bris, Marc Odunlami, Didier Bégué, Isabelle Baraille, Olivier Coulaud
article
10th European Conference on Computational Chemistry, Aug 2015, Fulda, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-01200748/file/Abstract_Romain_Garnier.pdf BibTex
titre
Towards a recursive graph bipartitioning algorithm for well balanced domain decomposition
auteur
Astrid Casadei, Pierre Ramet, Jean Roman
article
Mini-Symposium on “Combinatorial Issues in Sparse Matrix Computation” at ICIAM’15 conference, Aug 2015, Beijing, China
Accès au bibtex
BibTex
titre
On the design of parallel linear solvers for large scale problems
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet
article
Mini-Symposium on Recent advances in matrix computations for extreme-scale computers at ICIAM’15 conference, Aug 2015, Beijing, China
Accès au bibtex
BibTex
titre
Graph Operators for Coupling-aware Graph Partitioning Algorithms
auteur
Maria Predari, Aurélien Esnard
article
CIMI Workshop on Innovative clustering methods for large graphs and block methods, Jul 2015, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01203006/file/CIMI15Predari.pdf BibTex
titre
MPMD parallelization of an aerodynamic code with bodies in relative motion
auteur
Jean-Marie Couteyen, Jean Roman, Pierre Brenner
article
2nd International Workshop on High Performance Computing Simulation in Energy/Transport Domains (HPCSET 2015), Jul 2015, Frankfurt, Germany
Accès au bibtex
BibTex
titre
Optimisation of the variational method for vibrational Hamiltonian eigenvalues computation
auteur
Romain Garnier, Vincent Le Bris, Didier Bégué, Olivier Coulaud, Isabelle Baraille, Marc Odunlami
article
59th Souriau Colloquium: Colloque International de Théories Variationnelles, Jun 2015, Seignosse, France
Accès au texte intégral et bibtex
https://hal.science/hal-01179654/file/Resume_RG%20Souriau_2015.pdf BibTex
titre
Blocking strategy optimizations for sparse direct linear solver on heterogeneous architectures
auteur
Mathieu Faverge, Grégoire Pichon, Pierre Ramet, Jean Roman
article
Sparse Days, Jun 2015, Saint Girons, France
Accès au bibtex
BibTex
titre
H-Matrix Solver for FEM/BEM
auteur
Emmanuel Agullo, Aurélien Falco, Luc Giraud, Benoît Lizé, Guillaume Sylvand
article
CIMI Workshop on Fast Direct Solvers, Jun 2015, Toulouse, France
Accès au bibtex
BibTex
titre
H-matrix techniques for parallel hybrid solvers
auteur
Emmanuel Agullo, Eric Darve, Yuval Harness, Luc Giraud
article
CIMI Workshop on Fast Direct Solvers, Jun 2015, Toulouse, France
Accès au bibtex
BibTex
titre
On the use of H-Matrix Arithmetic in PaStiX: a Preliminary Study
auteur
Mathieu Faverge, Grégoire Pichon, Pierre Ramet, Jean Roman
article
Workshop on Fast Direct Solvers, Jun 2015, Toulouse, France
Accès au bibtex
BibTex
titre
On Resiliency in Krylov Solvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Emrullah Fatih Yetkin, Mawussi Zounon
article
PACS’15: Plateform for Advanced Scientific Computing Conference, Jun 2015, Zurich, Switzerland
Accès au bibtex
BibTex
titre
Hierarchical DAG Scheduling for Hybrid Distributed Systems
auteur
Wei Wu, Aurelien Bouteiller, George Bosilca, Mathieu Faverge, Jack Dongarra
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2015), May 2015, Hyderabad, India
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01078359/file/recursive.pdf BibTex
titre
3D Cartesian Transport Sweep for Massively Parallel Architectures with PARSEC
auteur
Salli Moustafa, Mathieu Faverge, Laurent Plagne, Pierre Ramet
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2015), May 2015, Hyderabad, India. pp.581-590, ⟨10.1109/IPDPS.2015.75⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01078362/file/ipdps15_submitted.pdf BibTex
titre
Divide and Conquer Symmetric Tridiagonal Eigensolver for Multicore Architectures
auteur
Grégoire Pichon, Azzam Haidar, Mathieu Faverge, Jakub Kurzak
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2015), May 2015, Hyderabad, India
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01078356/file/dnc_final.pdf BibTex
titre
Bridging the Gap between Performance and Bounds of Cholesky Factorization on Heterogeneous Platforms
auteur
Emmanuel Agullo, Olivier Beaumont, Lionel Eyraud-Dubois, Julien Herrmann, Suraj Kumar, Loris Marchal, Samuel Thibault
article
Heterogeneity in Computing Workshop 2015, May 2015, Hyderabad, India. ⟨10.1109/IPDPSW.2015.35⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01120507/file/Camera_ready.pdf BibTex
titre
Communication Avoiding and Hiding in preconditioned Krylov solvers
auteur
Bram Reps, Ghysels Pieter, Karl Meerbergen, Emmanuel Agullo, Emrullah Fatih Yetkin, Luc Giraud, Wim Vanroose
article
High Performance Computing in Science and Engineering: HPCSE’15, IT4Innovations National Supercomputing Center VSB-Technical University of Ostrava, Czech Republic, May 2015, Karolinka, Czech Republic
Accès au bibtex
BibTex
titre
Task-based parallelization of a CFD code over a Runtime System
auteur
Jean-Marie Couteyen, Jean Roman, Pierre Brenner
article
27th International Conference on Parallel Computational Fluid Dynamics, May 2015, Montreal, Canada
Accès au bibtex
BibTex
titre
On Numerical Resiliency in Numerical Linear Algebra Solvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Emrullah Fatih Yetkin, Mawussi Zounon
article
Salishan Conference on High-Speed Computing, DOE laboratories, Apr 2015, Salishan, United States
Accès au bibtex
BibTex
titre
Data sparse techniques for parallel hybrid solvers
auteur
Emmanuel Agullo, Eric Darve, Luc Giraud, Yuval Harness
article
SIAM Conference on Applied Linear Algebra (SIAM LA 2015), Apr 2015, Atlanta, United States
Accès au bibtex
BibTex
titre
ScalFMM: A Generic Parallel Fast Multipole Library
auteur
Pierre Blanchard, Bérenger Bramas, Olivier Coulaud, Eric Darve, Laurent Dupuy, Arnaud Etcheverry, Guillaume Sylvand
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2015), Mar 2015, Salt Lake City, United States
Accès au bibtex
BibTex
titre
Reliability of Checksum based Detection for Soft Errors in Conjugate Gradient Variants
auteur
Emmanuel Agullo, Luc Giraud, Emrullah Fatih Yetkin
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2015), Mar 2015, Salt Lake city, Utah, United States
Accès au bibtex
BibTex
titre
A task-based sparse direct solver suited for large scale hierarchical/heterogeneous architectures
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2015), Mar 2015, Salt Lake City, United States
Accès au bibtex
BibTex
titre
Towards a recursive graph bipartitioning algorithm for well balanced domain decomposition
auteur
Astrid Casadei, Pierre Ramet, Jean Roman
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2015), Mar 2015, Salt Lake City, United States
Accès au bibtex
BibTex
titre
Task-Based Parallelization of the Fast Multipole Method on NVIDIA GPUs and Multicore Processors
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2015), Mar 2015, Salt Lake City, United States
Accès au bibtex
BibTex
titre
Portable task-based programming for elastodynamics
auteur
Lionel Boillot, Emmanuel Agullo, George Bosilca, Henri Calandra, Hélène Barucq, Julien Diaz
article
Rice – Oil & Gas HPC Workshop, Mar 2015, Houston, United States
Accès au bibtex
BibTex
titre
Scheduling Trees of Malleable Tasks for Sparse Linear Algebra
auteur
Abdou Guermouche, Loris Marchal, Bertrand Simon, Frédéric Vivien
article
International European Conference on Parallel and Distributed Computing (Euro-Par 2015), 2015, Vienna, Austria. pp.479-490, ⟨10.1007/978-3-662-48096-0_37⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01160104/file/europar.pdf BibTex

Poster communications

titre
New graph partitioning techniques for load balancing of coupled simulation
auteur
Maria Predari, Aurélien Esnard
article
womENcourage 2015, Sep 2015, Uppsala University,Uppsala, Sweden
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01258036/file/finalposter.pdf BibTex
titre
FLUSEPA – a Navier-Stokes Solver for Unsteady Problems with Bodies in Relative Motion : Toward a Task-Based Parallel Version over a Runtime System
auteur
Jm Couteyen Carpaye, Jean Roman, P Brenner
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2015), Mar 2015, Salt Lake City, United States. 2015
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01255440/file/SIAM%20CSE.pdf BibTex

Reports

titre
Fast hierarchical algorithms for generating Gaussian random fields
auteur
Pierre Blanchard, Olivier Coulaud, Eric Darve
article
[Research Report] 8811, Inria Bordeaux Sud-Ouest. 2015
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01228519/file/RR-8811.pdf BibTex
titre
Task-based multifrontal QR solver for GPU-accelerated multicore architectures
auteur
Emmanuel Agullo, Alfredo Buttari, Abdou Guermouche, Florent Lopez
article
[Research Report] IRI/RT–2015–02–FR-r1, IRIT, Toulouse. 2015
Accès au texte intégral et bibtex
https://hal.science/hal-01166312/file/IRI-RT--2015--02--FR-r1.pdf BibTex
titre
Interpolation-restart strategies for resilient eigensolvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Mawussi Zounon
article
[Research Report] 8625, INRIA Bordeaux. 2015
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01201748/file/RR-VP.pdf BibTex
titre
On the resilience of a parallel sparse hybrid solver
auteur
Emmanuel Agullo, Luc Giraud, Mawussi Zounon
article
[Research Report] RR-8744, INRIA Bordeaux; INRIA. 2015
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01165186/file/RR-8744.pdf BibTex
titre
Simul’Elec and PASTIX interface specifications
auteur
Maher Alaya, Mathieu Faverge, Xavier Lacoste, Alexandre Péré-Laperne, Jacques Péré-Laperne, Pierre Ramet, Theophile Terraz
article
[Rapport Technique] RT-0458, INRIA Bordeaux; AlgoTech; INRIA. 2015
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01142204/file/RT-458.pdf BibTex

Theses

titre
Massively Parallel Cartesian Discrete Ordinates Method for Neutron Transport Simulation
auteur
Salli Moustafa
article
Other [cs.OH]. Université de Bordeaux, 2015. English. ⟨NNT : 2015BORD0408⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01379686/file/MOUSTAFA_SALLI_2015.pdf BibTex
titre
On the design of sparse hybrid linear solvers for modern parallel architectures
auteur
Stojce Nakov
article
Other [cs.OH]. Université de Bordeaux, 2015. English. ⟨NNT : 2015BORD0298⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01304315/file/NAKOV_STOJCE_2015.pdf BibTex
titre
Hybrid parallelism on large scale dislocation dynamic simulation
auteur
Arnaud Etcheverry
article
Autre [cs.OH]. Université de Bordeaux, 2015. Français. ⟨NNT : 2015BORD0263⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01270746/file/ETCHEVERRY_ARNAUD_2015.pdf BibTex
titre
Towards highly scalable parallel simulations for turbulent plasma physics
auteur
Fabien Rozar
article
Modélisation et simulation. Université de Bordeaux, 2015. Français. ⟨NNT : 2015BORD0211⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01271032/file/ROZAR_FABIEN_2015.pdf BibTex
titre
Optimizations of hybrid sparse linear solvers relying on Schur complement and domain decomposition approaches
auteur
Astrid Casadei
article
Autre [cs.OH]. Université de Bordeaux, 2015. Français. ⟨NNT : 2015BORD0186⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01228520/file/CASADEI_ASTRID_2015.pdf BibTex
titre
On numerical resilience in linear algebra
auteur
Mawussi Zounon
article
Numerical Analysis [cs.NA]. Université de Bordeaux, 2015. English. ⟨NNT : 2015BORD0038⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01231838/file/ZOUNON_MAWUSSI_2015.pdf BibTex
titre
Scheduling and memory optimizations for sparse direct solver on multi-core/multi-gpu duster systems
auteur
Xavier Lacoste
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2015. English. ⟨NNT : 2015BORD0016⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01222565/file/LACOSTE_XAVIER_2015.pdf BibTex
titre
A large-scale atmospheric chemistry-transport model for massively parallel architectures
auteur
Alexis Praga
article
Computer Science [cs]. Université Toulouse III – Paul Sabatier, 2015. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01178394/file/manuscript_praga.pdf BibTex

2014

Journal articles

titre
Toward memory scalability of GYSELA code for extreme scale computers
auteur
Fabien Rozar, Guillaume Latu, Jean Roman, Virginie Grandgirard
article
Concurrency and Computation: Practice and Experience, 2014, Special issue for PPAM2013 Conference, 27 (4), pp.994-1009. ⟨10.1002/cpe.3429⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01111720/file/CP129.pdf BibTex
titre
Block GMRES method with inexact breakdowns and deflated restarting
auteur
Emmanuel Agullo, Luc Giraud, Yan-Fei Jing
article
SIAM Journal on Matrix Analysis and Applications, 2014, 35 (4), pp.1625-1651. ⟨10.1137/140961912⟩
Accès au bibtex
BibTex
titre
Shared Memory Parallelism for 3D Cartesian Discrete Ordinates Solver
auteur
Salli Moustafa, Ivan Dutka Malen, Laurent Plagne, Angélique Ponçot, Pierre Ramet
article
Annals of Nuclear Energy, 2014, Special Issue SNA+MC 2013, pp.1-10. ⟨10.1016/j.anucene.2014.08.034⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00986975/file/SNA.pdf BibTex
titre
A Survey of Recent Developments in Parallel Implementations of Gaussian Elimination
auteur
Simplice Donfack, Jack Dongarra, Mathieu Faverge, Mark Gates, Jakub Kurzak, Piotr Luszczek, Ichitaro Yamazaki
article
Concurrency and Computation: Practice and Experience, 2014, 27 (5), pp.1292-1309. ⟨10.1002/cpe.3306⟩
Accès au bibtex
BibTex
titre
A Parallel Full Geometric Multigrid Solver for Time Harmonic Maxwell Problems
auteur
Mathieu Chanaud, Luc Giraud, David Goudin, Jean-Jacques Pesqué, Jean Roman
article
SIAM Journal on Scientific Computing, 2014, 36 (2), pp.C119-C138. ⟨10.1137/130909512⟩
Accès au bibtex
BibTex
titre
Composing multiple StarPU applications over heterogeneous machines: A supervised approach
auteur
Andra Hugo, Abdou Guermouche, Pierre-André Wacrenier, Raymond Namyst
article
International Journal of High Performance Computing Applications, 2014, 28, pp.285 – 300. ⟨10.1177/1094342014527575⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01101045/file/article.pdf BibTex
titre
An analytical model for azimuthal thermo-acoustic modes in annular chamber fed by an annular plenum
auteur
Michael Bauerheim, Jean-François Parmentier, Pablo Salas, Franck Nicoud, Thierry Poinsot
article
Combustion and Flame, 2014, 161 (5), pp.1374 – 1389. ⟨10.1016/j.combustflame.2013.11.014⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00969565/file/paper.pdf BibTex
titre
Task-Based FMM for Multicore Architectures
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
SIAM Journal on Scientific Computing, 2014, 36 (1), pp.66-93. ⟨10.1137/130915662⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00911856/file/sisc-cpu.pdf BibTex

Conference papers

titre
Coupling-Aware Graph Partitioning Algorithms: Preliminary Study
auteur
Maria Predari, Aurélien Esnard
article
IEEE International Conference on High Performance Computing (HiPC 2014), Dec 2014, Goa, India. ⟨10.1109/HiPC.2014.7116879⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01069578/file/hipc-final.pdf BibTex
titre
An improved recursive graph bipartitioning algorithm for well balanced domain decomposition
auteur
Astrid Casadei, Pierre Ramet, Jean Roman
article
IEEE International Conference on High Performance Computing (HiPC 2014), Dec 2014, Goa, India. pp.1-10, ⟨10.1109/HiPC.2014.7116878⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01100962/file/article.pdf BibTex
titre
Some progresses in parallel numerical linear algebra toward extreme scale
auteur
Luc Giraud
article
Séminaire : Mesocentre de calcul de l’Ecole Centrale Paris (Session sur les méthodes de résolution des sytèmes linéaires), Ecole Centrale Paris, Dec 2014, Paris, France
Accès au bibtex
BibTex
titre
Portable Task-based programming for seismic imaging
auteur
Lionel Boillot, George Bosilca, Emmanuel Agullo, Henri Calandra
article
MATHIAS – TOTAL Symposium on Mathematics, Oct 2014, Paris, France
Accès au bibtex
BibTex
titre
OptiDis: a MPI/OpenMP Dislocation Dynamics Code for Large Scale Simulations
auteur
Etcheverry Arnaud, Blanchard Pierre, Dupuy Laurent, Olivier Coulaud
article
The 7th MMM International Conference on Multiscale Materials Modeling, Oct 2014, Berkeley, United States
Accès au bibtex
BibTex
titre
A runtime approach to dynamic resource allocation for sparse direct solvers
auteur
A.-E Hugo, A Guermouche, P.-A Wacrenier, R Namyst
article
43rd International Conference on Parallel Processing, Sep 2014, Minneapolis, United States. ⟨10.1109/ICPP.2014.57⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01101054/file/AHugo.pdf BibTex
titre
Time-Domain BEM for the Wave Equation: Optimization and Hybrid Parallelization
auteur
Bérenger Bramas, Olivier Coulaud, Guillaume Sylvand
article
International European Conference on Parallel and Distributed Computing (Euro-Par 2014), Aug 2014, Porto, Portugal. pp.511-523, ⟨10.1007/978-3-319-09873-9_43⟩
Accès au bibtex
BibTex
titre
Task-based programming for Seismic Imaging: Preliminary Results
auteur
Lionel Boillot, George Bosilca, Emmanuel Agullo, Henri Calandra
article
IEEE 16th International Conference on High Performance Computing and Communications (HPCC), Aug 2014, Paris, France. pp.1259-1266, ⟨10.1109/HPCC.2014.205⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01057580/file/BOILLOT_IEEE_HPCCC.pdf BibTex
titre
Parallel 3D Sweep Kernel with PARSEC
auteur
Salli Moustafa, Mathieu Faverge, Laurent Plagne, Pierre Ramet
article
HPCC Workshop on HPC-CFD in Energy/Transport Domains, Aug 2014, Paris, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01078364/file/main.pdf BibTex
titre
High scalability in Dislocation Dynamics simulations
auteur
Arnaud Etcheverry, Olivier Coulaud
article
World Congress on Computational Mechanics, Jul 2014, Barcelona, Spain
Accès au bibtex
BibTex
titre
An approach to increase reliability of hpc simulation, application to the GYSELA5D Code
auteur
Julien Bigot, Guillaume Latu, Thomas Cartier-Michaud, Virginie Grandgirard, Chantal Passeron, Fabien Rozar
article
ESAIM: Proceedings and Surveys, Jul 2014, CIRM – Centre International de Rencontres Mathématiques, Marseille, France. pp.191-210, ⟨10.1051/proc/201653015⟩
Accès au texte intégral et bibtex
https://cea.hal.science/cea-01305504/file/proc165315.pdf BibTex
titre
Nested dissection with balanced halo
auteur
Astrid Casadei, Pierre Ramet, Jean Roman
article
Sixth SIAM Workshop on Combinatorial Scientific Computing, Jul 2014, Lyon, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00987099/file/csc14.pdf BibTex
titre
Toward parallel scalable linear solvers suited for large scale hierarchical parallel platforms
auteur
Emmanuel Agullo, Mathieu Faverge, Luc Giraud, Abdou Guermouche, Pierre Ramet, Jean Roman
article
World Congress on Computational Mechanics, Jul 2014, Barcelona, Spain
Accès au bibtex
BibTex
titre
Preliminary Investigations on Resilient Parallel Numerical Linear Algebra Solvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Emrullah Fatih Yetkin, Mawussi Zounon
article
SIAM Workshop on Exascale Applied Mathematics Challenges and Opportunities, Jul 2014, Chicago, United States
Accès au bibtex
BibTex
titre
Some Progresses on Krylov Linear Solvers: Block-variants and Resiliency
auteur
Emmanuel Agullo, Luc Giraud, Yan-Fei Jing, Pablo Salas, Emrullah Fatih Yetkin, Mawussi Zounon
article
Argonne Mathematics and Computer Science Seminar, Jul 2014, Lemont, United States
Accès au bibtex
BibTex
titre
Recover-Restart Strategies for Resilient Parallel Numerical Linear Algebra Solvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Mawussi Zounon
article
International Workshop on Parallel Matrix Algorithms and Applications (PMAA 2014), Jul 2014, Lugano, Switzerland
Accès au bibtex
BibTex
titre
Harnessing clusters of hybrid nodes with a sequential task-based programming model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
International Workshop on Parallel Matrix Algorithms and Applications (PMAA 2014), Jul 2014, Lugano, Switzerland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01283949/file/pmaa14.pdf BibTex
titre
New Computational Ordering to Reach High Performance in the Time-domain BEM for the Wave Equation
auteur
Bérenger Bramas, Olivier Coulaud, Guillaume Sylvand
article
Sparse Days, Jun 2014, Toulouse, France
Accès au bibtex
BibTex
titre
Recover-Restart Strategies for Resilient Parallel Numerical Linear Algebra Solvers
auteur
Emmanuel Agullo, Luc Giraud, Pablo Salas, Mawussi Zounon
article
Householder Symposium XIX, Jun 2014, Spa, Belgium
Accès au bibtex
BibTex
titre
Designing LU-QR hybrid solvers for performance and stability
auteur
Mathieu Faverge, Julien Herrmann, Julien Langou, Bradley Lowery, Yves Robert, Jack Dongarra
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2014), May 2014, Phoenix, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00930238/file/luqr-arxiv.pdf BibTex
titre
Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet, Samuel Thibault, George Bosilca
article
HCW’2014 workshop of IPDPS, May 2014, Phoenix, United States. pp.29-38, ⟨10.1109/IPDPSW.2014.9⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00987094/file/sparsegpus.pdf BibTex
titre
Amélioration de la Scalabilité Mémoire du code GYSELA
auteur
Fabien Rozar
article
ComPAS, Apr 2014, Neuchâtel, Suisse
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01111722/file/article.pdf BibTex
titre
Parallel hybrid linear solvers
auteur
Luc Giraud
article
4ème Ecole Thématique de Simulation Numérique, CEA, Apr 2014, Porquerolles, France
Accès au bibtex
BibTex
titre
Overview of Distributed Linear Algebra on Hybrid Nodes over the StarPU Runtime
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2014), Feb 2014, Portland, Oregon, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00978602/file/siampp14.pdf BibTex
titre
Recovery-Restart Techniques for Resilient Krylov Methods
auteur
Emmanuel Agullo, Luc Giraud, Salas Pablo, Mawussi Zounon
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2014), Feb 2014, Portland, United States
Accès au bibtex
BibTex

Poster communications

titre
OptiDis: Toward fast anisotropic dislocation dynamics based on Stroh formalism
auteur
Pierre Blanchard, Arnaud Etcheverry, Olivier Coulaud, Laurent Dupuy, Marc Bletry
article
International Workshop on dislocation dynamics simulations, Dec 2014, Saclay, France
Accès au texte intégral et bibtex
https://hal.science/hal-01095322/file/posterInternationalWorkshopOnDD14.pdf BibTex
titre
OptiDis: A parallel Fast Multipole Dislocation Dynamics code
auteur
Pierre Blanchard, Arnaud Etcheverry, Olivier Coulaud, Laurent Dupuy, Marc Bletry, Eric Darve
article
7th International Conference on Multiscale Materials Modeling, Oct 2014, Berkeley, United States
Accès au texte intégral et bibtex
https://hal.science/hal-01095274/file/posterMMM14.pdf BibTex

Reports

titre
Adaptive mesh refinement for numerical simulation of MHD instabilities in tokamaks: JOREK code
auteur
Hocine Sellama, Guido Huijsmans, Pierre Ramet
article
[Research Report] RR-8635, INRIA Bordeaux; INRIA. 2014, pp.18
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01088094/file/RR-8635.pdf BibTex
titre
Scheduling Trees of Malleable Tasks for Sparse Linear Algebra
auteur
Abdou Guermouche, Loris Marchal, Bertrand Simon, Frédéric Vivien
article
[Research Report] 8616, ENS Lyon. 2014
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01077413/file/RR-8616.pdf BibTex
titre
Time-Domain BEM for the Wave Equation on Distributed-Heterogenous Architectures : a Blocking Approach
auteur
Bérenger Bramas, Olivier Coulaud, Guillaume Sylvand
article
[Research Report] RR-8604, Inria Bordeaux Sud-Ouest; INRIA. 2014
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01070069/file/RR-8604.pdf BibTex
titre
An improved recursive graph bipartitioning algorithm for well balanced domain decomposition
auteur
Astrid Casadei, Pierre Ramet, Jean Roman
article
[Research Report] RR-8582, INRIA. 2014, pp.29
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01056749/file/RR-8582.pdf BibTex
titre
Spectral recycling strategies for the solution of nonlinear eigenproblems in thermoacoustics
auteur
Pablo Salas, Luc Giraud, Yousef Saad, Stéphane Moreau
article
[Research Report] RR-8542, INRIA. 2014, pp.23
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00996601/file/RR-8542.pdf BibTex
titre
Task-based FMM for heterogeneous architectures
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
[Research Report] RR-8513, Inria. 2014, pp.29
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00974674/file/RR-8513.pdf BibTex
titre
Amélioration du comportement numérique des solveurs en prenant en compte les poids de la matrice lors de la décomposition de domaines
auteur
Sébastien Fourestier, François Pellegrini, Pierre Ramet
article
[Rapport Technique] RT-0445, INRIA. 2014, pp.58
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00967676/file/RT-445.pdf BibTex
titre
Block GMRES method with inexact breakdowns and deflated restarting
auteur
Emmanuel Agullo, Luc Giraud, Yan-Fei Jing
article
[Research Report] RR-8503, INRIA. 2014, pp.31
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00963704/file/RR-8503.pdf BibTex
titre
Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet, Samuel Thibault, George Bosilca
article
[Research Report] RR-8446, INRIA. 2014, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00925017/file/RR-8446.pdf BibTex

Theses

titre
Composability of parallel codes on heterogeneous architectures
auteur
Andra-Ecaterina Hugo
article
Computer science. Université de Bordeaux, 2014. English. ⟨NNT : 2014BORD0373⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01162975/file/HUGO_ANDRA_2014.pdf BibTex
titre
Spatio-temporal refinement using a discontinuous Galerkin approach for elastodynamic in a high performance computing framework
auteur
Yohann Dudouit
article
General Mathematics [math.GM]. Université de Bordeaux, 2014. English. ⟨NNT : 2014BORD0248⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01332446/file/DUDOUIT_YOHANN_2014.pdf BibTex

2013

Journal articles

titre
PaRSEC: A programming paradigm exploiting heterogeneity for enhancing scalability
auteur
George Bosilca, Aurélien Bouteiller, Anthony Danalis, Mathieu Faverge, Thomas Hérault, Jack Dongarra
article
Computing in Science and Engineering, 2013, 15 (6), pp.36-45. ⟨10.1109/MCSE.2013.98⟩
Accès au bibtex
BibTex
titre
Achieving Numerical Accuracy and High Performance using Recursive Tile LU Factorization
auteur
Jack J. Dongarra, Mathieu Faverge, Hatem Ltaief, Piotr Luszczek
article
Concurrency and Computation: Practice and Experience, 2013, 26 (6), pp.1408-1431. ⟨10.1002/cpe.3110⟩
Accès au bibtex
BibTex
titre
A Modified Block Flexible GMRES Method with Deflation at Each Iteration for the Solution of Non-Hermitian Linear Systems with Multiple Right-Hand Sides
auteur
Henri Calandra, Serge Gratton, Rafael Lago, Xavier Vasseur, Luiz Mariano Carvalho
article
SIAM Journal on Scientific Computing, 2013, 35 (5), pp.S345-S367. ⟨10.1137/120883037⟩
Accès au bibtex
BibTex
titre
Hierarchical QR factorization algorithms for multi-core clusters
auteur
Jack Dongarra, Mathieu Faverge, Thomas Hérault, Mathias Jacquelin, Julien Langou, Yves Robert
article
Parallel Computing, 2013, 39 (4-5), pp.212-232. ⟨10.1016/j.parco.2013.01.003⟩
Accès au bibtex
BibTex

Conference papers

titre
Shared Memory Parallelism for 3D Cartesian Discrete Ordinates Solver
auteur
Salli Moustafa, Ivan Dutka Malen, Laurent Plagne, Angélique Ponçot, Pierre Ramet
article
Joint International Conference on Supercomputing in Nuclear Applications and Monte Carlo 2013, Oct 2013, Paris, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00924989/file/sna-mc13.pdf BibTex
titre
3D Geophysics over a runtime system on a ccNUMA machine
auteur
Lionel Boillot, Emmanuel Agullo, George Bosilca, Henri Calandra
article
MATHIAS – TOTAL Symposium on Mathematics, Oct 2013, Paris, France
Accès au bibtex
BibTex
titre
Graph Repartitioning with both Dynamic Load and Dynamic Processor Allocation
auteur
Clément Vuchener, Aurélien Esnard
article
International Conference on Parallel Computing – ParCo2013, Sep 2013, München, Germany. pp.243-252, ⟨10.3233/978-1-61499-381-0-243⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00857881/file/article-final-hal.pdf BibTex
titre
Achieving Memory Scalability in the Gysela Code to Fit Exascale Constraints
auteur
Fabien Rozar, Guillaume Latu, Jean Roman
article
PPAM 2017 – 10th International Conference on Parallel Processing and Applied Mathematics, R. Wyrzykowski et al., Sep 2013, Warsaw, Poland. pp.185-195, ⟨10.1007/978-3-642-55195-6_17⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00935519/file/CP129.pdf BibTex
titre
Combining recent HPC techniques for 3D geophysics acceleration
auteur
Lionel Boillot, Emmanuel Agullo, George Bosilca, Henri Calandra
article
2nd ECCOMAS Young Investigators Conference (YIC 2013), Sep 2013, Bordeaux, France
Accès au texte intégral et bibtex
https://hal.science/hal-00855878/file/YIC2013.pdf BibTex
titre
Towards resilient parallel linear Krylov solvers with recover-restart strategies
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman
article
European Numerical Mathematics and Advanced Applications, Aug 2013, Lausanne, Switzerland
Accès au bibtex
BibTex
titre
Implementing a systolic algorithm for QR factorization on multicore clusters with PaRSEC
auteur
Guillaume Aupy, Mathieu Faverge, Yves Robert, Jakub Kurzak, Piotr Luszczek, Jack Dongarra
article
PROPER 2013 – 6th Workshop on Productivity and Performance, Aug 2013, Aachen, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00844492/file/submitted.pdf BibTex
titre
Recent advances in sparse direct solvers
auteur
Emmanuel Agullo, Patrick Amestoy, Alfredo Buttari, Abdou Guermouche, Guillaume Joslin, Jean-Yves L’Excellent, Xiaoye S. Li, Artem Napov, François-Henry Rouet, Wissam M. Sid-Lakhdar, Shen Wang, Clément Weisbecker, Ichitaro Yamazaki
article
22nd International Conference on Structural Mechanics in Reactor Technology (SMiRT 2013), Aug 2013, San Francisco, United States. pp.1-10
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01060301/file/paper3.pdf BibTex
titre
Towards Domain Decomposition with Balanced Halo
auteur
Astrid Casadei, Luc Giraud, Pierre Ramet, Jean Roman
article
Workshop Celebrating 40 Years of Nested Dissection, Jul 2013, Waterloo, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00924977/file/abstract1_HiePACS.pdf BibTex
titre
From hybrid architectures to hybrid solvers
auteur
Pierre Ramet
article
Workshop Celebrating 40 Years of Nested Dissection, Jul 2013, Waterloo, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00924979/file/abstract2_HiePACS.pdf BibTex
titre
Optimized propagators for elastic waves with anisotropy Part 1: Applied Mathematics Part 2: High-Performance Computing
auteur
Lionel Boillot, Emmanuel Agullo, Hélène Barucq, George Bosilca, Henri Calandra, Julien Diaz
article
XSEDE — International Summer School on HPC Challenges in Computational Sciences (PRACE workshop), Jun 2013, New York, United States
Accès au bibtex
BibTex
titre
Towards resilient parallel linear Krylov solvers: recover-restart strategies
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman, Mawussi Zounon
article
Sparse days 2013, CERFACS, Jun 2013, Toulouse, France
Accès au bibtex
BibTex
titre
Work stealing and granularity optimizations for a sparse solver on manycores
auteur
Xavier Lacoste
article
Sparse days 2013, Jun 2013, Toulouse, France
Accès au bibtex
BibTex
titre
Parallel local time-stepping for elastodynamic equations
auteur
Yohann Dudouit, Luc Giraud, Florence Millot, Sebastien Pernet
article
Conference on Mathematical and Computational Issues in the Geosciences, SIAM, Jun 2013, Padua, Italy
Accès au bibtex
BibTex
titre
Algebraic preconditioners for parallel hybrid solvers
auteur
Luc Giraud
article
High Performance Computing in Science and Engineering, May 2013, Ostrava, Czech Republic
Accès au bibtex
BibTex
titre
Composing multiple StarPU applications over heterogeneous machines: a supervised approach
auteur
Andra-Ecaterina Hugo, Abdou Guermouche, Raymond Namyst, Pierre-André Wacrenier
article
Third International Workshop on Accelerators and Hybrid Exascale Systems, May 2013, Boston, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00824514/file/PID2692011.pdf BibTex
titre
Pipelining the CG Solver Over a Runtime System
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Stojce Nakov, Jean Roman
article
GPU Technology Conference, NVIIDA, Mar 2013, San Jose, United States
Accès au bibtex
BibTex
titre
Task-based Parallelization of the Fast Multipole Method on NVIDIA GPUs and Multicore Processors
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
GPU Technology Conference, NVIDIA, Mar 2013, San Jose, California, United States
Accès au bibtex
BibTex
titre
Eigensolvers for thermoacoustics instabilities in combustion chambers
auteur
Luc Giraud, Pablo Salas, Xavier Vasseur
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2013), SIAM, Feb 2013, Boston, United States
Accès au bibtex
BibTex
titre
Linear Algebra Libraries with DAG Runtimes on GPUs
auteur
George Bosilca, Aurélien Bouteiller, Mathieu Faverge, Thomas Hérault
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2013), Feb 2013, Boston, United States
Accès au bibtex
BibTex
titre
Resilience at extreme scale : system level, algorithmic level or both?
auteur
Luc Giraud, Franck Cappello
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2013), Feb 2013, Boston, United States
Accès au bibtex
BibTex
titre
Pipelining the Fast Multipole Method over a Runtime System
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2013), Feb 2013, Boston, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00797403/file/cse.pdf BibTex
titre
Optimizing the Black-box FMM for Smooth and Oscillatory Kernels
auteur
Eric Darve, Matthias Messner, Martin Schanz, Olivier Coulaud
article
SIAM Conference on Computational Science and Engineering (SIAM CSE 2013), Feb 2013, Boston, United States
Accès au bibtex
BibTex

Book sections

titre
Deflation and augmentation techniques in Krylov linear solvers
auteur
Olivier Coulaud, Luc Giraud, Pierre Ramet, Xavier Vasseur
article
Topping, B.H.V and Ivanyi, P. Developments in Parallel – Distributed – Grid and Cloud Computing for Engineering, Saxe-Coburg Publications, pp.249–275, 2013, 978-1-874672-62-3
Accès au bibtex
BibTex

Habilitation à diriger des recherches

titre
Contributions algorithmiques pour les simulations complexes en physique des matériaux
auteur
Olivier Coulaud
article
Calcul parallèle, distribué et partagé [cs.DC]. Université de Bordeaux 1, 2013
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01356725/file/hdr.pdf BibTex

Reports

titre
A Parallel Full Geometric Multigrid Solver for Time Harmonic Maxwell Problems
auteur
Mathieu Chanaud, Luc Giraud, David Goudin, Jean-Jacques Pesqué, Jean Roman
article
[Research Report] RR-8335, INRIA. 2013, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00847966/file/RR8335.pdf BibTex
titre
Towards resilient parallel linear Krylov solvers: recover-restart strategies
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman, Mawussi Zounon
article
[Research Report] RR-8324, INRIA. 2013, pp.36
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00843992/file/RR-8324.pdf BibTex
titre
Task-based FMM for multicore architectures
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
[Research Report] RR-8277, INRIA. 2013, pp.33
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00807368/file/RR-8277.pdf BibTex
titre
Extensions of the Siesta DFT Code for Simulation of Molecules
auteur
Olivier Coulaud, Patrice Bordat, Pierre Fayon, Vincent Le Bris, Isabelle Baraille, Ross Brown
article
[Research Report] RR-8221, INRIA. 2013, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00787088/file/RR-8221.pdf BibTex
titre
Deflation and augmentation techniques in Krylov linear solvers
auteur
Olivier Coulaud, Luc Giraud, Pierre Ramet, Xavier Vasseur
article
[Research Report] RR-8265, INRIA. 2013, 25 p
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00803225/file/RR-8265.pdf BibTex
titre
On Algorithmic Variants of Parallel Gaussian Elimination: Comparison of Implementations in Terms of Performance and Numerical Properties
auteur
Simplice Donfack, Jack Dongarra, Mathieu Faverge, Mark Gates, Jakub Kurzak, Piotr Luszczek, Ichitaro Yamazaki
article
[Research Report] 2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00867837/file/lawn280.pdf BibTex

Theses

titre
Hardware accelerator for seismic imaging: modelling, migration and interpretation
auteur
Rached Abdelkhalek
article
Algorithme et structure de données [cs.DS]. Université Sciences et Technologies – Bordeaux I, 2013. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00936989/file/TheseRachedAbdelkhalek.pdf BibTex
titre
Physical and numerical aspects of thermoacoustic instabilities in annular combustion chambers
auteur
Pablo Salas
article
Numerical Analysis [math.NA]. Université Sciences et Technologies – Bordeaux I, 2013. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00937020/file/Thesis_PabloSALAS.pdf BibTex

2012

Journal articles

titre
Constrained Regional Recovery of Continental Water Mass Time-variations from GRACE-based Geopotential Anomalies over South America
auteur
Guillaume Ramillien, Lucia Seoane, Frédéric Frappart, Richard Biancale, Serge Gratton, Xavier Vasseur, Stéphane Bourgogne
article
Surveys in Geophysics, 2012, 33 (5), pp.887-905. ⟨10.1007/s10712-012-9177-z⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00743877/file/Ramillien_et_al_SurvGeophys_2012_corr.pdf BibTex
titre
Parallel algebraic domain decomposition solver for the solution of augmented systems
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman
article
Advances in Engineering Software, 2012, 60-61, pp.23-30. ⟨10.1016/j.advengsoft.2012.07.004⟩
Accès au bibtex
BibTex
titre
Équilibrage dynamique avec nombre variable de processeurs par une méthode de repartitionnement de graphe
auteur
Clément Vuchener, Aurélien Esnard
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2012, 31 (8-9-10/2012), pp.1251-1271
Accès au texte intégral et bibtex
https://hal.science/hal-00722729/file/tsi.pdf BibTex
titre
A simple analytical model to study and control azimuthal instabilities in annular combustion chambers
auteur
Jean-François Parmentier, Pablo Salas, Pierre Wolf, Gabriel Staffelbach, Franck Nicoud, Thierry Poinsot
article
Combustion and Flame, 2012, 159 (7), pp.2374-2387. ⟨10.1016/j.combustflame.2012.02.007⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00802059/file/parmentier2012.pdf BibTex
titre
Fast seismic modeling and reverse time migration on a graphics processing unit cluster
auteur
Rached Abdelkhalek, Henri Calandra, Olivier Coulaud, Guillaume Latu, Jean Roman
article
Concurrency and Computation: Practice and Experience, 2012, 24 (7), pp.739-750. ⟨10.1002/cpe.1875⟩
Accès au bibtex
BibTex
titre
Parallel Computational Steering for HPC Applications Using HDF5 Files in Distributed Shared Memory
auteur
John Biddiscombe, Jérome Soumagne, Guillaume Oger, David Guibert, Jean-Guillaume Piccinali
article
IEEE Transactions on Visualization and Computer Graphics, 2012, 18 (6), pp.852–864. ⟨10.1109/TVCG.2012.63⟩
Accès au bibtex
BibTex
titre
Flexible Variants of Block Restarted GMRES Methods with Application to Geophysics
auteur
Henri Calandra, Serge Gratton, Julien Langou, Xavier Pinel, Xavier Vasseur
article
SIAM Journal on Scientific Computing, 2012, 3 (2), pp.A714-A736. ⟨10.1137/10082364X⟩
Accès au bibtex
BibTex

Conference papers

titre
Dynamic Load-Balancing with Variable Number of Processors based on Graph Repartitioning
auteur
Clément Vuchener, Aurélien Esnard
article
IEEE International Conference on High Performance Computing (HiPC 2012), Dec 2012, Pune, India. pp.1-9, ⟨10.1109/HiPC.2012.6507501⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00722731/file/hipc-final.pdf BibTex
titre
Physically-based preconditioner for the WCIP
auteur
Nathalie Raveu, Julien Vincent, Jean-René Poirier, Ronan Perrussel, Luc Giraud
article
Asia-Pacific Microwave Conference (APMC 2012), Dec 2012, Kaohsiung, Taiwan. pp. 1310 – 1312, ⟨10.1109/APMC.2012.6421905⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00907360/file/APMC_Vincent2109.pdf BibTex
titre
parallel TDDFT/DFT/MD code for the simulation of organic-inorganic hybrid materials
auteur
Patrice Bordat, Olivier Coulaud, Ross Brown, Isabelle Baraille
article
QUITEL 2012, Dec 2012, Natal, Brazil
Accès au bibtex
BibTex
titre
Parallel TDDFT/DFT/MD code for the simulation of organic-inorganic hybrid materials
auteur
Patrice Bordat, Olivier Coulaud, Ross Brown, Isabelle Baraille
article
CCP5 annual meeting 2012, Sep 2012, Huddersfield, United Kingdom
Accès au bibtex
BibTex
titre
Pipelining the CG Solver Over a Runtime System
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Stojce Nakov, Jean Roman
article
International Workshop on Parallel Matrix Algorithms and Applications (PMAA 2012), Jun 2012, London, United Kingdom
Accès au bibtex
BibTex
titre
Toward a supernodal sparse direct solver over DAG runtimes
auteur
George Bosilca, Mathieu Faverge, Xavier Lacoste, Ichitaro Yamazaki, Pierre Ramet
article
Parallel Matrix Algorithms and Applications, Jun 2012, Londres, United Kingdom
Accès au bibtex
BibTex
titre
Direct methods on GPU-based systems, Preliminary work towards a functioning code
auteur
Alexandre Decollas, Florent Lopez
article
Sparse Days 2012, Jun 2012, Toulouse, France
Accès au bibtex
BibTex
titre
Memory Optimization to Build a Schur Complement
auteur
Astrid Casadei, Pierre Ramet
article
SIAM Conference on Applied Linear Algebra (SIAM LA 2012), Jun 2012, Valence, Spain
Accès au bibtex
BibTex
titre
On a parallel hierarchical algebraic domain decomposition method for a large scale sparse linear solver
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman
article
SIAM Conference on Applied Linear Algebra (SIAM LA 2012), SIAM, Jun 2012, Valencia, Spain
Accès au bibtex
BibTex
titre
Sparse direct solver on top of large-scale multicore systems with GPU accelerators
auteur
Xavier Lacoste, Pierre Ramet
article
SIAM Conference on Applied Linear Algebra (SIAM LA 2012), Jun 2012, Valence, Spain
Accès au bibtex
BibTex
titre
Towards resilient Krylov solvers
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman, Mawussi Zounon
article
SIAM Conference on Applied Linear Algebra (SIAM LA 2012), SIAM, Jun 2012, Valencia, Spain
Accès au bibtex
BibTex
titre
On a hierarchical parallel algebraic domain decomposition linear solver
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Yan-Fei Jing, Stojce Nakov, Jean Roman
article
Aquitaine-Euskadi Workshop on Applied Mathematics, Jun 2012, Bilbao, Spain
Accès au bibtex
BibTex
titre
On a Hierarchical Parallel Algebraic Domain Decomposition Linear Solver
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Stojce Nakov, Jean Roman
article
Scalable Hierarchical Algorithms for eXtreme Computing (SHAX-C) Workshop, Apr 2012, Kaust, Saudi Arabia
Accès au bibtex
BibTex
titre
Robust Memory-Aware Mappings for Parallel Multifrontal Factorizations
auteur
Emmanuel Agullo, Patrick Amestoy, Alfredo Buttari, Abdou Guermouche, Jean-Yves L’Excellent, François-Henry Rouet
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2012), SIAM Activity Group on Supercomputing, Feb 2012, Savannah, Georgia, United States
Accès au bibtex
BibTex
titre
Comparison of two sparse hybrid solvers
auteur
Emmanuel Agullo, Luc Giraud, Azzam Haidar, Matthieu Lecouvez, Xiaoye S. Li, Esmond Ng, Jean Roman, Ichitaro Yamazaki
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2012), SIAM, Feb 2012, Savannah, United States
Accès au bibtex
BibTex
titre
Fine Grain Scheduling for Sparse Solver on Manycore Architectures
auteur
Mathieu Faverge, Pierre Ramet
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2012), Feb 2012, Savannah, United States
Accès au bibtex
BibTex

Books

titre
Proceedings of Euro-Par 2011: Parallel Processing Workshops – CCPI, CGWS, HeteroPar, HiBB, HPCVirt, HPPC, HPSS, MDGS, ProPer, Resilience, UCHPC, VHPC, Bordeaux, France, August 29 – September 2, 2011, Revised Selected Papers, Part II
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Michael Alexander and Pasqua D’Ambra and Adam Belloum and George Bosilca and Mario Cannataro and Marco Danelutto and Beniamino Di Martino and Michael Gerndt and Emmanuel Jeannot and Raymond Namyst and Jean Roman and Stephen L. Scott and Jesper Larsson Trä. Springer, 7156, pp.480, 2012, 978-3-642-29739-7
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011: Parallel Processing Workshops – CCPI, CGWS, HeteroPar, HiBB, HPCVirt, HPPC, HPSS, MDGS, ProPer, Resilience, UCHPC, VHPC, Bordeaux, France, August 29 – September 2, 2011, Revised Selected Papers, Part I
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Michael Alexander and Pasqua D’Ambra and Adam Belloum and George Bosilca and Mario Cannataro and Marco Danelutto and Beniamino Di Martino and Michael Gerndt and Emmanuel Jeannot and Raymond Namyst and Jean Roman and Stephen L. Scott and Jesper Larsson Trä. Springer, 7155, pp.524, 2012, LNCS, 978-3-642-29736-6
Accès au bibtex
BibTex

Reports

titre
Non regression testing for the JOREK code
auteur
Guillaume Latu, Marina Becoulet, Guilhem Dif-Pradalier, Virginie Grandgirard, Matthias Hoelzl, G. Huysmans, Xavier Lacoste, Eric Nardon, Francois Orain, Chantal Passeron, Pierre Ramet, Ahmed Ratnani
article
[Research Report] RR-8134, INRIA. 2012, pp.17
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00752270/file/NRT-jorek.pdf BibTex
titre
Optimized M2L Kernels for the Chebyshev Interpolation based Fast Multipole Method
auteur
Matthias Messner, Bérenger Bramas, Olivier Coulaud, Eric Darve
article
[Research Report] 2012, pp.22
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00746089/file/main.pdf BibTex
titre
Pipelining the Fast Multipole Method over a Runtime System
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, Toru Takahashi
article
[Research Report] RR-7981, INRIA. 2012, pp.24
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00703130/file/RR-7981.pdf BibTex
titre
Dynamic Load-Balancing with Variable Number of Processors based on Graph Repartitioning
auteur
Clément Vuchener, Aurélien Esnard
article
[Research Report] RR-7926, INRIA. 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00687073/file/RR-7926.pdf BibTex
titre
Task-based Conjugate-Gradient for multi-GPUs platforms
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Stojce Nakov, Jean Roman
article
[Research Report] RR-8192, INRIA. 2012, pp.28
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00767368/file/RR-8192.pdf BibTex

Theses

titre
An In-situ Visualization Approach for Parallel Coupling and Steering of Simulations through Distributed Shared Memory Files
auteur
Jérome Soumagne
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université Sciences et Technologies – Bordeaux I, 2012. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00788826/file/thesis_final_soumagne.pdf BibTex

2011

Journal articles

titre
Three-dimensional parallel frequency-domain visco-acoustic wave modelling based on a hybrid direct/iterative solver
auteur
Florent Sourbier, Azzam Haidar, Luc Giraud, Hafedh Ben-Hadj-Ali, Stéphane Operto, Jean Virieux
article
Geophysical Prospecting, 2011, 59 (5), pp.834-856. ⟨10.1111/j.1365-2478.2011.00966.x⟩
Accès au bibtex
BibTex
titre
Parallel hierarchical hybrid linear solvers for emerging computing platforms
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman
article
Comptes rendus de l’Académie des sciences. Série IIb, Mécanique, 2011, High Performance Computing, 339 (2-3), pp.96-103. ⟨10.1016/j.crme.2010.11.005⟩
Accès au bibtex
BibTex
titre
Efficient Parallel Resolution of The Simplified Transport Equations in Mixed-Dual Formulation
auteur
Maxime Barrault, Bruno Lathuilière, Pierre Ramet, Jean Roman
article
Journal of Computational Physics, 2011, 230 (5), pp.2004-2020. ⟨10.1016/j.jcp.2010.11.047⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00547406/file/ddm4spn.pdf BibTex
titre
A Flexible Generalized Conjugate Residual Method with Inner Orthogonalization and Deflated Restarting
auteur
Luiz Mariano Carvalho, Serge Gratton, Rafael Lago, Xavier Vasseur
article
SIAM Journal on Matrix Analysis and Applications, 2011, 32 (4), pp.1212 – 1235. ⟨10.1137/100786253⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00650239/file/CGLV.pdf BibTex
titre
New curvilinear scheme for elastic wave propagation in presence of curved topography
auteur
Issam Tarrass, Luc Giraud, Pierre Thore
article
Geophysical Prospecting, 2011, 59 (5), pp.889–906. ⟨10.1111/j.1365-2478.2011.00972.x⟩
Accès au bibtex
BibTex

Conference papers

titre
Stability of azimuthal modes in annular combustion chambers
auteur
Pablo Salas, Luc Giraud, Jens-Dominik Müller, Gabriel Staffelbach, Thierry Poinsot
article
Third workshop INCA, Nov 2011, Toulouse, France
Accès au bibtex
BibTex
titre
A Fully Empirical Autotuned Dense QR Factorization for Multicore Architectures
auteur
Emmanuel Agullo, Jack Dongarra, Rajib Nath, Stanimire Tomov
article
Euro-Par 2011 Parallel Processing, Aug 2011, Bordeaux, France. pp.194-205
Accès au bibtex
BibTex
titre
LU Factorization for Accelerator-based Systems
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Mathieu Faverge, Julien Langou, Hatem Ltaief, Stanimire Tomov
article
9th ACS/IEEE International Conference on Computer Systems and Applications (AICCSA 11), Jun 2011, Sharm El-Sheikh, Egypt
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00654193/file/plagma_lu.pdf BibTex
titre
Computational Steering and Parallel Online Monitoring Using RMA through the HDF5 DSM Virtual File Driver
auteur
Jérome Soumagne, John Biddiscombe
article
Proceedings of the International Conference on Computational Science, ICCS 2011, Jun 2011, Singapore. pp.479–488, ⟨10.1016/j.procs.2011.04.050⟩
Accès au bibtex
BibTex
titre
QR Factorization on a Multicore Node Enhanced with Multiple GPU Accelerators
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Mathieu Faverge, Hatem Ltaief, Samuel Thibault, Stanimire Tomov
article
25th IEEE International Parallel & Distributed Processing Symposium, May 2011, Anchorage, United States. ⟨10.1109/IPDPS.2011.90⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00547614/file/plagma_qr.pdf BibTex
titre
A Multigrid Method for the Solution of Linear Systems with Multiple Right-Hand Sides
auteur
Xavier Vasseur, Serge Gratton, Xavier Pinel
article
International Conference On Preconditioning Techniques For Scientific And Industrial Applications, May 2011, Bordeaux, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00580794/file/preconditioning2011_submission_9.pdf BibTex
titre
Repartitionnement d’un graphe de M vers N processeurs : application pour l’équilibrage dynamique de charge
auteur
Clément Vuchener, Aurélien Esnard
article
20ème Rencontres francophones du parallélisme (RenPar’20), May 2011, Saint-Malo, France. pp.8
Accès au texte intégral et bibtex
https://hal.science/hal-00648404/file/renpar20.pdf BibTex
titre
Parallel algebraic domain decomposition solver for the solution of augmented systems
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman
article
The Second International Conference on Parallel, Distributed, Grid and Cloud Computing for Engineering, Apr 2011, Ajaccio, France
Accès au bibtex
BibTex
titre
Performance of a sparse hybrid linear solver on a multicore cluster
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Yohan Lee-Tin-Yien, Jean Roman
article
SIAM Conference on Computational Science and Engineering (CSE 2011), Feb 2011, Reno, United States
Accès au bibtex
BibTex
titre
Algebraic Schwarz preconditioning for the Schur complement: application to the time-harmonic Maxwell equations discretized by a discontinuous Galerkin method
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman, Stephane Lanteri
article
The Twentieth International Conference on Domain Decomposition Methods, Feb 2011, San Diego La Jolla, United States
Accès au bibtex
BibTex
titre
Parallel Computational Steering and Analysis for HPC Applications using a ParaView Interface and the HDF5 DSM Virtual File Driver
auteur
John Biddiscombe, Jerome Soumagne, Guillaume Oger, David Guibert, Jean-Guillaume Piccinali
article
Eurographics Symposium on Parallel Graphics and Visualization, 2011, Llandudno, Wales, United Kingdom. pp.91–100, ⟨10.2312/EGPGV/EGPGV11/091-100⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00651814/file/EGPGV11_paper1010_final.pdf BibTex
titre
Data Redistribution using One-sided Transfers to In-memory HDF5 Files
auteur
Jérome Soumagne, John Biddiscombe, Aurélien Esnard
article
Proceedings of the 18th European MPI Users’ Group conference on Recent advances in the message passing interface, 2011, Santorini, Greece. pp.198–207, ⟨10.1007/978-3-642-24449-0_23⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00648396/file/paper_41.pdf BibTex

Book sections

titre
MUMPS
auteur
Patrick Amestoy, Alfredo Buttari, Iain S. Duff, Abdou Guermouche, Jean-Yves L’Excellent, Bora Uçar
article
David Padua. Encyclopedia of Parallel Computing, Springer, pp.1232-1238, 2011, 978-0-387-09766-4. ⟨10.1007/978-0-387-09766-4_204⟩
Accès au bibtex
BibTex
titre
The minimum degree ordering with dynamical constraints
auteur
Patrick Amestoy, Alfredo Buttari, Abdou Guermouche, Jean-Yves L’Excellent, Bora Uçar
article
Markus Beckers; Johannes Lotz; Viktor Mosenkis; Uwe Naumann. Abstracts of the 5th SIAM Workshop on Combinatorial Scientific Computing, SIAM, pp.36-38, 2011, Technical Report
Accès au bibtex
BibTex
titre
The Multifrontal Method
auteur
Patrick Amestoy, Alfredo Buttari, Iain S. Duff, Abdou Guermouche, Jean-Yves L’Excellent, Bora Uçar
article
David Padua. Encyclopedia of Parallel Computing, Springer, pp.1209-1216, 2011, 978-0-387-09765-7. ⟨10.1007/978-0-387-09766-4_86⟩
Accès au bibtex
BibTex

Books

titre
Proceedings of Euro-Par 2011 Parallel Processing – 17th International Conference, Part I
auteur
Emmanuel Jeannot, Jean Roman, Raymond Namyst
article
Emmanuel Jeannot and Raymond Namyst and Jean Roman. Springer, 6852, pp.598, 2011, LNCS, 978-3-642-23399-9. ⟨10.1007/978-3-642-29737-3⟩
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011 Parallel Processing – 17th International Conference, Part II
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Emmanuel Jeannot and Raymond Namyst and Jean Roman. Springer, 6853, pp.488, 2011, LNCS, 978-3-642-23396-8. ⟨10.1007/978-3-642-23397-5⟩
Accès au bibtex
BibTex

Reports

titre
Fully Empirical Autotuned QR Factorization For Multicore Architectures
auteur
Emmanuel Agullo, Jack J. Dongarra, Rajib Nath, Stanimire Tomov
article
[Research Report] RR-7526, INRIA. 2011, pp.22
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00569514/file/rr.pdf BibTex
titre
Parallel algebraic domain decomposition solver for the solution of augmented systems
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman
article
[Research Report] RR-7516, INRIA. 2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00559133/file/RR-7516.pdf BibTex

2010

Journal articles

titre
Flexible GMRES with deflated restarting
auteur
Luc Giraud, Serge Gratton, Xavier Pinel, Xavier Vasseur
article
SIAM Journal on Scientific Computing, 2010, 32 (4), pp.1858–1878. ⟨10.1137/080741847⟩
Accès au bibtex
BibTex
titre
Sparse approximations of the Schur complement for parallel algebraic hybrid linear solvers in 3D
auteur
Luc Giraud, Azzam Haidar, Yousef Saad
article
Numerical Mathematics: Theory, Methods and Applications, 2010, 3 (3), pp.276-294
Accès au bibtex
BibTex
titre
Using multiple levels of parallelism to enhance the performance of domain decomposition solvers
auteur
Luc Giraud, Azzam Haidar, Stéphane Pralet
article
Parallel Computing, 2010, 36 (5-6), pp.285-296. ⟨10.1016/j.parco.2009.12.006⟩
Accès au bibtex
BibTex
titre
Fast construction of the Kohn–Sham response function for molecules
auteur
Peter Koval, Dietrich Foerster, Olivier Coulaud
article
physica status solidi (b), 2010, accepted for publication, 247 (8), pp.1841-1848. ⟨10.1002/pssb.200983811⟩
Accès au bibtex
https://arxiv.org/pdf/0910.3796 BibTex
titre
High-performance BLAS formulation of the adaptive Fast Multipole Method
auteur
Olivier Coulaud, Pierre Fortin, Jean Roman
article
Mathematical and Computer Modelling, 2010, 51 (3-4), pp.177-188. ⟨10.1016/j.mcm.2009.08.039⟩
Accès au bibtex
BibTex
titre
High-performance finite-element simulations of seismic wave propagation in three-dimensional non linear inelastic geological media
auteur
Fabrice Dupros, Florent de Martin, Evelyne Foerster, Dimitri Komatitsch, Jean Roman
article
Parallel Computing, 2010, 36, pp.308-325. ⟨10.1016/j.parco.2009.12.011⟩
Accès au texte intégral et bibtex
https://brgm.hal.science/hal-00537930/file/Dupros_parco_2010_ref6125.pdf BibTex
titre
Reducing the I/O Volume in an Out-of-core Sparse Multifrontal Solver
auteur
Emmanuel Agullo, Abdou Guermouche, Jean-Yves L’Excellent
article
SIAM Journal on Scientific Computing, 2010, 31 (6), pp.4774-4794. ⟨10.1137/080720061⟩
Accès au bibtex
BibTex
titre
A Parallel Iterative Method for Computing Molecular Absorption Spectra
auteur
Peter Koval, Dietrich Foerster, Olivier Coulaud
article
Journal of Chemical Theory and Computation, 2010, 6 (9), pp.2654-2668. ⟨10.1021/ct100280x⟩
Accès au bibtex
https://arxiv.org/pdf/1005.5340 BibTex
titre
QCG-OMPI: MPI Applications on Grids
auteur
Emmanuel Agullo, Camille Coti, Thomas Herault, Julien Langou, Sylvain Peyronnet, Ala Rezmerita, Franck Cappello, Jack Dongarra
article
Future Generation Computer Systems, 2010, ⟨10.1016/j.future.2010.11.015⟩
Accès au bibtex
BibTex

Conference papers

titre
WCIP acceleration
auteur
Nathalie Raveu, Luc Giraud, Henri Baudrand
article
Asia Pacific Microwave Conference, Dec 2010, Yokohama, Japan
Accès au bibtex
BibTex
titre
Solveurs parallèles creux hybrides direct/itératif : application à des simulations 3D
auteur
Emmanuel Agullo, Azzam Haidar, Luc Giraud, Abdou Guermouche, Yohan Lee-Tin-Yien, Jean Roman
article
Workshop Solveurs de systèmes linéaires de grande taille : les avancées récentes, Nov 2010, Lyon, France
Accès au bibtex
BibTex
titre
An HDF5 MPI virtual file driver for parallel in-situ post-processing
auteur
Jérome Soumagne, John Biddiscombe, Jerry Clarke
article
Recent Advances in the Message Passing Interface – 17th European MPI Users’ Group Meeting, EuroMPI 2010, Sep 2010, Stuttgart, Germany. pp.62–71, ⟨10.1007/978-3-642-15646-5_7⟩
Accès au bibtex
BibTex
titre
Dynamically scheduled Cholesky factorization on multicore architectures with GPU accelerators.
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Hatem Ltaief, Raymond Namyst, Jean Roman, Samuel Thibault, Stanimire Tomov
article
Symposium on Application Accelerators in High Performance Computing (SAAHPC), Jul 2010, Knoxville, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00547616/file/saahpc.pdf BibTex
titre
Autotuning dense linear algebra libraries on multicore architectures
auteur
Emmanuel Agullo, Jack Dongarra, Rajib Nath, Stanimire Tomov
article
6th International Workshop on Parallel Matrix Algorithms and Applications (PMAA’10), Jun 2010, Basel, Switzerland
Accès au bibtex
BibTex
titre
Parallel scalability and complexity analysis of sparse hybrid linear solvers
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman
article
6th International Workshop on Parallel Matrix Algorithms and Applications (PMAA’10), Jun 2010, Basel, Switzerland
Accès au bibtex
BibTex
titre
Towards an efficient tile matrix inversion of symmetric positive definite matrices on multicore architectures
auteur
Emmanuel Agullo, Henricus Bouwmeester, Jack Dongarra, Jakub Kurzak, Julien Langou, Lee Rosenberg
article
9th International Meeting on High Performance Computing for Computational Science (VecPar’10), Jun 2010, Berkeley, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00548906/file/vecpar10.pdf BibTex
titre
MaPHyS or the development of a parallel algebraic domain decomposition solver in the course of the solstice project
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman
article
Sparse Days 2010 Meeting at CERFACS, Jun 2010, Toulouse, France
Accès au bibtex
BibTex
titre
Towards a complexity analysis of sparse hybrid linear solvers
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Jean Roman
article
Para 2010 : State of the Art in Scientific and Parallel Computing, Jun 2010, Reykjavík, Iceland
Accès au bibtex
BibTex
titre
Complexity analysis of sparse hybrid linear solvers
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Jean Roman
article
3rd ”Scheduling in Aussois” Workshop, Jun 2010, Aussois, France
Accès au bibtex
BibTex
titre
A First Step to the Evaluation of SimGrid in the Context of a Complex Application
auteur
Abdou Guermouche, Hélène Renard
article
Heterogeneity in Computing Workshop, May 2010, United States. pp.1-10
Accès au bibtex
BibTex
titre
Algebraic parallel domain decomposition solver
auteur
Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Azzam Haidar, Yohan Lee-Tin-Yien, Jean Roman
article
Journée GNR MOMAS / GDR Calcul, May 2010, Paris, France
Accès au bibtex
BibTex
titre
QR Factorization of Tall and Skinny Matrices in a Grid Computing Environment
auteur
Emmanuel Agullo, Camille Coti, Jack Dongarra, Thomas Herault, Julien Langou
article
24th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2010), Apr 2010, Atlanta, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00548900/file/grid-QR-IPDPS-2010.pdf BibTex
titre
Tile QR Factorization with Parallel Panel Processing for Multicore Architectures
auteur
Bilel Hadri, Hatem Ltaief, Emmanuel Agullo, Jack Dongarra
article
24th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2010), Apr 2010, Atlanta, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00548899/file/tile-caqr-ipdps.pdf BibTex
titre
Hybrid direct-multigrid solver for large 3D electromagnetic problems
auteur
Mathieu Chanaud, David Goudin, Jean-Jacques Pesqué, Jean Roman
article
11th Copper Mountain Conference on Iterative Methods, Apr 2010, Copper Mountain, United States
Accès au bibtex
BibTex
titre
Parallel solver coupling multigrid and direct methods for Maxwell equations
auteur
Mathieu Chanaud, David Goudin, Jean-Jacques Pesqué, Jean Roman
article
SIAM Conference on Parallel Processing for Scientific Computing (PP10), Feb 2010, Seattle, Washington, United States
Accès au bibtex
BibTex
titre
Tile QR factorization with parallel panel processing for multicore architectures
auteur
Emmanuel Agullo, Jack Dongarra, Bilel Hadri, Hatem Ltaief
article
SIAM Conference on Parallel Processing for Scientific Computing (PP10), Feb 2010, Seattle, United States
Accès au bibtex
BibTex
titre
In-situ Visualization and Analysis of SPH Data using a ParaView Plugin and a Distributed Shared Memory Interface
auteur
Jérome Soumagne, John Biddiscombe, Jerry Clarke
article
5th International SPHERIC Workshop, 2010, Manchester, United Kingdom. pp.186-193
Accès au bibtex
BibTex

Book sections

titre
Faster, Cheaper, Better – a Hybridization Methodology to Develop Linear Algebra Software for GPUs
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Hatem Ltaief, Raymond Namyst, Samuel Thibault, Stanimire Tomov
article
Wen-mei W. Hwu. GPU Computing Gems, 2, Morgan Kaufmann, 2010
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00547847/file/gpucomputinggems_plagma.pdf BibTex

Other publications

titre
Highly scalable parallel simulator of a host-parasite system
auteur
Michel Langlais, Guillaume Latu, Jean Roman, Patrick Silan
article
2010
Accès au texte intégral et bibtex
https://hal.science/hal-00453501/file/HSPS.pdf BibTex

Reports

titre
Sparse approximations of the Schur complement for parallel algebraic hybrid linear solvers in 3D
auteur
Luc Giraud, Azzam Haidar, Yousef Saad
article
[Research Report] RR-7237, INRIA. 2010, pp.18
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00466828/file/RR-7237.pdf BibTex

Theses

titre
Numerical modeling of seismic wave propagation on hierarchical and multicore architectures
auteur
Fabrice Dupros
article
Modélisation et simulation. Université Sciences et Technologies – Bordeaux I, 2010. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00580411/file/these-dupros-finale.pdf BibTex
titre
Design of a Software Environment for the Computational Steering of Parallel and Distributed Numerical Simulations
auteur
Nicolas Richart
article
Informatique [cs]. Université Sciences et Technologies – Bordeaux I, 2010. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00464406/file/richart-thesis-10a.pdf BibTex

2009

Journal articles

titre
Parallel algebraic hybrid solvers for large 3D convection-diffusion problems
auteur
Luc Giraud, Azzam Haidar
article
Numerical Algorithms, 2009, 51 (2), pp.151-177. ⟨10.1007/s11075-008-9248-x⟩
Accès au bibtex
BibTex
titre
Seismic wave modeling for seismic imaging
auteur
J. Virieux, S. Operto, H. Ben Hadj Ali, R. Brossier, V. Etienne, F. Sourbier, Luc Giraud, A. Haidar
article
Leading Edge, 2009, 28 (5), pp.538-544. ⟨10.1190/1.3124928⟩
Accès au bibtex
BibTex
titre
Non-linear MHD simulations of edge localized modes (ELMs)
auteur
G. Huysmans, Stanislas Pamela, Emiel van Der Plas, Pierre Ramet
article
Plasma Physics, 2009, 51 (12), pp.124012
Accès au bibtex
BibTex

Conference papers

titre
Parallel algebraic hybrid linear solver for frequency domain acoustic wave modeling
auteur
Hafedh Ben-Hadj-Ali, Luc Giraud, Azzam Haidar, Stéphane Operto, Jean Virieux
article
SIAM conference on Applied Linear Algebra, SIAM, Oct 2009, Monterey Bay, United States
Accès au bibtex
BibTex
titre
Fast construction of the Kohn–Sham response function for molecules}
auteur
Peter Koval, Dietrich Foerster, Olivier Coulaud
article
Trends in nanotechnology – TNT 2009, Sep 2009, Barcelona, Spain
Accès au bibtex
https://arxiv.org/pdf/0910.3796 BibTex
titre
Fast Seismic Modeling and Reverse Time Migration on a GPU Cluster
auteur
Rached Abdelkhalek, Henri Calendra, Olivier Coulaud, Guillaume Latu, Jean Roman
article
The 2009 High Performance Computing & Simulation – HPCS’09, Jun 2009, Leipzig, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00403933/file/hpcs.pdf BibTex
titre
A Non Overlapping Parallel Domain Decomposition Method Applied to The Simplified Transport Equations
auteur
Maxime Barrault, Bruno Lathuilière, Pierre Ramet, Jean Roman
article
International Conference on Mathematics, Computational Methods & Reactor Physics, 2009, New-York, United States
Accès au bibtex
BibTex
titre
FDTD Based Seismic Modeling and Reverse Time Migration on a GPU Cluster
auteur
Rached Abdelkhalek, Henri Calandra, Olivier Coulaud, Guillaume Latu, Jean Roman
article
9th International Conference on Mathematical and Numerical Aspects of Waves Propagation – Waves 2009, 2009, Pau, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00407782/file/waves09.pdf BibTex

Poster communications

titre
Extension of LCAO to excited states
auteur
Peter Koval, Dietrich Foerster
article
Trends in nanotechnology – TNT 2009, Sep 2009, Barcelona, Spain. 2 p
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00437231/file/poster-tddft-gw-page1.pdf https://inria.hal.science/inria-00437231/file/poster-tddft-gw-page2.pdf BibTex

Documents associated with scientific events

titre
Current state of the art in TDDFT code
auteur
Petr Koval, Olivier Coulaud, Dietrich Foerster
article
NOSSI 2009 (annual meeting), Oct 2009, Biarritz, France. pp.40
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00437612/file/nossi-pk-oc-df-biarritz-2009-10-07.pdf BibTex
titre
Extension of LCAO to excited states: non interacting response and molecular spectra
auteur
Petr Koval, Olivier Coulaud, Dietrich Foerster
article
ETSF 2009: Ab-initio tools for the characterization of nanostructures, Sep 2009, Evora, Portugal. pp.20
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00437608/file/prod-basis-etsf-evora-2009.pdf BibTex

2008

Conference papers

titre
Exploiting Intensive Multithreading for the Efficient Simulation of 3D Seismic Wave Propagation
auteur
Fabrice Dupros, Hideo Aochi, Ariane Ducellier, Dimitri Komatitsch, Jean Roman
article
ICCSE 2008 : 11th International Conference on Computational Science and Engineering, Jul 2008, Sao Paulo, Brazil. pp.253-260
Accès au bibtex
BibTex

Other publications

titre
Overview of MUMPS (A multifrontal Massively Parallel Solver)
auteur
Patrick Amestoy, Alfredo Buttari, Philippe Combes, Abdou Guermouche, Jean-Yves L’Excellent, Tzvetomila Slavova, Bora Uçar
article
2008
Accès au bibtex
BibTex

2003

Journal articles

titre
Performance analysis and qualitative results of an efficient parallel stochastic simulator for a marine host-parasite system
auteur
Michel Langlais, Guillaume Latu, Jean Roman, Patrick Silan
article
Concurrency and Computation: Practice and Experience, 2003, 15 (11-12), pp.1133-1150. ⟨10.1002/cpe.784⟩
Accès au bibtex
BibTex

2002

Journal articles

titre
Stochastic simulation of a marine host-parasite system using a hybrid MPI/OpenMP programming
auteur
Michel Langlais, Guillaume Latu, Jean Roman, Patrick Silan
article
Lecture Notes in Computer Science, 2002, 2400, pp.436-446. ⟨10.1007/3-540-45706-2_59⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01320374/file/Langlais_et_al_2002.pdf BibTex

2001

Reports

titre
SCILAB to SCILAB// – The Ouragan Project
auteur
Eddy Caron, Serge Chaumette, Sylvain Contassot-Vivier, Frédéric Desprez, Eric Fleury, Claude Gomez, Maurice Goursat, Emmanuel Jeannot, Dominique Lazure, Frédéric Lombard, Jean-Marc Nicod, Laurent Philippe, Martin Quinson, Pierre Ramet, Jean Roman, Franck Rubi, Serge Steer, Frederic Suter, Gil Utard
article
[Research Report] RR-2001-24, LIP – ENS Lyon. 2001
Accès au bibtex
BibTex

Comments are closed.