Publications

Publications HAL de la structure storm;runtime

2024

Conference papers

titre
Exploiting Processor Heterogeneity to Improve Throughput and Reduce Latency for Deep Neural Network Inference
auteur
Olivier Beaumont, Jean-François David, Lionel Eyraud-Dubois, Samuel Thibault
article
SBAC-PAD 2024 – IEEE 36th International Symposium on Computer Architecture and High Performance Computing, Nov 2024, Hilo, Hawaii, United States
Accès au texte intégral et bibtex
https://hal.science/hal-04690154/file/sbac_pad%20%281%29.pdf BibTex
titre
StarONNX: a Dynamic Scheduler for Low Latency and High Throughput Inference on Heterogeneous Resources
auteur
Olivier Beaumont, Jean-François David, Lionel Eyraud-Dubois, Samuel Thibault
article
HeteroPar 2024 – 22ND INTERNATIONAL WORKSHOP Algorithms, Models and Tools for Parallel Computing on Heterogeneous Platforms, EuroPar’24, Aug 2024, Madrid, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04646530/file/heteropar.pdf BibTex
titre
A 1.25(1+ε)-Approximation Algorithm for Scheduling with Rejection Costs Proportional to Processing Times
auteur
Olivier Beaumont, Rémi Bouzel, Lionel Eyraud-Dubois, Esragul Korkmaz, Laércio Lima Pilla, Alexandre van Kempen
article
International European Conference on Parallel and Distributed Computing (Euro-Par), Aug 2024, Madrid, Spain. pp.225-238, ⟨10.1007/978-3-031-69577-3_16⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04670834/file/europar2024-preprint.pdf BibTex
titre
Optimiser l’Efficacité des Systèmes Parallèles : Adaptation Dynamique des Graphes de Tâches Récursives
auteur
Thomas Morin
article
COMPAS 2024 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2024, Nantes, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04672417/file/samplepaper.pdf BibTex
titre
StarONNX : Un ordonanceur dynamique pour une inférence rapide et à haut débit sur des ressources hétérogènes
auteur
Olivier Beaumont, Jean-François David, Lionel Eyraud-Dubois, Samuel Thibault
article
Compas 2024 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2024, Nantes, France
Accès au bibtex
BibTex
titre
Data-Driven Locality-Aware Batch Scheduling
auteur
Maxime Gonthier, Elisabeth Larsson, Loris Marchal, Carl Nettelblad, Samuel Thibault
article
APDCM 2024 – 26th Workshop on Advances in Parallel and Distributed Computational Models, 38th IEEE International Parallel and Distributed Processing Symposium, May 2024, San Francisco, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04500281/file/Data-Driven%20Locality-Aware%20Batch%20Scheduling.pdf BibTex
titre
MPI Errors Detection using GNN Embedding and Vector Embedding over LLVM IR
auteur
Jad El Karchi, Hanze Chen, Ali Tehranijamsaz, Ali Jannesari, Mihail Popov, Emmanuelle Saillard
article
IPDPS 2024 – 38th International Symposium on Parallel and Distributed Processing, May 2024, San francisco, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04724011/file/2403.02518v1.pdf BibTex
titre
Multi-Criteria Mesh Partitioning for an Explicit Temporal Adaptive Task-Distributed Finite-Volume Solver
auteur
Alice Lasserre, Jean Marie Couteyen Carpaye, Abdou Guermouche, Raymond Namyst
article
The 25th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing (PDSEC 2024), May 2024, San Francisco, United States. pp.10
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04403209/file/ipdps24.pdf BibTex
titre
Leveraging private container networks for increased user isolation and flexibility on HPC clusters
auteur
Lise Jolicoeur, François Diakhaté, Raymond Namyst
article
WOCC 2024 – 2nd International Workshop on Converged Computing on Edge, Cloud, and HPC, May 2024, Hamburg, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04740275/file/wocc24_final.pdf BibTex
titre
Static-Dynamic analysis for Performance and Accuracy of Data Race Detection in MPI One-Sided Programs
auteur
Radjasouria Vinayagame, Van Man Nguyen, Marc Sergent, Samuel Thibault, Emmanuelle Saillard
article
C3PO 2024 – Compiler-assisted Correctness Checking and Performance Optimization for HPC, May 2024, Hambourg, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-04581890/file/samplepaper.pdf BibTex
titre
Optimizing Parallel System Efficiency: Dynamic Task Graph Adaptation with Recursive Tasks
auteur
Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Thomas Morin, Samuel Thibault, Pierre-André Wacrenier
article
WAMTA 2024 – Workshop on Asynchronous Many-Task Systems and Applications 2024, Feb 2024, Knoxville, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04548787/file/wamta24.pdf BibTex

Master thesis

titre
Support d’exécution à base de tâches et programmation de haut niveau pour la simulation par éléments finis
auteur
Abdelbarie El Metni
article
Calcul parallèle, distribué et partagé [cs.DC]. 2024
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04755787/file/memoire_stage_developpement_aelmetni_2024.pdf BibTex
titre
Mémoire de stage
auteur
Evan Potin
article
Calcul parallèle, distribué et partagé [cs.DC]. 2024
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04755831/file/memoire_m2_epotin_2024.pdf BibTex

Poster communications

titre
Combined Computer Vision and SDR Transmission on Multicore CPUs
auteur
Adrien Cassagne, Romain Tajan, Olivier Aumage
article
Journée des Développeurs, Oct 2024, Bruz, France
Accès au texte intégral et bibtex
https://hal.science/hal-04771981/file/poster_jdd.pdf BibTex

Software

titre
Experimental codes and results for the paper “A 5/4(1+eps)-Approximation Algorithm for Scheduling with Rejection Costs Proportional to Processing Times
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Esragul Korkmaz, Laércio Lima Pilla
article
2024, ⟨swh:1:dir:53aa25178b70f7d119690440f64912c226521893;origin=https://hal.archives-ouvertes.fr/hal-04517532;visit=swh:1:snp:690ab9c97d792e39eb94c530093dc36623bb9dac;anchor=swh:1:rel:f7390f430900bcc0a290b2fc33d2ab5285922588;path=/⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04517532/file/SchedulingWithRejection.zip BibTex

Preprints, Working Papers, …

titre
Approximation Algorithms for Scheduling with/without Deadline Constraints where Rejection Costs are Proportional to Processing Times
auteur
Olivier Beaumont, Rémi Bouzel, Lionel Eyraud-Dubois, Esragul Korkmaz, Laércio Lima Pilla, Alexandre van Kempen
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-04745701/file/scheduling_with_rejection.pdf BibTex
titre
A generic scheduler to foster data locality for GPU and out-of-core task-based applications
auteur
Maxime Gonthier, Samuel Thibault, Loris Marchal
article
2024
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04146714/file/JPDC.pdf BibTex
titre
Optimal Time and Energy-Aware Client Selection Algorithms for Federated Learning on Heterogeneous Resources
auteur
Alan Lira Nunes, Cristina Boeres, Lúcia Maria de A. Drummond, Laércio Lima Pilla
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-04690494/file/rep-opt-time-and-energy.pdf BibTex
titre
Performance portability of generated cardiac simulation kernels through automatic dimensioning and load balancing on heterogeneous nodes
auteur
Vincent Alba, Olivier Aumage, Denis Barthou, Raphaël Colin, Marie-Christine Counilh, Stéphane Genaud, Amina Guermouche, Vincent Loechner, Arun Thangamani
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-04606388/file/pdp-16.pdf BibTex
titre
Diagonally dominant matrices for cryptography.
auteur
Andrea Lesavourey, Kazuhide Fukushima, Thomas Plantard, Arnaud Sipasseuth
article
2024
Accès au texte intégral et bibtex
https://hal.science/hal-03728051/file/DRS-DRE.pdf BibTex

2023

Journal articles

titre
Tracing task-based runtime systems: Feedbacks from the StarPU case
auteur
Alexandre Denis, Emmanuel Jeannot, Philippe Swartvagher, Samuel Thibault
article
Concurrency and Computation: Practice and Experience, 2023, pp.24. ⟨10.1002/cpe.7920⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04236246/file/article.pdf BibTex
titre
A DSEL for high throughput and low latency software‐defined radio on multicore CPUs
auteur
Adrien Cassagne, Romain Tajan, Olivier Aumage, Camille Leroux, Denis Barthou, Christophe Jégo
article
Concurrency and Computation: Practice and Experience, 2023, pp.e7820. ⟨10.1002/cpe.7820⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04156404/file/Cassagne2023%20-%20A%20DSEL%20for%20High%20Throughput%20and%20Low%20Latency%20Software-Defined%20Radio%20on%20Multicore%20CPUs%20%5Bpreprint%5D.pdf BibTex
titre
Optimizing Performance and Energy Across Problem Sizes Through a Search Space Exploration and Machine Learning
auteur
Lana Scravaglieri, Mihail Popov, Laércio Lima Pilla, Amina Guermouche, Olivier Aumage, Emmanuelle Saillard
article
Journal of Parallel and Distributed Computing, 2023, 180, pp.104720. ⟨10.1016/j.jpdc.2023.104720⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03810305/file/input_paper.pdf BibTex
titre
Scheduling Algorithms for Federated Learning with Minimal Energy Consumption
auteur
Laércio Lima Pilla
article
IEEE Transactions on Parallel and Distributed Systems, In press, ⟨10.1109/TPDS.2023.3240833⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03775491/file/energy-fl-2023.pdf BibTex
titre
Taming data locality for task scheduling under memory constraint in runtime systems
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
Future Generation Computer Systems, In press, ⟨10.1016/j.future.2023.01.024⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03623220/file/fgcs-paper-reviewers-round2-unmarked-submitted.pdf BibTex
titre
Programming Heterogeneous Architectures Using Hierarchical Tasks
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Raymond Namyst, Samuel Thibault, Pierre‐andré Wacrenier
article
Concurrency and Computation: Practice and Experience, In press, 35 (25), ⟨10.1002/cpe.7811⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04088833/file/finale_submission.pdf BibTex

Conference papers

titre
Rethinking Data Race Detection in MPI-RMA Programs
auteur
Radjasouria Vinayagame, Van Man Nguyen, Marc Sergent, Samuel Thibault, Emmanuelle Saillard
article
7th International Workshop on Software Correctness for HPC Applications (Correctness ’23), Nov 2023, Denver (Colorado, USA), United States. pp.196-204, ⟨10.1145/3624062.3624086⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04272399/file/MPI-RMA-races.pdf BibTex
titre
Highlighting PARCOACH Improvements on MBI
auteur
Philippe Virouleau, Emmanuelle Saillard, Marc Sergent, Pierre Lemarinier
article
SC-W 2023 – Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis, Nov 2023, Denver CO, United States. pp.238-241, ⟨10.1145/3624062.3624093⟩
Accès au texte intégral et bibtex
https://hal.science/hal-04320261/file/main.pdf BibTex
titre
Improving Simulations of Task-Based Applications on Complex NUMA Architectures
auteur
Idriss Daoudi, Thierry Gautier, Samuel Thibault, Swann Perarnau
article
IWOMP 2023 – 19th International Workshop on OpenMP, Sep 2023, Bristol, United Kingdom. pp.195-209, ⟨10.1007/978-3-031-40744-4_13⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04201317/file/IWOMP_2023_paper_8.pdf BibTex
titre
Rethinking Data Race Detection in RMA-Analyzer
auteur
Radjasouria Vinayagame
article
COMPAS 2023 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, LISTIC – Laboratoire d’Informatique, Systèmes, Traitement de l’Information et de la Connaissance – de l’Université Savoie Mont Blanc., Jul 2023, Annecy, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04272083/file/COMPAS_PAPER.pdf BibTex
titre
Partitionnement de maillage pour solveurs numériques parallélisés et distribués en tâches
auteur
Alice Lasserre
article
COMPAS 2023 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2023, Annecy, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04406033/file/compas2023.pdf BibTex
titre
Automatic parallelization of tasks chains for Software-Defined-Radio
auteur
Diane Orhan
article
COMPAS 23 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2023, Annecy, France
Accès au texte intégral et bibtex
https://hal.science/hal-04405779/file/compas_2023_style-11.pdf BibTex
titre
Vector operations, tiled operations, distributed execution, task graphs, … What next ?
auteur
Samuel Thibault
article
JLESC 15 – 15th Joint Laboratory for Extreme Scale Computing Workshop, Mar 2023, Talence, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04115280/file/23-03-21-jlesc.pdf BibTex

Master thesis

titre
Énergie ou performance : impact de l’implémentation sur la consommation
auteur
Hicham Nekt
article
Informatique [cs]. 2023
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04394261/file/Rapport_de_stage%20%283%29.pdf BibTex
titre
Vector code generation and high level programming for finite element simulation
auteur
Angel Hippolyte
article
Computer Science [cs]. 2023
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04315144/file/rapport_stage_ahippolyte_2023.pdf BibTex
titre
Etude de l’impact du power capping sur les performances des GPU
auteur
Albert d’Aviau de Piolant
article
Computer Science [cs]. 2023
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04395148/file/main%20%283%29.pdf BibTex

Poster communications

titre
Memory-Aware Scheduling Of Tasks Sharing Data On Multiple GPUs
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
ISC 2023 – ISC High Performance 2023, May 2023, Hamburg, Germany. Lecture Notes in Computer Science
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04090595/file/Poster.pdf BibTex

Documents associated with scientific events

titre
Memory-Aware Scheduling of Tasks Sharing Data on Multiple GPUs
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
JLESC 2023 -15th JLESC Workshop, Mar 2023, Bordeaux, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04090612/file/jlesc%20%281%29.pdf BibTex

Theses

titre
On the use of hierarchical tasks for heterogeneous architectures
auteur
Gwenolé Lucas
article
Other [cs.OH]. Université de Bordeaux, 2023. English. ⟨NNT : 2023BORD0231⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-04316145/file/LUCAS_GWENOLE_2023.pdf BibTex
titre
Scheduling Under Memory Constraint in Task-based Runtime Systems
auteur
Maxime Gonthier
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Ecole normale supérieure de lyon – ENS LYON, 2023. English. ⟨NNT : 2023ENSL0061⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-04260094/file/GONTHIER_Maxime_2023ENSL0061.pdf BibTex

Preprints, Working Papers, …

titre
OTAC: Optimal Scheduling for Pipelined and Replicated Task Chains for Software-Defined Radio
auteur
Diane Orhan, Laércio Lima Pilla, Denis Barthou, Adrien Cassagne, Olivier Aumage, Romain Tajan, Christophe Jégo, Camille Leroux
article
2023
Accès au texte intégral et bibtex
https://hal.science/hal-04228117/file/otac-optimal-scheduling-hal.pdf BibTex

2022

Journal articles

titre
À quoi servent les ordinateurs les plus puissants au monde ? Un exemple en cardiologie
auteur
Emmanuelle Saillard, Mark Potse
article
The Conversation France, 2022
Accès au bibtex
BibTex
titre
Towards EXtreme scale technologies and accelerators for euROhpc hw/Sw supercomputing applications for exascale: The TEXTAROSSA approach
auteur
Giovanni Agosta, Marco Aldinucci, Carlos Alvarez, Roberto Ammendola, Yasir Arfat, Olivier Beaumont, Massimo Bernaschi, Andrea Biagioni, Tommaso Boccali, Bérenger Bramas, Carlo Brandolese, Barbara Cantalupo, Mauro Carrozzo, Daniele Cattaneo, Alessandro Celestini, Massimo Celino, Iacopo Colonnelli, Paolo Cretaro, Pasqua D’ambra, Marco Danelutto, Roberto Esposito, Lionel Eyraud-Dubois, Antonio Filgueras, William Fornaciari, Ottorino Frezza, Andrea Galimberti, Francesco Giacomini, Brice Goglin, Daniele Gregori, Abdou Guermouche, Francesco Iannone, Michal Kulczewski, Francesca Lo Cicero, Alessandro Lonardo, Alberto Martinelli, Michele Martinelli, Xavier Martorell, Giuseppe Massari, Simone Montangero, Gianluca Mittone, Raymond Namyst, Ariel Oleksiak, Paolo Palazzari, Pier Stanislao Paolucci, Federico Reghenzani, Cristian Rossi, Sergio Saponara, Francesco Simula, Federico Terraneo, Samuel Thibault, Massimo Torquati, Matteo Turisini, Piero Vicini, Miquel Vidal, Davide Zoni, Giuseppe Zummo
article
Microprocessors and Microsystems: Embedded Hardware Design , 2022, 95, pp.104679. ⟨10.1016/j.micpro.2022.104679⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03936864/file/2021_TEXTAROSSA_MICPRO.pdf BibTex
titre
SimSGamE : Scheduling simulator for modern game engines
auteur
Mustapha Regragui, Baptiste Coye, Laércio Lima Pilla, Raymond Namyst, Denis Barthou
article
Journal of Open Source Software, 2022, 7 (76), pp.4592. ⟨10.21105/joss.04592⟩
Accès au bibtex
BibTex
titre
MPI detach — Towards automatic asynchronous local completion
auteur
Joachim Protze, Marc-André Hermanns, Matthias S Müller, Van Man Nguyen, Julien Jaeger, Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
Parallel Computing, 2022, 109, pp.102859. ⟨10.1016/j.parco.2021.102859⟩
Accès au texte intégral et bibtex
https://cea.hal.science/cea-03537990/file/mpi-detach.pdf BibTex

Conference papers

titre
Static Local Concurrency Errors Detection in MPI-RMA Programs
auteur
Emmanuelle Saillard, Marc Sergent, Tassadit Célia Aitkaci, Denis Barthou
article
Correctness 2022 – Sixth International Workshop on Software Correctness for HPC Applications, Nov 2022, Dallas, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03882459/file/paper.pdf BibTex
titre
Analysing and Predicting Energy Consumption of Garbage Collectors in OpenJDK
auteur
Marina Shimchenko, Mihail Popov, Tobias Wrigstad
article
MPLR 2022 – 19th International Conference on Managed Programming Languages and Runtimes, Sep 2022, Brussels, Belgium. pp.3-15, ⟨10.1145/3546918.3546925⟩
Accès au bibtex
BibTex
titre
A comparison of multithreading, vectorization, and GPU computing for the acceleration of cardiac electrophysiology models
auteur
Chiheb Sakka, Amina Guermouche, Olivier Aumage, Emmanuelle Saillard, Mark Potse, Yves Coudière, Denis Barthou
article
Computing in Cardiology 2022, Sep 2022, Tampere, Finland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03936903/file/sakka-cinc22.pdf BibTex
titre
Programming Heterogeneous Architectures Using Hierarchical Tasks
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Raymond Namyst, Samuel Thibault, Pierre-André Wacrenier
article
HeteroPar 2022 – twentieth international workshop, Aug 2022, Glasgow, United Kingdom. pp.12
Accès au texte intégral et bibtex
https://hal.science/hal-03789625/file/paper%20%281%29.pdf BibTex
titre
Exploring scheduling algorithms for parallel task graphs: a modern game engine case study
auteur
Mustapha Regragui, Baptiste Coye, Laércio Lima Pilla, Raymond Namyst, Denis Barthou
article
International European Conference on Parallel and Distributed Computing (Euro-Par), Aug 2022, Glasgow, United Kingdom. pp.103-118, ⟨10.1007/978-3-031-12597-3_7⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03580775/file/main.pdf BibTex
titre
Programmation des architectures hétérogènes à l’aide de tâches hiérarchiques
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Samuel Thibault, Pierre-André Wacrenier
article
COMPAS 2022 – Conférence francophone d’informatique en Parallélisme, Architecture et Système, Jul 2022, Amiens, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03773486/file/ComPAS2022_paper_10.pdf BibTex
titre
Peachy Parallel Assignments (EduPar 2022)
auteur
H. Martin Bucker, Henri Casanova, Rafael Ferreira da Silva, Alice Lasserre, Derrick Luyen, Raymond Namyst, Johannes Schoder, Pierre-André Wacrenier, David Bunde
article
IPDPSW 2022 – IEEE International Parallel and Distributed Processing Symposium Workshops, May 2022, Lyon, France. pp.361-368, ⟨10.1109/IPDPSW55747.2022.00068⟩
Accès au bibtex
BibTex
titre
Decentralized in-order execution of a sequential task-based code for shared-memory architectures
auteur
Charly Castes, Emmanuel Agullo, Olivier Aumage, Emmanuelle Saillard
article
IPDPSW 2022 – IEEE International Parallel and Distributed Processing Symposium Workshops, May 2022, Lyon, France. pp.552-561, ⟨10.1109/IPDPSW55747.2022.00095⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03896030/file/ccastes_hips_2022.pdf BibTex
titre
Combining uncore frequency and dynamic power capping to improve power savings
auteur
Amina Guermouche
article
2022 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW), May 2022, Lyon, France. pp.1028-1037
Accès au texte intégral et bibtex
https://hal.science/hal-03563120/file/report.pdf BibTex
titre
Learning Intermediate Representations using Graph Neural Networks for NUMA and Prefetchers Optimization
auteur
Ali Tehranijamsaz, Mihail Popov, Akash Dutta, Emmanuelle Saillard, Ali Jannesari
article
IPDPS 2022 – 36th IEEE International Parallel & Distributed Processing Symposium, May 2022, Lyon / Virtual, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03603118/file/Learning_Intermediate_Representations_using_Graph_Neural_Networks_for_NUMA_and_Prefetchers_Optimization.pdf BibTex
titre
Memory-Aware Scheduling of Tasks Sharing Data on Multiple GPUs with Dynamic Runtime Systems
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
IPDPS 2022 – 36th IEEE International Parallel & Distributed Processing Symposium, May 2022, Lyon, France. pp.1-11, ⟨10.1109/IPDPS53621.2022.00073⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03552243/file/IPDPS-camera-ready.pdf BibTex

Master thesis

titre
Exploring the collaboration between FEniCSx and StarPU
auteur
Thomas Morin
article
Distributed, Parallel, and Cluster Computing [cs.DC]. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03897912/file/Thomas_Morin_2022_Internship-1.pdf BibTex
titre
Décomposition de domaines et ordonnancement de tâches pour la simulation en mécanique des fluides
auteur
Alice Lasserre
article
Calcul parallèle, distribué et partagé [cs.DC]. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04092163/file/Rapport_de_Stage_LASSERRE.pdf BibTex
titre
Load balancing and precision analysis for cardiac simulation M2 Internship report
auteur
Vincent Alba
article
Computer Science [cs]. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03784546/file/Load%20balancing%20and%20precision%20analysis%20for%20cardiac%20simulation.pdf BibTex
titre
Equilibrage de charge distribué sur StarpU
auteur
Pélagie Alves
article
Informatique [cs]. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03756492/file/Equilibrage_de_charge_distribu%C3%A9_starPU.pdf BibTex
titre
Ordonnancement automatique et parallèle du flux de données appliqué à la radio logicielle et notamment au logiciel AFF3CT
auteur
Diane Orhan
article
Calcul parallèle, distribué et partagé [cs.DC]. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03768106/file/Rapport_de_Stage_ORHAN.pdf BibTex
titre
Analyse de systèmes de vote électronique
auteur
Firmin de Barros, Thomas Gergouil, Rémy Grelard, Samuel Thibault
article
Cryptographie et sécurité [cs.CR]. 2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03580506/file/Rapport%20-%20Analyse%20de%20syst%C3%A8mes%20de%20vote%20%C3%A9lectronique.pdf BibTex

Poster communications

titre
Memory-Aware Scheduling Of Tasks Sharing Data On Multiple GPUs
auteur
Maxime Gonthier, Samuel Thibault, Loris Marchal
article
HiPEAC ACACES 2022 – 18th International Summer School on Advanced Computer Architecture and Compilation for High-performance Embedded Systems, Jul 2022, Fiuggi, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04090607/file/Poster-submitted.pdf BibTex

Documents associated with scientific events

titre
Memory-Aware Scheduling of Tasks Sharing Data on Multiple GPUs with Dynamic Runtime Systems
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
15th Scheduling for Large Scale Systems Workshop, Jun 2022, Fréjus, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04090618/file/frejus.pdf BibTex

Reports

titre
StarPU profiling interface
auteur
Olivier Aumage, Camille Coti
article
Inria & Labri, Université de Bordeaux; Université du Québec à Montréal. 2022
Accès au texte intégral et bibtex
https://hal.science/hal-03868526/file/StarPU_profiling_interface.pdf BibTex
titre
Optimal Workload Scheduling Algorithm for Data-Parallel Applications on Heterogeneous Platforms based on Dynamic Programming
auteur
Laércio Lima Pilla
article
[Research Report] RR-9487, CNRS; LaBRI; Inria; Université de Bordeaux; Bordeaux INP. 2022, pp.1-6
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03776372/file/RR-9487.pdf BibTex
titre
Task-based randomized singular value decomposition and multidimensional scaling
auteur
Emmanuel Agullo, Olivier Coulaud, Alexandre Denis, Mathieu Faverge, Alain Franc, Jean-Marc Frigerio, Nathalie Furmento, Adrien Guilbaud, Emmanuel Jeannot, Romain Peressoni, Florent Pruvost, Samuel Thibault
article
[Research Report] RR-9482, Inria Bordeaux – Sud Ouest; Inrae – BioGeCo. 2022, pp.37
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03773985/file/RR-9482%20%281%29.pdf BibTex
titre
Programming Heterogeneous Architectures Using Hierarchical Tasks
auteur
Mathieu Faverge, Nathalie Furmento, Abdou Guermouche, Gwenolé Lucas, Raymond Namyst, Samuel Thibault, Pierre-André Wacrenier
article
[Research Report] RR-9466, Inria Bordeaux Sud-Ouest. 2022, pp.21
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03609275/file/RR-9466.pdf BibTex
titre
Locality-aware batch scheduling of I/O intensive workloads
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault, Elisabeth Larsson, Carl Nettelblad
article
RR-9497, ENS Lyon; Inria Bordeaux; Uppsala Universitet. 2022, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03993118/file/RR-9497.pdf BibTex
titre
Study of the processor and memory power consumption of coupled sparse/dense solvers
auteur
Emmanuel Agullo, Marek Felšöci, Amina Guermouche, Hervé Mathieu, Guillaume Sylvand, Bastien Tagliaro
article
[Research Report] RR-9463, Inria Bordeaux Sud-Ouest. 2022, pp.17
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03589695/file/RR-9463.pdf BibTex
titre
Decentralized in-order execution of a sequential task-based code for shared-memory architectures
auteur
Charly Castes, Emmanuel Agullo, Olivier Aumage, Emmanuelle Saillard
article
[Research Report] RR-9450, Inria Bordeaux – Sud Ouest. 2022, pp.30
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03547334/file/RR-9450.pdf BibTex

Theses

titre
Compile-time Validation and Optimization of MPI Nonblocking Communications
auteur
van Man Nguyen
article
Data Structures and Algorithms [cs.DS]. Université de Bordeaux, 2022. English. ⟨NNT : 2022BORD0415⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-04074295/file/NGUYEN_VAN_MAN_2022.pdf BibTex

Videos

titre
1 minute avec…Emmanuelle Saillard
auteur
Emmanuelle Saillard
article
2022
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03656775/file/1_une_minute_avec_emmanuelle_saillard_1_.mp4 BibTex

2021

Journal articles

titre
Resiliency in numerical algorithm design for extreme scale simulations
auteur
Emmanuel Agullo, Mirco Altenbernd, Hartwig Anzt, Leonardo Bautista-Gomez, Tommaso Benacchio, Luca Bonaventura, Hans-Joachim Bungartz, Sanjay Chatterjee, Florina M Ciorba, Nathan Debardeleben, Daniel Drzisga, Sebastian Eibl, Christian Engelmann, Wilfried N Gansterer, Luc Giraud, Dominik Göddeke, Marco Heisig, Fabienne Jézéquel, Nils Kohl, Sherry Xiaoye, Romain Lion, Miriam Mehl, Paul Mycek, Michael Obersteiner, Enrique S Quintana-Ortí, Francesco Rizzi, Ulrich Rüde, Martin Schulz, Fred Fung, Robert Speck, Linda Stals, Keita Teranishi, Samuel Thibault, Dominik Thönnes, Andreas Wagner, Barbara Wohlmuth
article
International Journal of High Performance Computing Applications, 2021, pp.10943420211055188. ⟨10.1177/10943420211055188⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03348787/file/2010.13342.pdf BibTex
titre
EXA2PRO: A Framework for High Development Productivity on Heterogeneous Computing Systems
auteur
Lazaros Papadopoulos, Dimitrios Soudris, Christoph Kessler, August Ernstsson, Johan Ahlqvist, Nikos Vasilas, Athanasios I Papadopoulos, Panos Seferlis, Charles Prouveur, Matthieu Haefele, Samuel Thibault, Athanasios Salamanis, Theodoros Ioakimidis, Dionysios Kehagias
article
IEEE Transactions on Parallel and Distributed Systems, 2021, Special Section on Innovative R&D toward the Exascale Era, ⟨10.1109/TPDS.2021.3104257⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03318644/file/EXA2PRO___TPDS.pdf BibTex
titre
ARTful: A model for user-defined schedulers targeting multiple high-performance computing runtime systems
auteur
Alexandre Santana, Vinicius Freitas, Marcio Castro, Laércio Lima Pilla, Jean-François Méhaut
article
Software: Practice and Experience, 2021, ⟨10.1002/spe.2977⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02454426/file/Manuscript.pdf BibTex
titre
Dynamic DAG Scheduling Under Memory Constraints for Shared-Memory Platforms
auteur
Gabriel Bathie, Loris Marchal, Yves Robert, Samuel Thibault
article
International Journal of Networking and Computing, 2021, pp.1-29. ⟨10.15803/ijnc.11.1_27⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03029847/file/ijnc-hal.pdf BibTex
titre
Algorithm Selection Framework for Legalization Using Deep Convolutional Neural Networks and Transfer Learning
auteur
Renan Netto, Sheiny Fabre, Tiago Augusto Fontana, Vinicius Livramento, Laércio Lima Pilla, Laleh Behjat, Jose Luis Guntzel
article
IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 2021, ⟨10.1109/TCAD.2021.3079126⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03245856/file/algo-select-framework.pdf BibTex
titre
EASYPAP: a Framework for Learning Parallel Programming
auteur
Alice Lasserre, Raymond Namyst, Pierre-André Wacrenier
article
Journal of Parallel and Distributed Computing, In press, ⟨10.1016/j.jpdc.2021.07.018⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03126887/file/EasyPAP-jpdc-final-submission.pdf BibTex

Conference papers

titre
The MPI BUGS INITIATIVE: a Framework for MPI Verification Tools Evaluation
auteur
Mathieu Laurent, Emmanuelle Saillard, Martin Quinson
article
Correctness 2021: Fifth International Workshop on Software Correctness for HPC Applications, Nov 2021, St. Louis, United States. pp.1-9
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03474762/file/MBI_paper.pdf BibTex
titre
Dynamic Data Race Detection for MPI-RMA Programs
auteur
Tassadit Célia Aitkaci, Marc Sergent, Emmanuelle Saillard, Denis Barthou, Guillaume Papauré
article
EuroMPI 2021 – European MPI Users’s Group Meeting, Sep 2021, Munich, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-03374614/file/sample-sigconf%20HAL.pdf BibTex
titre
TEXTAROSSA: Towards EXtreme scale Technologies and Accelerators for euROhpc hw/Sw Supercomputing Applications for exascale
auteur
Giovanni Agosta, Daniele Cattaneo, William Fornaciari, Andrea Galimberti, Giuseppe Massari, Federico Reghenzani, Federico Terraneo, Davide Zoni, Carlo Brandolese, Massimo Celino, Francesco Iannone, Paolo Palazzari, Giuseppe Zummo, Massimo Bernaschi, Pasqua d’Ambra, Sergio Saporana, Marco Danelutto, Massimo Torquati, Marco Aldinucci, Yasir Arfat, Barbara Cantalupo, Iacopo Colonnelli, Roberto Esposito, Alberto Riccardo Martinelli, Gianluca Mittone, Olivier Beaumont, Bérenger Bramas, Lionel Eyraud-Dubois, Brice Goglin, Abdou Guermouche, Raymond Namyst, Samuel Thibault, Antonio Filgueras, Miquel Vidal, Carlos Alvarez, Xavier Martorell, Ariel Oleksiak, Ottorino Frezza, Michal Kulczewski, Alessandro Lonardo, Piero Vicini, Francesca Lo Cicero, Francesca Simula, Andrea Biagioni, Paolo Cretaro, Pier Stanislao Paolucci, Matteo Turisini, Francesco Giacomini, Tommaso Boccali, Simone Montangero, Roberto Ammendola
article
DSD 2021 – 24th Euromicro Conference on Digital System Design, Sep 2021, Palermo / Virtual, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03329640/file/DSD.pdf BibTex
titre
Locality-Aware Scheduling of Independent Tasks for Runtime Systems
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
COLOC 2021 – 5th workshop on data locality – 27th International European Conference on Parallel and Distributed Computing, Aug 2021, Lisbon, Portugal. pp.1-12, ⟨10.1007/978-3-031-06156-1_1⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03290998/file/coloc-cameraready-submitted.pdf BibTex
titre
A Flexible and Portable Real-time DVB-S2 Transceiver using Multicore and SIMD CPUs
auteur
Adrien Cassagne, Mathieu Leonardon, Romain Tajan, Camille Leroux, Christophe Jégo, Olivier Aumage, Denis Barthou
article
The 11th IEEE International Symposium on Topics in Coding (ISTC 2021), Aug 2021, Montréal, Canada. ⟨10.1109/ISTC49272.2021.9594063⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03336450/file/article.pdf BibTex

Books

titre
Task-Based Performance Portability in HPC
auteur
Olivier Aumage, Paul Carpenter, Siegfried Benkner
article
European Technology Platform for High Performance Computing (ETP4HPC). 2021, ⟨10.5281/zenodo.5549731⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03368013/file/etp4hpc_wp_tasks_oaumage_2021.pdf BibTex

Poster communications

titre
Locality-Aware Scheduling Of Independent Tasks For Runtime Systems
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
HiPEAC ACACES 2021, Sep 2021, Fiuggi, Italy
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04090604/file/Poster-submitted.pdf BibTex

Reports

titre
Draft: sOMP: NUMA and cache-aware simulations for task-based applications
auteur
Idriss Daoudi, Samuel Thibault, Thierry Gautier
article
[Research Report] RR-9400, Inria. 2021, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03177026/file/RR-9400.pdf BibTex
titre
Locality-Aware Scheduling of Independant Tasks for Runtime Systems
auteur
Maxime Gonthier, Loris Marchal, Samuel Thibault
article
[Research Report] RR-9394, Inria Grenoble -Rhône-Alpes. 2021, pp.21
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03144290/file/RR_coloc2021-submitted.pdf BibTex

Software

titre
FADAlib: an open source C++ library for fuzzy array dataflow analysis
auteur
Marouane Belaoucha, Christophe Alias, Denis Barthou, Sid Touati
article
2021, ⟨swh:1:dir:fc7481ee438316b9ce5b273ca894114bf658d3d9;origin=https://hal.archives-ouvertes.fr/hal-03445991;visit=swh:1:snp:518f2d28a2d2a1ad15ee2f630b40be3e24a0f8b1;anchor=swh:1:rel:488f5aa5aaa21fc92f24f0f7c9b571e56f1325ec;path=/⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03445991/file/fadalib-0.1.12.tar.gz BibTex

Theses

titre
Performance Modelling and Simulation of OpenMP Applications
auteur
Idriss Daoudi
article
Calcul parallèle, distribué et partagé [cs.DC]. Université de Bordeaux, 2021. Français. ⟨NNT : 2021BORD0210⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-03416335/file/DAOUDI_IDRISS_2021.pdf BibTex

2020

Journal articles

titre
SPAWN: An Iterative, Potentials-Based, Dynamic Scheduling and Partitioning Tool
auteur
Jean-Charles Papin, Christophe Denoual, Laurent Colombet, Raymond Namyst
article
International Journal of Parallel Programming, 2020, ⟨10.1007/s10766-020-00677-9⟩
Accès au texte intégral et bibtex
https://hal.science/hal-03052422/file/article.pdf BibTex
titre
AMR-based molecular dynamics for non-uniform, highly dynamic particle simulations
auteur
Raphaël Prat, Thierry Carrard, Laurent Soulard, Olivier Durand, Raymond Namyst, Laurent Colombet
article
Computer Physics Communications, 2020, 253, pp.107177. ⟨10.1016/j.cpc.2020.107177⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03157035/file/S0010465520300308.pdf BibTex

Conference papers

titre
Applying StarPU runtime system to scientific applications: Experiences and lessons learned
auteur
Georgios Tzanos, Vineet Soni, Charles Prouveur, Matthieu Haefele, Stavroula Zouzoula, Lazaros Papadopoulos, Samuel Thibault, Nicolas Vandenbergen, Dirk Pleiter, Dimitrios Soudris
article
POMCO 2020 – 2nd International Workshop on Parallel Optimization using/for Multi- and Many-core High Performance Computing, Dec 2020, Barcelona / Virtual, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02985721/file/POMCO2020-camera-ready.pdf BibTex
titre
From tasks graphs to asynchronous distributed checkpointing with local restart
auteur
Romain Lion, Samuel Thibault
article
FTXS 2020 – IEEE/ACM 10th Workshop on Fault Tolerance for HPC at eXtreme Scale, Nov 2020, Atlanta / Virtual, United States. ⟨10.1109/FTXS51974.2020.00009⟩
Accès au texte intégral et bibtex
https://hal.science/hal-02970529/file/2020001221.pdf BibTex
titre
PARCOACH Extension for Static MPI Nonblocking and Persistent Communication Validation
auteur
Van-Man Nguyen, Emmanuelle Saillard, Julien Jaeger, Denis Barthou, Patrick Carribault
article
Correctness 2020: Fourth International Workshop on Software Correctness for HPC Applications, Nov 2020, Atlanta / Virtual, United States. ⟨10.1109/Correctness51934.2020.00009⟩
Accès au texte intégral et bibtex
https://cea.hal.science/cea-03014171/file/correctness_2020.pdf BibTex
titre
sOMP: Simulating OpenMP Task-Based Applications with NUMA Effects
auteur
Idriss Daoudi, Philippe Virouleau, Thierry Gautier, Samuel Thibault, Olivier Aumage
article
IWOMP 2020 – 16th International Workshop on OpenMP, Sep 2020, Austin / Virtual, United States. ⟨10.1007/978-3-030-58144-2_13⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02933803/file/p05_daoudi.pdf BibTex
titre
Feasibility of Whole-Heart Electrophysiological Models With Near-Cellular Resolution
auteur
Mark Potse, Emmanuelle Saillard, Denis Barthou, Yves Coudière
article
CinC 2020 – Computing in Cardiology, Sep 2020, Rimini / Virtual, Italy. ⟨10.22489/CinC.2020.126⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02943513/file/CinC2020-126.pdf BibTex
titre
MASA-StarPU: Parallel Sequence Comparison with Multiple Scheduling Policies and Pruning
auteur
Rafael Alvares da Silva Lopes, Samuel Thibault, Alba Cristina Magalhães Alves De Melo
article
SBAC-PAD 2020 – IEEE 32nd International Symposium on Computer Architecture and High Performance Computing, Sep 2020, Porto, Portugal. ⟨10.1109/SBAC-PAD49847.2020.00039⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02914793/file/lopes_rafael_paper25_sbacpad2020.pdf BibTex
titre
Using Dynamic Broadcasts to improve Task-Based Runtime Performances
auteur
Alexandre Denis, Emmanuel Jeannot, Philippe Swartvagher, Samuel Thibault
article
Euro-Par – 26th International European Conference on Parallel and Distributed Computing, Rzadca and Malawski, Aug 2020, Warsaw, Poland. ⟨10.1007/978-3-030-57675-2_28⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02872765/file/dynamic_broadcasts.pdf BibTex
titre
Automatic Code Motion to Extend MPI Nonblocking Overlap Window
auteur
Van-Man Nguyen, Emmanuelle Saillard, Julien Jaeger, Denis Barthou, Patrick Carribault
article
C3PO’20 Workshop – First Workshop on Compiler-Assisted Correctness Checking and Performance Optimization for HPC, Jun 2020, Frankfurt / Virtual, Germany. pp.43-54, ⟨10.1007/978-3-030-59851-8_4⟩
Accès au texte intégral et bibtex
https://cea.hal.science/cea-03010533/file/article.pdf BibTex
titre
Revisiting dynamic DAG scheduling under memory constraints for shared-memory platforms
auteur
Gabriel Bathie, Loris Marchal, Yves Robert, Samuel Thibault
article
IPDPS – 2020 – IEEE International Parallel and Distributed Processing Symposium Workshops, May 2020, New Orleans / Virtual, United States. pp.1-10, ⟨10.1109/IPDPSW50202.2020.00102⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03024626/file/apdcm.pdf BibTex
titre
Faithful Performance Prediction of a Dynamic Task-based Runtime System, an Opportunity for Task Graph Scheduling
auteur
Samuel Thibault, Luka Stanisic, Arnaud Legrand
article
SIAM PP 2020 – SIAM Conference on Parallel Processing for Scientific Computing, Feb 2020, Seattle, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02943753/file/20-02-15-siampp-seattle.pdf BibTex

Habilitation à diriger des recherches

titre
Instruments of Productivity for High Performance Computing
auteur
Olivier Aumage
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux (UB), France, 2020
Accès au texte intégral et bibtex
https://inria.hal.science/tel-03105625/file/hdr_oaumage.pdf BibTex

Reports

titre
Towards Resilient EU HPC Systems: A Blueprint
auteur
Petar Radojkovic, Manolis Marazakis, Paul Carpenter, Reiley Jeyapaul, Dimitris Gizopoulos, Martin Schulz, Adria Armejach, Eduard A Ayguade, François Bodin, Ramon Canal, Franck Cappello, Fabien Chaix, Guillaume Colin de Verdiere, Said Derradji, Stefano Di Carlo, Christian Engelmann, Ignacio Laguna, Miquel Moreto, Onur Mutlu, Lazaros Papadopoulos, Olly Perks, Manolis Ploumidis, Bezhad Salami, Yanos Sazeides, Dimitrios Soudris, Yiannis Sourdis, Per Stenstrom, Samuel Thibault, Will Toms, Osman Unsal
article
[Research Report] European HPC resilience initiative. 2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02922257/file/blueprint2020.pdf BibTex
titre
Revisiting dynamic DAG scheduling under memory constraints for shared-memory platforms
auteur
Gabriel Bathie, Loris Marchal, Yves Robert, Samuel Thibault
article
[Research Report] RR-9323, Inria. 2020
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02488399/file/rr9323.pdf BibTex

Theses

titre
Optimization and parallelization methods for software-defined radio
auteur
Adrien Cassagne
article
Networking and Internet Architecture [cs.NI]. Université de Bordeaux, 2020. English. ⟨NNT : 2020BORD0231⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-03118420/file/Cassagne2020%20-%20Optimization%20and%20Parallelization%20Methods%20for%20the%20Software-Defined%20Radio.pdf BibTex

Preprints, Working Papers, …

titre
EASYPAP: a Framework for Learning Parallel Programming
auteur
Alice Lasserre, Raymond Namyst, Pierre-André Wacrenier
article
2020
Accès au texte intégral et bibtex
https://hal.science/hal-02469919/file/edupar.pdf BibTex

2019

Journal articles

titre
AFF3CT: A Fast Forward Error Correction Toolbox!
auteur
Adrien Cassagne, Olivier Hartmann, Mathieu Leonardon, Kun He, Camille Leroux, Romain Tajan, Olivier Aumage, Denis Barthou, Thibaud Tonnellier, Vincent Pignoly, Bertrand Le Gal, Christophe Jego
article
SoftwareX, 2019, 10, pp.100345. ⟨10.1016/j.softx.2019.100345⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02358306/file/Cassagne2019a%20-%20AFF3CT%3A%20A%20Fast%20Forward%20Error%20Correction%20Toolbox.pdf BibTex
titre
Fast and Flexible Software Polar List Decoders
auteur
Mathieu Leonardon, Adrien Cassagne, Camille Leroux, Christophe Jego, Louis-Philippe Hamelin, Yvon Savaria
article
Journal of Signal Processing Systems, 2019, ⟨10.1007/s11265-018-1430-3⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01987848/file/Leonardon2017%20-%20Fast%20and%20Flexible%20Software%20Polar%20List%20Decoders.pdf BibTex
titre
Toward High-Performance Implementation of 5G SCMA Algorithms
auteur
Alireza Ghaffari, Mathieu Leonardon, Adrien Cassagne, Camille Leroux, Yvon Savaria
article
IEEE Access, 2019, 7, pp.10402-10414. ⟨10.1109/ACCESS.2019.2891597⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01977885/file/Ghaffari2019%20-%20Toward%20High%20Performance%20Implementation%20of%205G%20SCMA%20Algorithms.pdf BibTex

Conference papers

titre
Asynchronous Task-Based Execution of the Reverse Time Migration for the Oil and Gas Industry
auteur
Amani Alonazi, Hatem Ltaief, David Keyes, Issam Said, Samuel Thibault
article
CLUSTER 2019 – IEEE International Conference on Cluster Computing, Sep 2019, Albuquerque, United States. pp.1-11, ⟨10.1109/CLUSTER.2019.8891054⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02403109/file/2019_tbrtm_cluster.pdf BibTex
titre
Multi-Valued Expression Analysis for Collective Checking
auteur
Pierre Huchant, Emmanuelle Saillard, Denis Barthou, Patrick Carribault
article
EuroPar, Aug 2019, Göttingen, Germany
Accès au texte intégral et bibtex
https://hal.science/hal-02390025/file/article_EuroPar.pdf BibTex
titre
Analyse et Optimisations des Applications HPC à mémoire distribuée et globalement adressable
auteur
Tassadit Célia Aitkaci
article
COMPAS19 – Conférence d’informatique en Parallélisme, Architecture et Système, Jun 2019, Anglet, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02429482/file/ConferenceCompasTassadit_Aitkaci.pdf BibTex
titre
Tolérance aux pannes dans l’exécution distribuée de graphes de tâches
auteur
Romain Lion
article
COMPAS 2019 – Conférence d’informatique en Parallélisme, Architecture et Système, Jun 2019, Anglet, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02296118/file/Compas_Romain_LION_submitted_final.pdf BibTex
titre
Visual Performance Analysis of Memory Behavior in a Task-Based Runtime on Hybrid Platforms
auteur
Lucas Leandro Nesi, Samuel Thibault, Luka Stanisic, Lucas Mello Schnorr
article
CCGrid 2019 – 19thAnnual IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing, May 2019, Larnaca, Cyprus. pp.142-151, ⟨10.1109/CCGRID.2019.00025⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02275363/file/CCGRID_camera_ready.pdf BibTex

Master thesis

titre
Programmation des architectures hétérogènes à l’aide de tâches divisibles
auteur
Gwenolé Lucas
article
Calcul parallèle, distribué et partagé [cs.DC]. 2019
Accès au texte intégral et bibtex
https://inria.hal.science/hal-04088781/file/Rapport_PFE.pdf BibTex

Reports

titre
A Compiler Algorithm to Guide Runtime Scheduling
auteur
Christophe Alias, Samuel Thibault, Laure Gonnord
article
[Research Report] RR-9315, INRIA Grenoble; INRIA Bordeaux – Sud-Ouest. 2019
Accès au texte intégral et bibtex
https://inria.hal.science/hal-02421327/file/RR-9315.pdf BibTex
titre
A hierarchical fast direct solver for distributed memory machines with manycore nodes
auteur
Cédric Augonnet, David Goudin, Matthieu Kuhn, Xavier Lacoste, Raymond Namyst, Pierre Ramet
article
[Research Report] CEA/DAM; Total E&P; Université de Bordeaux. 2019
Accès au texte intégral et bibtex
https://cea.hal.science/cea-02304706/file/HMAT-CEA-RR.pdf BibTex

Theses

titre
Understanding and Guiding the Computing Resource Management in a Runtime Stacking Context
auteur
Arthur Loussert
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2019. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://inria.hal.science/tel-02438652/file/these.pdf BibTex
titre
Static Analysis and Dynamic Adaptation of Parallelism.
auteur
Pierre Huchant
article
Computer Science [cs]. Université de Bordeaux, 2019. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://inria.hal.science/tel-02429785/file/these.pdf BibTex

2018

Journal articles

titre
Resource aggregation for task-based Cholesky Factorization on top of modern architectures
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
Parallel Computing, 2018
Accès au bibtex
BibTex
titre
Fast Approximation Algorithms for Task-Based Runtime Systems
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
Concurrency and Computation: Practice and Experience, 2018, 30 (17), ⟨10.1002/cpe.4502⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01878606/file/heteroPrioApproxProofsJournal.pdf BibTex
titre
A Visual Performance Analysis Framework for Task-based Parallel Applications running on Hybrid Clusters
auteur
Vinicius Garcia Pinto, Lucas Mello Schnorr, Luka Stanisic, Arnaud Legrand, Samuel Thibault, Vincent Danjean
article
Concurrency and Computation: Practice and Experience, 2018, 30 (18), pp.1-31. ⟨10.1002/cpe.4472⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01616632/file/CCPE_article_submitted_2018_02_06.pdf BibTex

Conference papers

titre
PARCOACH Extension for a Full-Interprocedural Collectives Verification
auteur
Pierre Huchant, Emmanuelle Saillard, Denis Barthou, Hugo Brunie, Patrick Carribault
article
Second International Workshop on Software Correctness for HPC Applications, Nov 2018, Dallas, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01937316/file/correctness_2018.pdf BibTex
titre
Profile-Guided Scope-Based Data Allocation Method
auteur
Hugo Brunie, Julien Jaeger, Patrick Carribault, Denis Barthou
article
MEMSYS 2018 – International Symposium on Memory Systems, Oct 2018, Alexandria, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01897917/file/MemSys2018.pdf BibTex
titre
Adaptive Partitioning for Iterated Sequences of Irregular OpenCL Kernels
auteur
Pierre Huchant, Denis Barthou, Marie-Christine Counilh
article
SBAC-PAD – 30th International Symposium on Computer Architecture and High Performance Computing, Sep 2018, Lyon, France. ⟨10.1109/SBAC-PAD.2018.00051⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01888216/file/paper.pdf BibTex
titre
InKS, a Programming Model to Decouple Performance from Algorithm in HPC Codes
auteur
Ksander Ejjaaouani, Olivier Aumage, Julien Bigot, Michel Mehrenberger, Hitoshi Murai, Masahiro Nakao, Mitsuhisa Sato
article
Repara 2018 – 4th International Workshop on Reengineering for Parallelism in Heterogeneous Parallel Platforms, Aug 2018, Turin, Italy. pp.1-12, ⟨10.1007/978-3-030-10549-5_59⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01890132/file/papier.pdf BibTex
titre
Combining Task-based Parallelism and Adaptive Mesh Refinement Techniques in Molecular Dynamics Simulations
auteur
Raphaël Prat, Laurent Colombet, Raymond Namyst
article
ICPP18, International Conference on Parallel Processing., Aug 2018, Eugene, United States. ⟨10.1145/3225058.3225085⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01833266/file/paper_ICPP18.pdf BibTex
titre
Detecção de Anomalias de Desempenho em Aplicações de Alto Desempenho baseadas em Tarefas em Clusters Híbridos
auteur
Vinicius Garcia Pinto, Lucas Mello Schnorr, Arnaud Legrand, Samuel Thibault, Luka Stanisic, Vincent Danjean
article
WPerformance 2018 – 17º Workshop em Desempenho de Sistemas Computacionais e de Comunicação, Jul 2018, Natal, Brazil. pp.1-14
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01842038/file/181587_1.pdf BibTex
titre
EXA2PRO programming environment: Architecture and Applications
auteur
Dimitrios Soudris, Lazaros Papadopoulos, Christoph W Kessler, Dionysios D Kehagias, Athanasios Papadopoulos, Panos Seferlis, Alexander Chatzigeorgiou, Apostolos Ampatzoglou, Samuel Thibault, Raymond Namyst, Dirk Pleiter, Georgi Gaydadjiev, Tobias Becker, Matthieu Haefele
article
SAMOS 2018 – International Conference on Embedded Computer Systems: Architectures, MOdeling and Simulation, Jul 2018, Samos Island, Greece. pp.202-209, ⟨10.1145/3229631.3239369⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-03273509/file/3229631.3239369.pdf BibTex
titre
MIPP: a Portable C++ SIMD Wrapper and its use for Error Correction Coding in 5G Standard
auteur
Adrien Cassagne, Olivier Aumage, Denis Barthou, Camille Leroux, Christophe Jego
article
The 4th Workshop on Programming Models for SIMD/Vector Processing (WPMVP 2018), Feb 2018, Vienna, Austria. ⟨10.1145/3178433.3178435⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01888010/file/article.pdf BibTex
titre
Maximizing Communication Overlap with Dynamic Program Analysis
auteur
Emmanuelle Saillard, Koushik Sen, Wim Lavrijsen, Costin Iancu
article
International Conference on High Performance Computing in Asia-Pacific Region, Jan 2018, Tokyo, Japan
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01937407/file/paper.pdf BibTex

Habilitation à diriger des recherches

titre
On Runtime Systems for Task-based Programming on Heterogeneous Platforms
auteur
Samuel Thibault
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2018
Accès au texte intégral et bibtex
https://inria.hal.science/tel-01959127/file/hdr.pdf BibTex

2017

Journal articles

titre
Bridging the gap between OpenMP and task-based runtime systems for the fast multipole method
auteur
Emmanuel Agullo, Olivier Aumage, Bérenger Bramas, Olivier Coulaud, Samuel Pitoiset
article
IEEE Transactions on Parallel and Distributed Systems, 2017, pp.14. ⟨10.1109/TPDS.2017.2697857⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01517153/file/tpds_kstar_scalfmm_print.pdf BibTex
titre
Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
IEEE Transactions on Parallel and Distributed Systems, In press, ⟨10.1109/TPDS.2017.2766064⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01618526/file/tpds14.pdf BibTex

Conference papers

titre
Fast Simulation and Prototyping with AFF3CT
auteur
Adrien Cassagne, Olivier Hartmann, Mathieu Leonardon, Thibaud Tonnellier, Guillaume Delbergue, Camille Leroux, Romain Tajan, Bertrand Le Gal, Christophe Jego, Olivier Aumage, Denis Barthou
article
The 20th International Workshop on Signal Processing Systems (SiPS 2017), Oct 2017, Lorient, France. ⟨10.13140/RG.2.2.10295.42409/1⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01965633/file/Cassagne2017a%20-%20Fast%20Simulation%20and%20Prototyping%20with%20AFF3CT%20%5Babstract%5D.pdf BibTex
titre
Rewriting System for Profile-Guided Data Layout Transformations on Binaries
auteur
Olivier Aumage, Christopher Haine, Denis Barthou
article
Euro-Par 2017 – 23rd International European Conference on Parallel and Distributed Computing, https://europar2017.usc.es/, Aug 2017, Santiago de Compostela, Spain. pp.260-272, ⟨10.1007/978-3-319-64203-1_19⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01666179/file/europar17_binary_rewriting_system.pdf BibTex
titre
Characterizing the Performance of Modern Architectures Through Opaque Benchmarks: Pitfalls Learned the Hard Way
auteur
Luka Stanisic, Lucas Mello Schnorr, Augustin Degomme, Franz Heinrich, Arnaud Legrand, Brice Videau
article
IPDPS 2017 – 31st IEEE International Parallel & Distributed Processing Symposium (RepPar workshop), May 2017, Orlando, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01470399/file/IPDPS_REPPAR_2017_camera_ready.pdf BibTex
titre
Approximation Proofs of a Fast and Efficient List Scheduling Algorithm for Task-Based Runtime Systems on Multicores and GPUs
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS), May 2017, Orlando, United States. ⟨10.1109/IPDPS.2017.71⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01386174/file/heteroPrioApproxProofsRR.pdf BibTex
titre
Combining Both a Component Model and a Task-based Model for HPC Applications: a Feasibility Study on GYSELA
auteur
Olivier Aumage, Julien Bigot, Hélène Coullon, Christian Pérez, Jérôme Richard
article
17th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid)., May 2017, Madrid, Spain. ⟨10.1109/CCGRID.2017.88⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01518730/file/paper.pdf BibTex

Master thesis

titre
Critical resources management and scheduling under StarPU
auteur
Arthur Chevalier
article
Distributed, Parallel, and Cluster Computing [cs.DC]. 2017
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01718280/file/Memoire.pdf BibTex

Poster communications

titre
AFF3CT : Un environnement de simulation pour le codage de canal
auteur
Adrien Cassagne, Mathieu Leonardon, Olivier Hartmann, Thibaud Tonnellier, Guillaume Delbergue, Valentin Giraud, Camille Leroux, Romain Tajan, Bertrand Le Gal, Christophe Jego, Olivier Aumage, Denis Barthou
article
Le 12ème Colloque du GDR SoC/SiP, Jun 2017, Bordeaux, France. , ⟨10.13140/RG.2.2.13492.91520⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01965629/file/Cassagne2017%20-%20AFF3CT%20_%20Un%20environnement%20de%20simulation%20pour%20le%20codage%20de%20canal.pdf BibTex

Reports

titre
Task-based fast multipole method for clusters of multicore processors
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Martin Khannouz, Luka Stanisic
article
[Research Report] RR-8970, Inria Bordeaux Sud-Ouest. 2017, pp.15
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01387482/file/report-8970.pdf BibTex
titre
Modeling Irregular Kernels of Task-based codes: Illustration with the Fast Multipole Method
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Luka Stanisic, Samuel Thibault
article
[Research Report] RR-9036, INRIA Bordeaux. 2017, pp.35
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01474556/file/rapport.pdf BibTex

Software

titre
StarPU
auteur
Simon Archipoff, Cédric Augonnet, Olivier Aumage, Guillaume Beauchamp, Bérenger Bramas, Alfredo Buttari, Adrien Cassagne, Jérôme Clet-Ortega, Terry Cojean, Nicolas Collin, Vincent Danjean, Alexandre Denis, Lionel Eyraud-Dubois, Nathalie Furmento, Sylvain Henry, Andra Hugo, Mehdi Juhoor, Alexis Juven, Maël Keryell-Even, Yanis Khorsi, Thibaut Lambert, Erwan Leria, Benoît Lizé, Mariem Makni, Stojce Nakov, Raymond Namyst, Leandro Nesi Lucas, Pablo Joris, Damien Pasqualinotto, Samuel Pitoiset, Quôc-Dinh Nguyen, Cyril Roelandt, Chiheb Sakka, Corentin Salingue, Lucas Mello Schnorr, Marc Sergent, Anthony Simonet, Luka Stanisic, Bérangère Subervie, François Tessier, Samuel Thibault, Brice Videau, Leo Villeveygoux, Pierre-André Wacrenier
article
2017, ⟨swh:1:dir:b6e19d99449a78805e7a55a341fbaba2bc431973;origin=https://hal.archives-ouvertes.fr/hal-02443512;visit=swh:1:snp:c21d3dfbd96e4fb502c534e59644dba14c542100;anchor=swh:1:rev:31be198773f103324593d26369f135fbde5b97f8;path=/⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01730321/file/starpu-1.3.3.zip BibTex

Theses

titre
Scheduling of Dense Linear Algebra Kernels on Heterogeneous Resources
auteur
Suraj Kumar
article
Other [cs.OH]. Université de Bordeaux, 2017. English. ⟨NNT : 2017BORD0572⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01538516/file/KUMAR_SURAL_2017.pdf BibTex

Preprints, Working Papers, …

titre
InKS, a programming model to decouple performance from semantics in simulation codes
auteur
Olivier Aumage, Julien Bigot, Ksander Ejjaaouani, Michel Mehrenberger
article
2017
Accès au texte intégral et bibtex
https://cea.hal.science/cea-01493075/file/paper.pdf BibTex

2016

Conference papers

titre
Scheduling of Linear Algebra Kernels on Multiple Heterogeneous Resources
auteur
Olivier Beaumont, Terry Cojean, Lionel Eyraud-Dubois, Abdou Guermouche, Suraj Kumar
article
International Conference on High Performance Computing, Data, and Analytics (HiPC 2016), Dec 2016, Hyderabad, India. ⟨10.1109/HiPC.2016.045⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01361992/file/HiPC.pdf BibTex
titre
The StarPU Runtime System at Exascale ?
auteur
Terry Cojean
article
RESPA workshop at SC16, Nov 2016, Salt Lake City, Utah, United States
Accès au bibtex
BibTex
titre
Analyzing Dynamic Task-Based Applications on Hybrid Platforms: An Agile Scripting Approach
auteur
Vinicius Garcia Pinto, Luka Stanisic, Arnaud Legrand, Lucas Mello Schnorr, Samuel Thibault, Vincent Danjean
article
VPA 2016 – 3rd Workshop on Visual Performance Analysis, Nov 2016, Salt Lake City, United States. pp.17-24, ⟨10.1109/VPA.2016.008⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01353962/file/vpa2016-submitted.pdf BibTex
titre
Beyond Gbps Turbo Decoder on Multi-Core CPUs
auteur
Adrien Cassagne, Thibaud Tonnellier, Camille Leroux, Bertrand Le Gal, Olivier Aumage, Denis Barthou
article
The 10th International Symposium on Turbo Codes and Iterative Information Processing (ISTC 2016), Sep 2016, Brest, France. ⟨10.1109/ISTC.2016.7593092⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01363980/file/article.pdf BibTex
titre
Energy Consumption Analysis of Software Polar Decoders on Low Power Processors
auteur
Adrien Cassagne, Olivier Aumage, Camille Leroux, Denis Barthou, Bertrand Le Gal
article
The 24nd European Signal Processing Conference (EUSIPCO 2016), Aug 2016, Budapest, Hungary. ⟨10.1109/EUSIPCO.2016.7760327⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01363975/file/article.pdf BibTex
titre
Resource aggregation in task-based applications over accelerator-based multicore machines
auteur
Terry Cojean, Abdou Guermouche, Andra-Ecaterina Hugo, Raymond Namyst, Pierre-André Wacrenier
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France
Accès au bibtex
BibTex
titre
Resource aggregation for task-based Cholesky Factorization on top of heterogeneous machines
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01181135/file/papier%20%281%29.pdf BibTex
titre
Automatic OpenCL Task Adaptation for Heterogeneous Architectures
auteur
Pierre Huchant, Marie-Christine Counilh, Denis Barthou
article
Euro-Par, Aug 2016, Grenoble, France. pp.684 – 696, ⟨10.1007/978-3-319-43659-3_50⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01419366/file/Euro-Par_2016_paper_169.pdf BibTex
titre
Platform independent profiling of a QCD code
auteur
Marina Krstic Marinkovic, Luka Stanisic
article
Lattice 2016 – 34th annual International Symposium on Lattice Field Theory, Jul 2016, Southampton, United Kingdom. pp.1-7
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01474342/file/lattice2016.pdf BibTex
titre
Controlling the Memory Subscription of Distributed Applications with a Task-Based Runtime System
auteur
Marc Sergent, David Goudin, Samuel Thibault, Olivier Aumage
article
21st International Workshop on High-Level Parallel Programming Models and Supportive Environments, May 2016, Chicago, United States. ⟨10.1109/IPDPSW.2016.105⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01284004/file/PID4127657.pdf BibTex
titre
Are Static Schedules so Bad ? A Case Study on Cholesky Factorization
auteur
Emmanuel Agullo, Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2016), May 2016, Chicago, IL, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01223573/file/heteroprioCameraReady-ieeeCompatiable.pdf BibTex
titre
Controlling the Memory Subscription of Distributed Applications with a Task-Based Runtime System
auteur
Marc Sergent, David Goudin, Samuel Thibault, Olivier Aumage
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France. pp.318 – 327
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01380126/file/siampp.pdf BibTex
titre
Exploiting Two-Level Parallelism by Aggregating Computing Resources in Task-Based Applications Over Accelerator-Based Machines
auteur
Terry Cojean
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France
Accès au bibtex
BibTex
titre
A Stencil DSEL for Single Code Accelerated Computing with SYCL
auteur
Olivier Aumage, Denis Barthou, Alexandre Honorat
article
SYCL 2016 1st SYCL Programming Workshop during the 21st ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, Mar 2016, Barcelone, Spain
Accès au texte intégral et bibtex
https://hal.science/hal-01290099/file/main.pdf BibTex
titre
DKPN: A Composite Dataflow/Kahn Process Networks Execution Model
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Samuel Thibault
article
24th Euromicro International Conference on Parallel, Distributed and Network-based processing, Feb 2016, Heraklion Crete, Greece. ⟨10.1109/PDP.2016.34⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01234333/file/dkpn.pdf BibTex

Reports

titre
Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
[Research Report] RR-8927, Inria Bordeaux Sud-Ouest; Bordeaux INP; CNRS; Université de Bordeaux; CEA. 2016, pp.27
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01332774/file/RR-8927.pdf BibTex
titre
Bridging the gap between OpenMP 4.0 and native runtime systems for the fast multipole method
auteur
Emmanuel Agullo, Olivier Aumage, Berenger Bramas, Olivier Coulaud, Samuel Pitoiset
article
[Research Report] RR-8953, Inria. 2016, pp.49
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01372022/file/RR-8953.pdf BibTex

Theses

titre
Scalability of a task-based runtime system for dense linear algebra applications
auteur
Marc Sergent
article
Autre [cs.OH]. Université de Bordeaux, 2016. Français. ⟨NNT : 2016BORD0372⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01483666/file/SERGENT_MARC_2016.pdf BibTex
titre
Read Only Data Specific Management for an Energy Efficient Memory System
auteur
Gregory Vaumourin
article
Autre [cs.OH]. Université de Bordeaux, 2016. Français. ⟨NNT : 2016BORD0173⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01402354/file/VAUROURIN_GREGORY_2016.pdf BibTex

Preprints, Working Papers, …

titre
Resource aggregation for task-based Cholesky Factorization on top of modern architectures
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
2016
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01409965/file/submission.pdf BibTex

2015

Journal articles

titre
List Scheduling in Embedded Systems Under Memory Constraints
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Arthur Stoutchinin, Samuel Thibault
article
International Journal of Parallel Programming, 2015, 43 (6), pp.1103-1128. ⟨10.1007/s10766-014-0338-1⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01087067/file/ijpp.pdf BibTex
titre
Faithful Performance Prediction of a Dynamic Task-Based Runtime System for Heterogeneous Multi-Core Architectures
auteur
Luka Stanisic, Samuel Thibault, Arnaud Legrand, Brice Videau, Jean-François Méhaut
article
Concurrency and Computation: Practice and Experience, 2015, pp.16. ⟨10.1002/cpe.3555⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01147997/file/CCPE14_article.pdf BibTex
titre
L’accessibilité partout ! Retour d’expérience sous Debian
auteur
Samuel Thibault
article
Programmez !, 2015, 183
Accès au bibtex
BibTex

Conference papers

titre
SPAWN: An Iterative, Potentials-Based, Dynamic Scheduling and Partitioning Tool
auteur
Jean-Charles Papin, Christophe Denoual, Laurent Colombet, Raymond Namyst
article
SuperComputing’15 – RESPA Workshop, Nov 2015, Austin, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01223897/file/article.pdf BibTex
titre
Towards seismic wave modeling on heterogeneous many-core architectures using task-based runtime system
auteur
Víctor Martínez, David Michéa, Fabrice Dupros, Olivier Aumage, Samuel Thibault, Hideo Aochi, Philippe Olivier Alexandre Navaux
article
27th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), Oct 2015, Florianopolis, Brazil. ⟨10.1109/SBAC-PAD.2015.33⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01182746/file/sbac2015_soumission.pdf BibTex
titre
Correctness Analysis of MPI-3 Non-Blocking Communications in PARCOACH
auteur
Julien Jaeger, Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
European MPI Users’ Group Meeting , Sep 2015, Bordeaux, France. ⟨10.1145/1235⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01252321/file/EuroMPI_JSCB.pdf BibTex
titre
An Efficient, Portable and Generic Library for Successive Cancellation Decoding of Polar Codes
auteur
Adrien Cassagne, Bertrand Le Gal, Camille Leroux, Olivier Aumage, Denis Barthou
article
The 28th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2015), Sep 2015, Raleigh, United States. ⟨10.1007/978-3-319-29778-1_19⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01203105/file/polar_lcpc_2015.pdf BibTex
titre
PARCOACH Extension for Hybrid Applications with Interprocedural Analysis
auteur
Emmanuelle Saillard, Hugo Brunie, Patrick Carribault, Denis Barthou
article
9th International Workshop on Parallel Tools for High Performance Computing, Sep 2015, Dresden, Germany. pp.135 – 146, ⟨10.1007/978-3-319-39589-0_11⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01420655/file/parcoach_9thPTW%20%281%29.pdf BibTex
titre
Automatic OpenCL code generation for multi-device heterogeneous architectures
auteur
Pei Li, Elisabeth Brunet, François Trahay, Christian Parrot, Gaël Thomas, Raymond Namyst
article
ICPP 2015 : 44th International Conference on Parallel Processing, Sep 2015, Beijing, China. pp.959 – 968, ⟨10.1109/ICPP.2015.105⟩
Accès au bibtex
BibTex
titre
Bridging the Gap between Performance and Bounds of Cholesky Factorization on Heterogeneous Platforms
auteur
Emmanuel Agullo, Olivier Beaumont, Lionel Eyraud-Dubois, Julien Herrmann, Suraj Kumar, Loris Marchal, Samuel Thibault
article
Heterogeneity in Computing Workshop 2015, May 2015, Hyderabad, India. ⟨10.1109/IPDPSW.2015.35⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01120507/file/Camera_ready.pdf BibTex
titre
pioman: a pthread-based Multithreaded Communication Engine
auteur
Alexandre Denis
article
Euromicro International Conference on Parallel, Distributed and Network-based Processing, Mar 2015, Turku, Finland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01087775/file/final.pdf BibTex

Theses

titre
Unified system of code transformation and execution for heterogeneous multi-core architectures.
auteur
Pei Li
article
Other [cs.OH]. Université de Bordeaux, 2015. English. ⟨NNT : 2015BORD0441⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01342119/file/LI_PEI-2015.pdf BibTex
titre
Scheduling of dynamic streaming applications on hybrid embedded MPSoCs comprising programmable computing units and hardware accelerators
auteur
Paul-Antoine Arras
article
Architectures Matérielles [cs.AR]. Université de Bordeaux, 2015. Français. ⟨NNT : 2015BORD0031⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-01159519/file/ARRAS_PAUL-ANTOINE_2015.pdf BibTex

2014

Journal articles

titre
Il y a une emprise plus grande du politique sur la vie administrative
auteur
Luc Rouban, Bruno Botella, Sylvain Henry
article
Acteurs Publics, 2014, 105, pp.9 – 12
Accès au bibtex
BibTex
titre
Composing multiple StarPU applications over heterogeneous machines: A supervised approach
auteur
Andra Hugo, Abdou Guermouche, Pierre-André Wacrenier, Raymond Namyst
article
International Journal of High Performance Computing Applications, 2014, 28, pp.285 – 300. ⟨10.1177/1094342014527575⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01101045/file/article.pdf BibTex
titre
Process Placement in Multicore Clusters: Algorithmic Issues and Practical Techniques
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
IEEE Transactions on Parallel and Distributed Systems, 2014, 25 (4), pp.993 – 1002. ⟨10.1109/TPDS.2013.104⟩
Accès au bibtex
BibTex
titre
PARCOACH: Combining static and dynamic validation of MPI collective communications
auteur
Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
International Journal of High Performance Computing Applications, 2014, pp.10.1177/1094342014552204. ⟨10.1177/1094342014552204⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01078762/file/PARCOACH.pdf BibTex

Conference papers

titre
Specific Read Only Data Management for Memory Hierarchy Optimization
auteur
Gregory Vaumourin, Dombek Thomas, Guerre Alexandre, Denis Barthou
article
EWiLi 2014 – Workshop Embed With Linux, Nov 2014, Lisboa, Portugal. pp.Session 2
Accès au texte intégral et bibtex
https://hal.science/hal-01090218/file/ewili14_submission_15.pdf BibTex
titre
MBSPDiscover: An Automatic Benchmark for MultiBSP Performance Analysis
auteur
Marcelo Alaniz, Sergio Nesmachnow, Brice Goglin, Santiago Iturriaga, Veronica Gil Costa, Marcela Printista
article
First HPCLATAM – CLCAR Joint Latin American High Performance Computing Conference, Oct 2014, Valparaiso, Chile. pp.158-172
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01062528/file/MultiBSP-Benchmark.pdf BibTex
titre
Static Validation of Barriers and Worksharing Constructs in OpenMP Applications
auteur
Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
IWOMP, Sep 2014, Salvador, Brazil. pp.73 – 86, ⟨10.1007/978-3-319-11454-5_6⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01078759/file/Parcoach.pdf BibTex
titre
Evaluation of OpenMP Dependent Tasks with the KASTORS Benchmark Suite
auteur
Philippe Virouleau, Pierrick Brunet, François Broquedis, Nathalie Furmento, Samuel Thibault, Olivier Aumage, Thierry Gautier
article
10th International Workshop on OpenMP, IWOMP2014, Sep 2014, Salvador, Brazil. pp.16 – 29, ⟨10.1007/978-3-319-11454-5_2⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01081974/file/iwomp2014.pdf BibTex
titre
pioman: a Generic Framework for Asynchronous Progression and Multithreaded Communications
auteur
Alexandre Denis
article
IEEE International Conference on Cluster Computing (IEEE Cluster), Sep 2014, Madrid, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01064652/file/finale-short.pdf BibTex
titre
Exploring and Evaluating Array Layout Restructuration for SIMDization
auteur
Christopher Haine, Olivier Aumage, Petit Enguerrand, Denis Barthou
article
The 27th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2014), Intel Corporation, Sep 2014, Hillsboro, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01070467/file/article_lcpc_2014.pdf BibTex
titre
netloc: Towards a Comprehensive View of the HPC System Topology
auteur
Brice Goglin, Joshua Hursey, Jeffrey M. Squyres
article
Fifth International Workshop on Parallel Software Tools and Tool Infrastructures (PSTI 2014), Sep 2014, Minneapolis, United States. ⟨10.1109/ICPPW.2014.38⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01010599/file/article.pdf BibTex
titre
A runtime approach to dynamic resource allocation for sparse direct solvers
auteur
A.-E Hugo, A Guermouche, P.-A Wacrenier, R Namyst
article
43rd International Conference on Parallel Processing, Sep 2014, Minneapolis, United States. ⟨10.1109/ICPP.2014.57⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01101054/file/AHugo.pdf BibTex
titre
Modeling and Simulation of a Dynamic Task-Based Runtime System for Heterogeneous Multi-Core Architectures
auteur
Luka Stanisic, Samuel Thibault, Arnaud Legrand, Brice Videau, Jean-François Méhaut
article
Euro-par – 20th International Conference on Parallel Processing, Aug 2014, Porto, Portugal. pp.50-62, ⟨10.1007/978-3-319-09873-9_5⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01011633/file/StarPUSG_article.pdf BibTex
titre
Dynamic Load Balancing with Pair Potentials
auteur
Jean-Charles Papin, Christophe Denoual, Laurent Colombet, Raymond Namyst
article
Euro-Par 2014 International Workshops, Luis Lopez, Aug 2014, Porto, Portugal. pp.462–473, ⟨10.1007/978-3-319-14313-2_39⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01223876/file/article.pdf BibTex
titre
Toward OpenCL Automatic Multi-Device Support
auteur
Sylvain Henry, Alexandre Denis, Denis Barthou, Marie-Christine Counilh, Raymond Namyst
article
Euro-Par 2014, Aug 2014, Porto, Portugal
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01005765/file/final.pdf BibTex
titre
SPAGHETtI: Scheduling/Placement Approach for Task-Graphs on HETerogeneous archItecture
auteur
Denis Barthou, Emmanuel Jeannot
article
Euro-Par, Aug 2014, Lisboa, Portugal. pp.174 – 185, ⟨10.1007/978-3-319-09873-9_15⟩
Accès au texte intégral et bibtex
https://hal.science/hal-01100948/file/barthou_jeannot.pdf BibTex
titre
A Benchmark-based Performance Model for Memory-bound HPC Applications
auteur
Bertrand Putigny, Brice Goglin, Denis Barthou
article
International Conference on High Performance Computing & Simulation (HPCS 2014), Jul 2014, Bologna, Italy. ⟨10.1109/HPCSim.2014.6903790⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00985598/file/benchmark_based_memory_model.pdf BibTex
titre
Managing the Topology of Heterogeneous Cluster Nodes with Hardware Locality (hwloc)
auteur
Brice Goglin
article
International Conference on High Performance Computing & Simulation (HPCS 2014), Jul 2014, Bologna, Italy. ⟨10.1109/HPCSim.2014.6903671⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00985096/file/article.pdf BibTex
titre
Harnessing clusters of hybrid nodes with a sequential task-based programming model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
International Workshop on Parallel Matrix Algorithms and Applications (PMAA 2014), Jul 2014, Lugano, Switzerland
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01283949/file/pmaa14.pdf BibTex
titre
Matching communication pattern with underlying hardware architecture
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
6th European Conference on Computational Fluid Dynamics, Jul 2014, Barcelona, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01087611/file/A4286.pdf BibTex
titre
Analysis of MPI Shared-Memory Communication Performance from a Cache Coherence Perspective
auteur
Bertrand Putigny, Benoit Ruelle, Brice Goglin
article
PDSEC – The 15th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing, held in conjunction with IPDPS, May 2014, Phoenix, AZ, United States. ⟨10.1109/IPDPSW.2014.139⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00956307/file/article.pdf BibTex
titre
Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet, Samuel Thibault, George Bosilca
article
HCW’2014 workshop of IPDPS, May 2014, Phoenix, United States. pp.29-38, ⟨10.1109/IPDPSW.2014.9⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00987094/file/sparsegpus.pdf BibTex
titre
Modulariser les ordonnanceurs de tâches : une approche structurelle
auteur
Marc Sergent, Simon Archipoff
article
ComPAS 2014 : conférence en parallélisme, architecture et systèmes, Apr 2014, Neuchâtel, Suisse
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00978364/file/ordonnanceurs_modulaires.pdf BibTex
titre
Overview of Distributed Linear Algebra on Hybrid Nodes over the StarPU Runtime
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2014), Feb 2014, Portland, Oregon, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00978602/file/siampp14.pdf BibTex

Book sections

titre
An Overview of Process Mapping Techniques and Algorithms in High-Performance Computing
auteur
Torsten Hoefler, Emmanuel Jeannot, Guillaume Mercier
article
Emmanuel Jeannot and Julius Zilinskas. High Performance Computing on Complex Environments, Wiley, pp.75-94, 2014, 978-1-118-71205-4
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921626/file/Chapter_5.pdf BibTex
titre
DSL Stream Programming on Multicore Architectures
auteur
Pablo de Oliveira Castro, Stéphane Louise, Denis Barthou
article
Programming multi-core and many-core computing systems, John Wiley and Sons, chapter 12, 2014, 978-0-470-93690-0. ⟨10.1002/9781119332015.ch7⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00952318/file/dsl-preprint11.pdf BibTex

Habilitation à diriger des recherches

titre
Towards generic Communication Mechanisms and better Affinity Management in Clusters of Hierarchical Nodes
auteur
Brice Goglin
article
Calcul parallèle, distribué et partagé [cs.DC]. Université de Bordeaux, 2014
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00979512/file/hdr.pdf BibTex

Books

titre
Euro-Par 2014: Parallel Processing Workshops, Part II
auteur
Luis Lopez, Julius Zilinskas, Alexandru Costan, Roberto Gioacchino Cascella, Gabor Kecskemeti, Emmanuel Jeannot, Mario Cannataro, Laura Ricci, Siegfried Benkner, Salvador Petit, Vittorio Scarano, José Gracia, Sascha Hunold, Stephen L. Scott, Stefan Lankes, Christian Lengauer, Jesus Carretero, Jens Breitbart, Michael Alexander
article
Springer, 8806, 2014, Lecture Note In Computer Science, 978-3-319-14312-5
Accès au bibtex
BibTex
titre
Euro-Par 2014: Parallel Processing Workshops, Part I
auteur
Luis Lopez, Julius Zilinskas, Alexandru Costan, Roberto Gioacchino Cascella, Gabor Kecskemeti, Emmanuel Jeannot, Mario Cannataro, Laura Ricci, Siegfried Benkner, Salvador Petit, Vittorio Scarano, José Gracia, Sascha Hunold, Stephen L. Scott, Stefan Lankes, Christian Lengauer, Jesus Carretero, Jens Breitbart, Michael Alexander
article
Springer, 8805, 2014, Lecture Note In Computer Science, 978-3-319-14312-5
Accès au bibtex
BibTex
titre
High Performance Computing on Complex Environments
auteur
Emmanuel Jeannot, Julius Žilinskas
article
Emmanuel Jeannot and Julius Žilinskas. Wiley, pp.512, 2014, 978-1-118-71205-4
Accès au bibtex
BibTex

Reports

titre
Programming Abstractions for Data Locality
auteur
Adrian Tate, Amir Kamil, Anshu Dubey, Armin Grösslinger, Brad Chamberlain, Brice Goglin, Carter Edwards, Chris J. Newburn, David Padua, Didem Unat, Emmanuel Jeannot, Frank Hannig, Tobias Gysi, Hatem Ltaief, James Sexton, Jesus Labarta, John Shalf, Karl Fürlinger, Kathryn O’brien, Leonidas Linardakis, Maciej Besta, Marie-Christine Sawley, Mark Abraham, Mauro Bianco, Miquel Pericàs, Naoya Maruyama, Paul H. J. Kelly, Peter Messmer, Robert B. Ross, Romain Cledat, Satoshi Matsuoka, Thomas Schulthess, Torsten Hoefler, Vitus J. Leung
article
[Research Report] PADAL Workshop 2014, April 28–29, Swiss National Supercomputing Center (CSCS), Lugano, Switzerland. 2014, pp.54
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01083080/file/PADAL-report.pdf BibTex
titre
StarPU-MPI: Task Programming over Clusters of Machines Enhanced with Accelerators
auteur
Cédric Augonnet, Olivier Aumage, Nathalie Furmento, Samuel Thibault, Raymond Namyst
article
[Research Report] RR-8538, INRIA. 2014
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00992208/file/RR-8538.pdf BibTex
titre
Modeling and Simulation of a Dynamic Task-Based Runtime System for Heterogeneous Multi-Core Architectures
auteur
Luka Stanisic, Samuel Thibault, Arnaud Legrand, Brice Videau, Jean-François Méhaut
article
[Research Report] RR-8509, INRIA. 2014
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00966862/file/RR-8509.pdf BibTex
titre
Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet, Samuel Thibault, George Bosilca
article
[Research Report] RR-8446, INRIA. 2014, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00925017/file/RR-8446.pdf BibTex

Theses

titre
Benchmark-driven approaches to performance modeling of multi-core architectures
auteur
Bertrand Putigny
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2014. English. ⟨NNT : 2014BORD0155⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00984791/file/PUTIGNY_BERTRAND_2014.pdf BibTex

2013

Journal articles

titre
Les réseaux pour le calcul haute performance : facteur, livreur ou déménageur ?
auteur
Brice Goglin
article
Interstices, 2013
Accès au bibtex
BibTex
titre
Accessibility Out of the Box
auteur
Samuel Thibault, Sébastien Hinderer
article
Communications of the ACM, 2013, 56 (7), pp.8. ⟨10.1145/2483852.2483856⟩
Accès au bibtex
BibTex
titre
Idée reçue: Comparer la puissance de deux ordinateurs, c’est facile !
auteur
Brice Goglin, Bertrand Putigny
article
Interstices, 2013, pp.1
Accès au bibtex
BibTex
titre
KNEM: a Generic and Scalable Kernel-Assisted Intra-node MPI Communication Framework
auteur
Brice Goglin, Stéphanie Moreaud
article
Journal of Parallel and Distributed Computing, 2013, 73 (2), pp.176-188. ⟨10.1016/j.jpdc.2012.09.016⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00731714/file/article.pdf BibTex
titre
Symbolic Mapping and Allocation for the Cholesky Factorization on NUMA machines: Results and Optimizations
auteur
Emmanuel Jeannot
article
International Journal of High Performance Computing Applications, 2013, 27 (3), pp.283–290
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00921611/file/jeannot.pdf BibTex

Conference papers

titre
Adaptive Task Size Control on High Level Programming for GPU/CPU Work Sharing
auteur
Tetsuya Odajima, Taisuke Boku, Mitsuhisa Sato, Toshihiro Hanawa, Yuetsu Kodama, Raymond Namyst, Samuel Thibault, Olivier Aumage
article
The 2013 International Symposium on Advances of Distributed and Parallel Computing (ADPC 2013), Dec 2013, Vietri sul Mare, Italy. ⟨10.1007/978-3-319-03889-6_7⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00920915/file/ADPC2013-117.pdf BibTex
titre
MIL : A language to build program analysis tools through static binary instrumentation
auteur
Andres Charif-Rubial, Denis Barthou, Cédric Valensi, Shende Sameer, Allen Malony, William Jalby
article
High Performance Computing, Dec 2013, India. pp. 206-215
Accès au texte intégral et bibtex
https://hal.science/hal-00920875/file/MIL_HiPC13.pdf BibTex
titre
High-performance code generation for stencil computations on heterogeneous multi-device architectures
auteur
Pei Li, Elisabeth Brunet, Raymond Namyst
article
HPPC 2013 – 15th IEEE International Conference on High Performance Computing and Communications, Nov 2013, Zhangjiajie, China
Accès au bibtex
BibTex
titre
High Performance Code Generation for Stencil Computation on Heterogeneous Multi-device Architectures
auteur
Pei Li, Elisabeth Brunet, Raymond Namyst
article
HPCC 2013 – 15th IEEE International Conference on High Performance Computing and Communications, Nov 2013, Zhangjiajie, China
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00925481/file/HPCC2013.pdf BibTex
titre
List Scheduling in Embedded Systems under Memory Constraints
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Arthur Stoutchinin, Samuel Thibault
article
SBAC-PAD’2013 – 25th International Symposium on Computer Architecture and High-Performance Computing, Federal University of Pernambuco & Federal University of Minas Gerais, Oct 2013, Porto de Galinhas, Brazil. pp.152-159, ⟨10.1109/SBAC-PAD.2013.22⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00906117/file/sbac13_checked_by_PDF_eXpress_.pdf BibTex
titre
Detecting SIMDization Opportunities through Static/Dynamic Dependence Analysis
auteur
Olivier Aumage, Denis Barthou, Christopher Haine, Tamara Meunier
article
PROPER – 6th Workshop on Productivity and Performance – 2013, Sep 2013, Aachen, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00858004/file/proper_2013_paper_17_camera_ready.pdf BibTex
titre
Communication and Topology-aware Load Balancing in Charm++ with TreeMatch
auteur
Emmanuel Jeannot, Esteban Meneses, Guillaume Mercier, François Tessier, Gengbin Zheng
article
IEEE Cluster 2013, Sep 2013, Indianapolis, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00851148/file/publi.pdf BibTex
titre
ViperVM: a Runtime System for Parallel Functional High-Performance Computing on Heterogeneous Architectures
auteur
Sylvain Henry
article
2nd Workshop on Functional High-Performance Computing (FHPC’13), Sep 2013, Boston, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00851122/file/fhpc13.pdf BibTex
titre
Combining Static and Dynamic Validation of MPI Collective Communication
auteur
Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
EuroMPI 2013 – 20th European MPI Users’ Group Meeting, Sep 2013, Madrid, Spain. pp.117-122, ⟨10.1145/2488551.2488555⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00920901/file/sigproc-sp.pdf BibTex
titre
Towards exascale with the ANR-JST japanese-french project FP3C (Framework and Programming for Post- Petascale Computing)
auteur
Gabriel Antoniu, Taisuke Boku, Christophe Calvin, Philippe Codognet, Michel Daydé, Nahid Emad, Yuyaka Ishikawa, Satoshi Matsuoka, Kengo Nakajima, Hiroshi Nakashima, Raymond Namyst, Serge Petiton, Tetsuya Sakurai, Mitsuhisa Sato
article
9th International Conference on Computer Science and Information Technologies, Sep 2013, Yerevan, Armenia
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00922754/file/FP3C-CSIT13-v3.pdf BibTex
titre
Dynamic Thread Pinning for Phase-Based OpenMP Programs
auteur
Abdelhafid Mazouz, Sid Touati, Denis Barthou
article
The Euro-Par 2013 conference, Aug 2013, Aachen, Germany. pp.53-64, ⟨10.1007/978-3-642-40047-6_8⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00847482/file/MainEuroPar2013.pdf BibTex
titre
Automated Code Generation for Lattice Quantum Chromodynamics and beyond
auteur
Denis Barthou, Olivier Brand-Foissac, Olivier Pene, Gilbert Grosdidier, Romain Dolbeau, Christine Eisenbeis, Michael Kruse, Konstantin Petrov, Claude Tadonki
article
25th IUPAP Conference on Computational Physics (CCP2013), Aug 2013, Moscow, Russia. pp.012005, ⟨10.1088/1742-6596/510/1/012005⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00926513/file/qiral.pdf BibTex
titre
A NUMA-aware fine grain parallelization framework for multi-core architecture
auteur
Corentin Rossignon, Hénon Pascal, Olivier Aumage, Samuel Thibault
article
PDSEC – 14th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing – 2013, May 2013, Boston, United States. ⟨10.1109/IPDPSW.2013.204⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00858350/file/taggre_pdsec_2013.pdf BibTex
titre
Composing multiple StarPU applications over heterogeneous machines: a supervised approach
auteur
Andra-Ecaterina Hugo, Abdou Guermouche, Raymond Namyst, Pierre-André Wacrenier
article
Third International Workshop on Accelerators and Hybrid Exascale Systems, May 2013, Boston, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00824514/file/PID2692011.pdf BibTex
titre
Implementation of FEM Application on GPU with StarPU
auteur
Satoshi Ohshima, Satoshi Katagiri, Kengo Nakajima, Samuel Thibault, Raymond Namyst
article
SIAM CSE13 – SIAM Conference on Computational Science and Engineering 2013, SIAM, Feb 2013, Boston, United States
Accès au bibtex
BibTex
titre
Hydra: Automatic algorithm exploration from linear algebra equations
auteur
Alexandre Duchâteau, David A. Padua, Denis Barthou
article
Code Generation and Optimization, Feb 2013, Shenzhen, China. pp.1-10
Accès au texte intégral et bibtex
https://hal.science/hal-00920869/file/paper.pdf BibTex
titre
Ordonnancement de liste dans les systèmes embarqués sous contrainte de mémoire
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Arthur Stoutchinin, Samuel Thibault
article
ComPAS’13 / RenPar’21 – 21es Rencontres francophones du Parallélisme, Inria Grenoble, Jan 2013, Grenoble, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772854/file/renpar.pdf BibTex
titre
TreeMatch : Un algorithme de placement de processus sur architectures multicœurs
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
RenPAR – 21e Rencontres Francophones du Parallélisme, Jan 2013, Grenoble, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00773254/file/publi.pdf BibTex
titre
Le problème de la composition parallèle : une approche supervisée
auteur
Andra-Ecaterina Hugo
article
RenPAR – 21e Rencontres Francophones du Parallélisme (2013), Jan 2013, Grenoble, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00773610/file/AH_Composabilite_Renpar.pdf BibTex
titre
Optimisation du produit matrice-vecteur creux sur architecture GPU pour un simulateur de réservoir
auteur
Corentin Rossignon
article
ComPAS’13 / RenPar’21 – 21es Rencontres francophones du Parallélisme, Inria Grenoble, Jan 2013, Grenoble, France
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00773571/file/solver_gpu.pdf BibTex

Book sections

titre
Adding Virtualization Capabilities to the Grid’5000 Testbed
auteur
Daniel Balouek, Alexandra Carpen-Amarie, Ghislain Charrier, Frédéric Desprez, Emmanuel Jeannot, Emmanuel Jeanvoine, Adrien Lebre, David Margery, Nicolas Niclausse, Lucas Nussbaum, Olivier Richard, Christian Pérez, Flavien Quesnel, Cyril Rohr, Luc Sarzyniec
article
Ivanov, IvanI. and Sinderen, Marten and Leymann, Frank and Shan, Tony. Cloud Computing and Services Science, 367, Springer International Publishing, pp.3-20, 2013, Communications in Computer and Information Science, 978-3-319-04518-4. ⟨10.1007/978-3-319-04519-1_1⟩
Accès au bibtex
BibTex

Master thesis

titre
Support exécutif scalable pour les architectures hybrides distribuées
auteur
Marc Sergent
article
Informatique [cs]. 2013
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01284235/file/Memoire-Master2-fr_FR.pdf BibTex

Reports

titre
Automated Code Generation for Lattice QCD Simulation
auteur
Denis Barthou, Gilbert Grosdidier, Konstantin Petrov, Michael Kruse, Christine Eisenbeis, Olivier Pène, Olivier Brand-Foissac, Claude Tadonki, Romain Dolbeau
article
[Research Report] RR-8417, INRIA. 2013, pp.13
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00918812/file/RR-8417.pdf BibTex
titre
SOCL: An OpenCL Implementation with Automatic Multi-Device Adaptation Support
auteur
Sylvain Henry, Denis Barthou, Alexandre Denis, Raymond Namyst, Marie-Christine Counilh
article
[Research Report] RR-8346, INRIA. 2013, pp.18
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00853423/file/RR-8346.pdf BibTex
titre
C Language Extensions for Hybrid CPU/GPU Programming with StarPU
auteur
Ludovic Courtès
article
[Research Report] RR-8278, INRIA. 2013, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00807033/file/RR-8278.pdf BibTex
titre
Médiation Scientifique : une facette de nos métiers de la recherche
auteur
Antoine Rousseau, Aurélie Darnaud, Brice Goglin, Céline Acharian, Christine Leininger, Christophe Godin, Clarisse Holik, Claude Kirchner, Diane Rives, Elodie Darquie, Erwan Kerrien, Fabrice Neyret, Florent Masseglia, Florian Dufour, Gérard Berry, Gilles Dowek, Hélène Robak, Hélène Xypas, Irina Illina, Isabelle Gnaedig, Joanna Jongwane, Jocelyne Ehrel, Laurent Viennot, Laure Guion, Lisette Calderan, Lola Kovacic, Marie Collin, Marie-Agnès Enard, Marie-Hélène Comte, Martin Quinson, Martine Olivi, Mathieu Giraud, Mathilde Dorémus, Mia Ogouchi, Muriel Droin, Nathalie Lacaux, Nicolas P. Rougier, Nicolas Roussel, Pascal Guitton, Pierre Peterlongo, Rose-Marie Cornus, Simon Vandermeersch, Sophie Maheo, Sylvain Lefebvre, Sylvie Boldo, Thierry Viéville, Véronique Poirel, Aline Chabreuil, Arnaud Fischer, Claude Farge, Claude Vadel, Isabelle Astic, Jean-Pierre Dumont, Loic Féjoz, Patrick Rambert, Pierre Paradinas, Sophie de Quatrebarbes, Stéphane Laurent
article
[Interne] Inria. 2013, pp.34
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00804915/file/Mediation-scientifique-v0.2.pdf BibTex
titre
Process Placement in Multicore Clusters: Algorithmic Issues and Practical Techniques
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
[Research Report] RR-8269, INRIA. 2013, pp.32
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00803548/file/RR-8269.pdf BibTex

Theses

titre
Programming Models and Runtime Systems for Heterogeneous Architectures
auteur
Sylvain Henry
article
Other [cs.OH]. Université Sciences et Technologies – Bordeaux I, 2013. English. ⟨NNT : 2013BOR14899⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00948309/file/HENRY_SYLVAIN_2013.pdf BibTex

2012

Journal articles

titre
Reliability of task graph schedules with transient and fail-stop failures: complexity and algorithms
auteur
Anne Benoit, Louis-Claude Canon, Emmanuel Jeannot, Yves Robert
article
Journal of Scheduling, 2012, 15 (5), pp.615-627. ⟨10.1007/s10951-011-0236-y⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00653477/file/JoS_rev1.pdf BibTex
titre
Programmation unifiée multi-accélérateur OpenCL
auteur
Henry Sylvain, Alexandre Denis, Denis Barthou
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2012, 31 (8-9-10), pp.1233-1249. ⟨10.3166/TSI.31.1233-1249⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772742/file/SOCL_TSI2011.pdf BibTex
titre
Traitements d’Images sur Architectures Parallèles et Hétérogènes
auteur
Sidi Ahmed Mahmoudi, Pierre Manneback, Cédric Augonnet, Samuel Thibault
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2012, ⟨10.3166/tsi.31.1183-1203⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00714858/file/Traitement%20dIimages%20sur%20Architectures%20Parall%C3%A8les%20et%20H%C3%A9t%C3%A9rog%C3%A8nes.PDF BibTex
titre
Optimizing performance and reliability on heterogeneous parallel systems: Approximation algorithms and heuristics
auteur
Emmanuel Jeannot, Erik Saule, Denis Trystram
article
Journal of Parallel and Distributed Computing, 2012, 72 (2), pp.268-280
Accès au bibtex
BibTex

Conference papers

titre
Automatic efficient data layout for multithreaded stencil codes on CPUs and GPUs
auteur
Julien Jaeger, Denis Barthou
article
High Performance Computing conference, Dec 2012, India. pp.1-10
Accès au texte intégral et bibtex
https://hal.science/hal-00793201/file/Jaeger_Barthou_hipc2012.pdf BibTex
titre
Performance Analysis and Optimization of the Tiled Cholesky Factorization on NUMA Machines
auteur
Emmanuel Jeannot
article
PAAP 2012 – IEEE International Symposium on Parallel Architectures, Algorithms and Programming, Dec 2012, Taipei, Taiwan
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00772790/file/jeannot.pdf BibTex
titre
High performance checksum computation for fault-tolerant MPI over InfiniBand
auteur
Alexandre Denis, François Trahay, Yutaka Ishikawa
article
the 19th European MPI Users’ Group Meeting (EuroMPI 2012), Sep 2012, Vienna, Austria
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00716478/file/final.pdf BibTex
titre
Parallelization on Heterogeneous Multicore and Multi-GPU Systems of the Fast Multipole Method for the Helmholtz Equation Using a Runtime System
auteur
Cyril Bordage
article
ADVCIMP12, Sep 2012, Barcelone, Spain. pp.90-95
Accès au bibtex
BibTex
titre
StarPU-MPI: Task Programming over Clusters of Machines Enhanced with Accelerators
auteur
Cédric Augonnet, Olivier Aumage, Nathalie Furmento, Raymond Namyst, Samuel Thibault
article
EuroMPI 2012 – The 19th European MPI Users’ Group Meeting, Sep 2012, Vienna, Austria
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00725477/file/starpu_mpi_poster.pdf BibTex
titre
High-Level Support for Pipeline Parallelism on Many-Core Architectures
auteur
Siegfried Benkner, Enes Bajrovic, Erich Marth, Martin Sandrieser, Raymond Namyst, Samuel Thibault
article
Europar – International European Conference on Parallel and Distributed Computing – 2012, Aug 2012, Rhodes Island, Greece. ⟨10.1007/978-3-642-32820-6_61⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00697020/file/europar2012-submitted.pdf BibTex
titre
QIRAL: A High Level Language for Lattice QCD Code Generation
auteur
Denis Barthou, Gilbert Grosdidier, Michael Kruse, Olivier Pène, Claude Tadonki
article
ETAPS 2012, Mar 2012, Tallin, Estonia. pp.37-43, ⟨10.4204/EPTCS⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00666885/file/paper.pdf BibTex
titre
Programmability and Performance Portability Aspects of Heterogeneous Multi-/Manycore Systems
auteur
Christoph Kessler, Usman Dastgeer, Samuel Thibault, Raymond Namyst, Andrew Richards, Uwe Dolinsky, Siegfried Benkner, Jesper Larsson Träff, Sabri Pllana
article
Design, Automation and Test in Europe (DATE), Mar 2012, Dresden, Germany. ⟨10.1109/DATE.2012.6176582⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00776610/file/date12-paper.pdf BibTex

Master thesis

titre
Programmation des architectures hétérogènes à l’aide de tâches divisibles
auteur
Marc Sergent
article
Informatique [cs]. 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01284136/file/Internship-report-Master1-fr_FR.pdf BibTex

Books

titre
Proceedings of Euro-Par 2011: Parallel Processing Workshops – CCPI, CGWS, HeteroPar, HiBB, HPCVirt, HPPC, HPSS, MDGS, ProPer, Resilience, UCHPC, VHPC, Bordeaux, France, August 29 – September 2, 2011, Revised Selected Papers, Part II
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Michael Alexander and Pasqua D’Ambra and Adam Belloum and George Bosilca and Mario Cannataro and Marco Danelutto and Beniamino Di Martino and Michael Gerndt and Emmanuel Jeannot and Raymond Namyst and Jean Roman and Stephen L. Scott and Jesper Larsson Trä. Springer, 7156, pp.480, 2012, 978-3-642-29739-7
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011: Parallel Processing Workshops – CCPI, CGWS, HeteroPar, HiBB, HPCVirt, HPPC, HPSS, MDGS, ProPer, Resilience, UCHPC, VHPC, Bordeaux, France, August 29 – September 2, 2011, Revised Selected Papers, Part I
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Michael Alexander and Pasqua D’Ambra and Adam Belloum and George Bosilca and Mario Cannataro and Marco Danelutto and Beniamino Di Martino and Michael Gerndt and Emmanuel Jeannot and Raymond Namyst and Jean Roman and Stephen L. Scott and Jesper Larsson Trä. Springer, 7155, pp.524, 2012, LNCS, 978-3-642-29736-6
Accès au bibtex
BibTex

Reports

titre
Supporting Experimental Computer Science
auteur
Frédéric Desprez, Geoffrey Fox, Emmanuel Jeannot, Kate Keahey, Michael Kozuch, David Margery, Pierre Neyron, Lucas Nussbaum, Christian Pérez, Olivier Richard, Warren Smith, Gregor von Laszewski, Jens Vöckler
article
[Research Report] RR-8035, INRIA. 2012, pp.29
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00722605/file/RR-8035.pdf BibTex
titre
Adding Virtualization Capabilities to Grid’5000
auteur
Daniel Balouek, Alexandra Carpen-Amarie, Ghislain Charrier, Frédéric Desprez, Emmanuel Jeannot, Emmanuel Jeanvoine, Adrien Lebre, David Margery, Nicolas Niclausse, Lucas Nussbaum, Olivier Richard, Christian Pérez, Flavien Quesnel, Cyril Rohr, Luc Sarzyniec
article
[Research Report] RR-8026, INRIA. 2012, pp.18
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00720910/file/RR-8026.pdf BibTex
titre
Supporting Experimental Computer Science
auteur
Frédéric Desprez, Geoffrey Fox, Emmanuel Jeannot, Kate Keahey, Michael Kozuch, David Margery, Pierre Neyron, Lucas Nussbaum, Christian Pérez, Olivier Richard, Warren Smith, Gregor von Laszewski, Jens Vöckler
article
[Research Report] Argonne National Laboratory Technical Memo 326, 2012
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00720815/file/Supporting_Experimental_Computer_Science_final_draft.pdf BibTex

Theses

titre
Exploitation efficace des architectures parallèles de type grappes de NUMA à l’aide de modèles hybrides de programmation
auteur
Jérôme Clet-Ortega
article
Calcul parallèle, distribué et partagé [cs.DC]. Université Sciences et Technologies – Bordeaux I, 2012. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00773007/file/CLET-ORTEGA_JEROME_2012.pdf BibTex

2011

Journal articles

titre
Process optimisation using the combination of simulation and experimental design approach: Application to wet air oxidation
auteur
Sebastien Lefevre, Jean-Henry Ferrasse, Olivier Boutin, Michelle Sergent, Rémy Faucherand, Alain Viand
article
Chemical Engineering Research and Design, 2011, 89 (7), pp.1045-1055. ⟨10.1016/j.cherd.2010.12.009⟩
Accès au bibtex
BibTex
titre
Hardware Locality: Peering under the hood of your server
auteur
Brice Goglin, Jeffrey M. Squyres, Samuel Thibault
article
Linux Pro Magazine, 2011, 128, pp.28-33
Accès au bibtex
BibTex
titre
Et plus vite si affinités…
auteur
Brice Goglin
article
Interstices, 2011
Accès au bibtex
BibTex
titre
De votre boulangerie à un système d’exploitation multiprocesseur
auteur
Brice Goglin
article
Interstices, 2011
Accès au bibtex
BibTex
titre
High-Performance Message Passing over generic Ethernet Hardware with Open-MX
auteur
Brice Goglin
article
Parallel Computing, 2011, 37 (2), pp.85-100. ⟨10.1016/j.parco.2010.11.001⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00533058/file/article.pdf BibTex
titre
StarPU: a unified platform for task scheduling on heterogeneous multicore architectures
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
Concurrency and Computation: Practice and Experience, 2011, Euro-Par 2009 best papers, 23 (2), pp.187-198. ⟨10.1002/cpe.1631⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00550877/file/ccpe10.pdf BibTex
titre
PEPPHER: Efficient and Productive Usage of Hybrid Computing Systems
auteur
Siegfried Benkner, Sabri Pllana, Jesper Larsson Träff, Philippas Tsigas, Uwe Dolinsky, Cédric Augonnet, Beverly Bachmayer, Christoph Kessler, David Moloney, Vitaly Osipov
article
IEEE Micro, 2011, 31 (5), pp.28-41. ⟨10.1109/MM.2011.67⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00648480/file/micro2011.pdf BibTex
titre
NIC-assisted cache-efficient receive stack for message passing over Ethernet
auteur
Brice Goglin
article
Concurrency and Computation: Practice and Experience, 2011, Special Issue: Euro-Par 2009, 23 (2), pp.199-210. ⟨10.1002/cpe.1632⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00496301/file/article.pdf BibTex

Conference papers

titre
Performance modeling for power consumption reduction on SCC
auteur
Bertrand Putigny, Brice Goglin, Denis Barthou
article
4th Many-core Applications Research Community (MARC) Symposium, Dec 2011, Potsdam, Germany
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00649635/file/Performance_modeling_for_power_consumption_reduction_on_SCC_-_INIRA_Putigny_Goglin_Barthou.pdf BibTex
titre
Modélisation du coût de la cohérence de cache pour améliorer le tuilage de boucles
auteur
Bertrand Putigny, Denis Barthou, Brice Goglin
article
Quatrièmes rencontres de la communauté française de compilation, Inria Nancy – Grand Est, Dec 2011, Saint-Hippolyte, France
Accès au bibtex
BibTex
titre
A sampling-based approach for communication libraries auto-tuning
auteur
Elisabeth Brunet, François Trahay, Alexandre Denis, Raymond Namyst
article
IEEE International Conference on Cluster Computing, Sep 2011, Austin, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00605735/file/main.pdf BibTex
titre
Improving MPI Applications Performance on Multicore Clusters with Rank Reordering
auteur
Guillaume Mercier, Emmanuel Jeannot
article
EuroMPI, Sep 2011, Santorini, Italy. pp.39-49, ⟨10.1007/978-3-642-24449-0⟩
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00643151/file/Mercier_Jeannot_eurompi2k11_final.pdf BibTex
titre
Kernel Assisted Collective Intra-node MPI Communication Among Multi-core and Many-core CPUs
auteur
Teng Ma, George Bosilca, Aurélien Bouteiller, Brice Goglin, Jeffrey M. Squyres, Jack J. Dongarra
article
40th International Conference on Parallel Processing (ICPP-2011), Sep 2011, Taipei, Taiwan. ⟨10.1109/ICPP.2011.29⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00602877/file/collknem.pdf BibTex
titre
Flexible runtime support for efficient skeleton programming on hybrid systems
auteur
Usman Dastgeer, Christoph Kessler, Samuel Thibault
article
International conference on Parallel Computing (ParCo), Aug 2011, Gent, Belgium. ⟨10.3233/978-1-61499-041-3-159⟩
Accès au bibtex
BibTex
titre
The PEPPHER Approach to Programmability and Performance Portability for Heterogeneous many-core Architectures
auteur
Siegfried Benkner, Sabri Pllana, Jesper Larsson Träff, Philippas Tsigas, Andrew Richards, Raymond Namyst, Beverly Bachmayer, Christoph Kessler, David Moloney, Peter Sanders
article
ParCo, Aug 2011, Ghent, Belgium
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00661320/file/peppher_parco_2011.pdf BibTex
titre
A High-Performance Superpipeline Protocol for InfiniBand
auteur
Alexandre Denis
article
Euro-Par 2011, Aug 2011, Bordeaux, France. pp.276-287
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00586015/file/main.pdf BibTex
titre
Reducing Memory Requirements of Stream Programs by Graph Transformations
auteur
Pablo de Oliveira Castro, Stéphane Louise, Denis Barthou
article
International IEEE Conference on High Performance Computing and Simulation, Jun 2011, Caen, France. p171-180, ⟨10.1109/HPCS.2010.5547134⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00551584/file/streammemory-hpcs10.pdf BibTex
titre
LU Factorization for Accelerator-based Systems
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Mathieu Faverge, Julien Langou, Hatem Ltaief, Stanimire Tomov
article
9th ACS/IEEE International Conference on Computer Systems and Applications (AICCSA 11), Jun 2011, Sharm El-Sheikh, Egypt
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00654193/file/plagma_lu.pdf BibTex
titre
A Scheduling and Certification Algorithm for Defeating Collusion in Desktop Grids
auteur
Louis-Claude Canon, Emmanuel Jeannot, Jon Weissman
article
International Conference on Distributed Computing Systems, Jun 2011, Minneapolis, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00653493/file/camera.pdf BibTex
titre
Towards Real-Time, Volunteer Distributed Computing
auteur
Sangho Yi, Emmanuel Jeannot, Derrick Kondo, David P. Anderson
article
11th IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing (CCGrid 2011), May 2011, Newport Beach, CA, United States
Accès au bibtex
BibTex
titre
EZTrace: a generic framework for performance analysis
auteur
François Trahay, François Rue, Mathieu Faverge, Yutaka Ishikawa, Raymond Namyst, Jack Dongarra
article
IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid), May 2011, Newport Beach, CA, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00587216/file/short_paper_eztrace_ccgrid2011.pdf BibTex
titre
MO-Greedy: an extended beam-search approach for solving a multi-criteria scheduling problem on heterogeneous machines
auteur
Louis-Claude Canon, Emmanuel Jeannot
article
International Heterogeneity in Computing Workshop, May 2011, Anchorage, United States
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00653724/file/hcw11.pdf BibTex
titre
QR Factorization on a Multicore Node Enhanced with Multiple GPU Accelerators
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Mathieu Faverge, Hatem Ltaief, Samuel Thibault, Stanimire Tomov
article
25th IEEE International Parallel & Distributed Processing Symposium, May 2011, Anchorage, United States. ⟨10.1109/IPDPS.2011.90⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00547614/file/plagma_qr.pdf BibTex
titre
Dodging Non-Uniform I/O Access in Hierarchical Collective Operations for Multicore Clusters
auteur
Brice Goglin, Stéphanie Moreaud
article
CASS 2011: The 1st Workshop on Communication Architecture for Scalable Systems, held in conjunction with IPDPS 2011, May 2011, Anchorage, United States. 7p, ⟨10.1109/IPDPS.2011.222⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00566246/file/article.pdf BibTex
titre
Détection optimale des coins et contours dans des bases d’images volumineuses sur architectures multicœurs hétérogènes
auteur
Sidi Ahmed Mahmoudi, Pierre Manneback, Cédric Augonnet, Samuel Thibault
article
Rencontres francophones du parallélisme, May 2011, Saint-Malo, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00606195/file/doc.pdf BibTex
titre
Programmation multi-accélérateurs unifiée en OpenCL
auteur
Henry Sylvain
article
RenPAR’20, May 2011, Saint Malo, France. pp.XXX
Accès au texte intégral et bibtex
https://hal.science/hal-00643257/file/SOCLRenpar2011.pdf BibTex
titre
Analysing the Variability of OpenMP Programs Performances on Multicore Architectures
auteur
Abdelhafid Mazouz, Sid Touati, Denis Barthou
article
Fourth Workshop on Programmability Issues for Heterogeneous Multicores (MULTIPROG-2011), Held in conjunction with: the 6th International Conference on High-Performance and Embedded Architectures and Compilers (HiPEAC), Jan 2011, Heraklion, Greece. pp.14
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00637957/file/Analysing_the_Variability.pdf BibTex

Master thesis

titre
Optimisation des communications pour les calculs parallèles avec SALOME/YACS et PadicoTM
auteur
Sébastien Barascou
article
Réseaux et télécommunications [cs.NI]. 2011
Accès au bibtex
BibTex
titre
Association de modèles de programmation pour l’exploitation de clusters de GPUs dans le calcul intensif
auteur
C. Roelandt, Olivier Aumage, Samuel Thibault
article
Calcul parallèle, distribué et partagé [cs.DC]. 2011
Accès au bibtex
BibTex
titre
Etude de la parallélisation du produit Matrice/Vecteur creux sur processeurs hétérogènes.
auteur
Corentin Rossignon, Olivier Aumage, Samuel Thibault
article
Calcul parallèle, distribué et partagé [cs.DC]. 2011
Accès au bibtex
BibTex

Books

titre
Computing Networks: From Cluster to Cloud Computing
auteur
Pascale Vicat-Blanc Primet, Brice Goglin, Romaric Guillier, Sebastien Soudan
article
Wiley-ISTE, pp.261, 2011, 978-1-84821-286-2. ⟨10.1002/9781118602003⟩
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011 Parallel Processing – 17th International Conference, Part II
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Emmanuel Jeannot and Raymond Namyst and Jean Roman. Springer, 6853, pp.488, 2011, LNCS, 978-3-642-23396-8. ⟨10.1007/978-3-642-23397-5⟩
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011 Parallel Processing – 17th International Conference, Part I
auteur
Emmanuel Jeannot, Jean Roman, Raymond Namyst
article
Emmanuel Jeannot and Raymond Namyst and Jean Roman. Springer, 6852, pp.598, 2011, LNCS, 978-3-642-23399-9. ⟨10.1007/978-3-642-29737-3⟩
Accès au bibtex
BibTex

Documents associated with scientific events

titre
Programming heterogeneous, accelerator-based multicore machines:current situation and main challenges
auteur
Raymond Namyst
article
International Conference On Preconditioning Techniques For Scientific And Industrial Applications, Preconditioning 2011, May 2011, Bordeaux, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00590670/file/precond11-Namyst-1.pdf BibTex

Theses

titre
Scheduling Tasks over Multicore machines enhanced with acelerators: a Runtime System’s Perspective
auteur
Cédric Augonnet
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université Bordeaux 1, 2011. English. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00777154/file/thesis_augonnet.pdf BibTex
titre
Mouvement de données et placement des tâches pour les communications haute performance sur machines hiérarchiques
auteur
Stéphanie Moreaud
article
Réseaux et télécommunications [cs.NI]. Université Sciences et Technologies – Bordeaux I, 2011. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00635651/file/these_moreaud_2011.pdf BibTex

Preprints, Working Papers, …

titre
Composabilité de codes parallèles sur architectures hétérogènes
auteur
Andra-Ecaterina Hugo
article
2011
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00619654/file/Ahugo11Master.pdf BibTex

2010

Journal articles

titre
Efficiency of a hierarchical protocol for highthroughput structure-based virtual screening on Grid5000 cluster grid
auteur
Leo Ghemtio, Emmanuel Jeannot, Bernard Maigret
article
Open Access Bioinformatics, 2010, 2, pp.41-53. ⟨10.2147/OAB.S7272⟩
Accès au bibtex
BibTex
titre
Defining and Controlling the Heterogeneity of a Cluster: the Wrekavoc Tool
auteur
Louis-Claude Canon, Olivier Dubuisson, Jens Gustedt, Emmanuel Jeannot
article
Journal of Systems and Software, 2010, 83 (5), pp.786-802. ⟨10.1016/j.jss.2009.11.734⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00438616/file/RR-7135.pdf BibTex
titre
ForestGOMP: an efficient OpenMP environment for NUMA architectures
auteur
François Broquedis, Nathalie Furmento, Brice Goglin, Pierre-André Wacrenier, Raymond Namyst
article
International Journal of Parallel Programming, 2010, ⟨10.1007/s10766-010-0136-3⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00496295/file/IJPP.pdf BibTex

Conference papers

titre
Data-Aware Task Scheduling on Multi-Accelerator based Platforms
auteur
Cédric Augonnet, Jérôme Clet-Ortega, Samuel Thibault, Raymond Namyst
article
16th International Conference on Parallel and Distributed Systems, Dec 2010, Shangai, China
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00523937/file/icpads10-starpu.pdf BibTex
titre
Adaptive MPI Multirail Tuning for Non-Uniform Input/Output Access
auteur
Stéphanie Moreaud, Brice Goglin, Raymond Namyst
article
The 17th European MPI Users Group conference, Sep 2010, Stuttgart, Germany. pp.239-248, ⟨10.1007/978-3-642-15646-5_25⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00486178/file/article.pdf BibTex
titre
Near-Optimal Placement of MPI processes on Hierarchical NUMA Architectures
auteur
Emmanuel Jeannot, Guillaume Mercier
article
Europar, Aug 2010, Ischia, Italy. pp.199-210, ⟨10.1007/978-3-642-15291-7_20⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00544346/file/europar10.pdf BibTex
titre
Dynamically scheduled Cholesky factorization on multicore architectures with GPU accelerators.
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Hatem Ltaief, Raymond Namyst, Jean Roman, Samuel Thibault, Stanimire Tomov
article
Symposium on Application Accelerators in High Performance Computing (SAAHPC), Jul 2010, Knoxville, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00547616/file/saahpc.pdf BibTex
titre
Automatic Mapping of Stream Programs on Multicore Architectures
auteur
Pablo de Oliveira Castro, Stéphane Louise, Denis Barthou
article
International Workshop on Compilers for Parallel Computers, Jul 2010, Vienna, Austria
Accès au texte intégral et bibtex
https://hal.science/hal-00551680/file/cpc10.pdf BibTex
titre
FADAlib: an open source C++ library for fuzzy array dataflow analysis
auteur
Marouane Belaoucha, Denis Barthou, Adrien Eliche, Sid Touati
article
International Conference on Computational Science, May 2010, Amsterdam, Netherlands. p2075-2084
Accès au texte intégral et bibtex
https://hal.science/hal-00551673/file/main_fadalib.pdf BibTex
titre
Optimizing MPI Communication within large Multicore nodes with Kernel assistance
auteur
Stéphanie Moreaud, Brice Goglin, David Goodell, Raymond Namyst
article
Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2010, Apr 2010, Atlanta, United States. 7 p., ⟨10.1109/IPDPSW.2010.5470849⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00451471/file/CAC10.pdf BibTex
titre
A Dynamic Approach for Characterizing Collusion in Desktop Grids
auteur
Louis-Claude Canon, Emmanuel Jeannot, Jon Weissman
article
24th IEEE International Parallel and Distributed Processing Symposium – IPDPS 2010, Apr 2010, Atlanta, United States. pp.1-12, ⟨10.1109/IPDPS.2010.5470422⟩
Accès au bibtex
BibTex
titre
Structuring the execution of OpenMP applications for multicore architectures
auteur
François Broquedis, Olivier Aumage, Brice Goglin, Samuel Thibault, Pierre-André Wacrenier, Raymond Namyst
article
International Parallel and Distributed Symposium (IPDPS 2010), Apr 2010, Atltanta, United States. ⟨10.1109/IPDPS.2010.5470442⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00441472/file/PID1125911.pdf BibTex
titre
hwloc: a Generic Framework for Managing Hardware Affinities in HPC Applications
auteur
François Broquedis, Jérôme Clet-Ortega, Stéphanie Moreaud, Nathalie Furmento, Brice Goglin, Guillaume Mercier, Samuel Thibault, Raymond Namyst
article
PDP 2010 – The 18th Euromicro International Conference on Parallel, Distributed and Network-Based Computing, Feb 2010, Pisa, Italy. ⟨10.1109/PDP.2010.67⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00429889/file/main.pdf BibTex
titre
A multidimensional array slicing DSL for Stream Programming
auteur
Pablo de Oliveira Castro, Stéphane Louise, Denis Barthou
article
International IEEE Workshop on Practical Aspects of High-Level Parallel Programming, Feb 2010, Krakow, Poland. p913-918
Accès au texte intégral et bibtex
https://hal.science/hal-00551572/file/camera_ready.pdf BibTex

Book sections

titre
Faster, Cheaper, Better – a Hybridization Methodology to Develop Linear Algebra Software for GPUs
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Hatem Ltaief, Raymond Namyst, Samuel Thibault, Stanimire Tomov
article
Wen-mei W. Hwu. GPU Computing Gems, 2, Morgan Kaufmann, 2010
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00547847/file/gpucomputinggems_plagma.pdf BibTex

Books

titre
Réseaux de calcul – des grappes aux nuages de calcul
auteur
Pascale Vicat-Blanc Primet, Romaric Guillier, Sebastien Soudan, Brice Goglin
article
Hermès Science – Lavoisier, pp.213, 2010, 978-2-7462-3006-4
Accès au bibtex
BibTex
titre
Réseaux rapides et stockage distribué dans les grappes de calculateurs
auteur
Brice Goglin
article
Editions Universitaires Européennes, pp.194, 2010, 978-613-1-51872-0
Accès au bibtex
BibTex

Reports

titre
A Generic and High Performance Approach for Fault Tolerance in Communication Library
auteur
François Trahay, Alexandre Denis, Yutaka Ishikawa
article
[Research Report] INRIA Bordeaux. 2010
Accès au texte intégral et bibtex
https://inria.hal.science/hal-00793176/file/main.pdf BibTex
titre
Kernel Assisted Collective Intra-node Communication Among Multicore and Manycore CPUs
auteur
Teng Ma, George Bosilca, Aurélien Bouteiller, Brice Goglin, Jeffrey M. Squyres, Jack J. Dongarra
article
[Research Report] 2010, pp.11
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00544872/file/kernel-assisted-comm-multicore.pdf BibTex
titre
A Scheduling Algorithm for Defeating Collusion
auteur
Louis-Claude Canon, Emmanuel Jeannot, Jon Weissman
article
[Research Report] RR-7403, INRIA. 2010
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00524493/file/RR-7403.pdf BibTex
titre
StarPU: a Runtime System for Scheduling Tasks over Accelerator-Based Multicore Machines
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst
article
[Research Report] RR-7240, INRIA. 2010, pp.33
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00467677/file/RR-7240.pdf BibTex

Theses

titre
Tools and algorithms for coping with uncertainty when scheduling application on distributed platforms
auteur
Louis-Claude Canon
article
Informatique [cs]. Université Henri Poincaré – Nancy I, 2010. Français. ⟨NNT : 2010NAN10097⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00576781/file/these.pdf BibTex

Preprints, Working Papers, …

titre
On the complexity of task graph scheduling with transient and fail-stop failures
auteur
Anne Benoit, Louis-Claude Canon, Emmanuel Jeannot, Yves Robert
article
2010
Accès au texte intégral et bibtex
https://hal.science/hal-00457511/file/rr-lip-2010-01.pdf BibTex

2009

Conference papers

titre
Cache-Efficient, Intranode, Large-Message MPI Communication with MPICH2-Nemesis
auteur
Darius Buntinas, Brice Goglin, David Goodell, Guillaume Mercier, Stéphanie Moreaud
article
38th International Conference on Parallel Processing (ICPP-2009), Sep 2009, Vienne, Austria. ⟨10.1109/ICPP.2009.22⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00390064/file/article.pdf BibTex
titre
Adaptation des communications MPI intra-nœud aux architectures multicœurs modernes
auteur
Stéphanie Moreaud
article
19ème Rencontres Francophones du Parallélisme (2009), Sep 2009, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00430021/file/MorRenPar09.pdf BibTex
titre
Bibliothèque de communication multi-threadée pour architectures multi-coeurs
auteur
François Trahay
article
19ème Rencontres Francophones du Parallélisme, Sep 2009, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00410355/file/renpar09.pdf BibTex
titre
StarPU : un support exécutif unifié pour les architectures multicoeurs hétérogènes
auteur
Cédric Augonnet
article
19ème Rencontres Francophones du Parallélisme, Sep 2009, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00411581/file/Aug09RENPAR.pdf BibTex
titre
Towards an efficient process placement policy for MPI applications in multicore environments
auteur
Guillaume Mercier, Jérôme Clet-Ortega
article
Europvm/mpi 2009, Sep 2009, Espoo, Finland. pp 104–115, ⟨10.1007/978-3-642-03770-2_17⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00392581/file/Mercier_Clet-Ortega_europvmmpi2k9_Corrected_Final.pdf BibTex
titre
Finding a Tradeoff between Host Interrupt Load and MPI Latency over Ethernet
auteur
Brice Goglin, Nathalie Furmento
article
Cluster 2009, Sep 2009, New Orleans, United States. ⟨10.1109/CLUSTR.2009.5289165⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00397328/file/article.pdf BibTex
titre
Ordonnancement de threads OpenMP et placement de données coordonnés sur architectures hiérarchiques
auteur
François Broquedis
article
Rencontres Francophones du Parallélisme (RenPar), Sep 2009, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00422213/file/paper17.pdf BibTex
titre
Une stratégie efficace pour le placement de processus en environnement multicœur
auteur
Jérôme Clet-Ortega
article
19ème Rencontres Francophones du Parallélisme (2009), Sep 2009, Toulouse, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00410756/file/article.pdf BibTex
titre
Automatic Calibration of Performance Models on Heterogeneous Multicore Architectures
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst
article
3rd Workshop on Highly Parallel Processing on a Chip (HPPC 2009), Aug 2009, Delft, Netherlands
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00421333/file/AugThiNam09HPPC.pdf BibTex
titre
NIC-assisted Cache-Efficient Receive Stack for Message Passing over Ethernet
auteur
Brice Goglin
article
15th International Euro-Par Conference, Aug 2009, Delft, Netherlands. ⟨10.1007/978-3-642-03869-3_98⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00379168/file/EuroPar09-submit.pdf BibTex
titre
StarPU: A Unified Platform for Task Scheduling on Heterogeneous Multicore Architectures
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
Euro-Par 2009, Aug 2009, Delft, Netherlands
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00384363/file/AugThiNamWac09Europar.pdf BibTex
titre
A scalable and generic task scheduling system for communication libraries
auteur
François Trahay, Alexandre Denis
article
IEEE International Conference on Cluster Computing, IEEE Computer Society Press, Aug 2009, New Orleans, LA, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00408521/file/cluster09.pdf BibTex
titre
Exploiting the Cell/BE architecture with the StarPU unified runtime system
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst, Maik Nijhuis
article
SAMOS Workshop, Jul 2009, SAMOS, Greece
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00378705/file/samos09-starpu.pdf BibTex
titre
Memory Migration on Next-Touch
auteur
Brice Goglin, Nathalie Furmento
article
Linux Symposium, Jul 2009, Montreal, Canada
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00378580/file/goglin.pdf BibTex
titre
Dynamic Task and Data Placement over NUMA Architectures: an OpenMP Runtime Perspective
auteur
François Broquedis, Nathalie Furmento, Brice Goglin, Raymond Namyst, Pierre-André Wacrenier
article
International Workshop on OpenMP (IWOMP), Jun 2009, Dresden, Germany. ⟨10.1007/978-3-642-02303-3_7⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00367570/file/cameraReadyVersion.pdf BibTex
titre
Enabling High-Performance Memory Migration for Multithreaded Applications on Linux
auteur
Brice Goglin, Nathalie Furmento
article
MTAAP’09: Workshop on Multithreaded Architectures and Applications, held in conjunction with IPDPS 2009, May 2009, Rome, Italy. ⟨10.1109/IPDPS.2009.5161101⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00358172/file/article.pdf BibTex
titre
NewMadeleine: An Efficient Support for High-Performance Networks in MPICH2
auteur
Guillaume Mercier, François Trahay, Darius Buntinas, Elisabeth Brunet
article
International Parallel and Distributed Processing Symposium, May 2009, Rome, Italy. pp.35
Accès au texte intégral et bibtex
https://hal.science/hal-00360275/file/PID817771.pdf BibTex
titre
Decoupling Memory Pinning from the Application with Overlapped on-Demand Pinning and MMU Notifiers
auteur
Brice Goglin
article
Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2009, May 2009, Rome, Italy. ⟨10.1109/IPDPS.2009.5160888⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00356236/file/article.pdf BibTex
titre
An analysis of the impact of multi-threading on communication performance
auteur
François Trahay, Elisabeth Brunet, Alexandre Denis
article
Communication Architecture for Clusters, May 2009, Rome, Italy. ⟨10.1109/IPDPS.2009.5160893⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00381670/file/main.pdf BibTex
titre
High Throughput Intra-Node MPI Communication with Open-MX
auteur
Brice Goglin
article
17th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP2009), Feb 2009, Weimar, Germany. ⟨10.1109/PDP.2009.20⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00331209/file/article.pdf BibTex
titre
Mapping and Synchronizing Streaming Applications on Cell Processors
auteur
Maik Nijhuis, Herbert Bos, Henri E. Bal, Cédric Augonnet
article
HiPEAC 2009 – High Performance and Embedded Architectures and Compilers, Jan 2009, Paphos, Cyprus. ⟨10.1007/978-3-540-92990-1_17⟩
Accès au bibtex
BibTex

Theses

titre
Static-Dynamic Hybrid Scheduling in sparse linear algebra for large clusters of NUMA and multi-cores architectures
auteur
Mathieu Faverge
article
Modélisation et simulation. Université Sciences et Technologies – Bordeaux I, 2009. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00453997/file/these1.pdf BibTex
titre
About the interactions between communication and thread scheduling in clusters of multicore machines
auteur
François Trahay
article
Modélisation et simulation. Université Sciences et Technologies – Bordeaux I, 2009. Français. ⟨NNT : ⟩
Accès au texte intégral et bibtex
https://theses.hal.science/tel-00469488/file/these_trahay.pdf BibTex

2008

Journal articles

titre
Accessibility in Linux systems
auteur
Samuel Thibault
article
Linux Weekly News, 2008
Accès au bibtex
BibTex
titre
BubbleSched, plate-forme de conception d’ordonnanceurs de threads sur machines hiérarchiques
auteur
Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2008, Nouveaux algorithmes pour les nouvelles plates-formes parallèles, 27 (3-4/2008), pp.345-371. ⟨10.3166/TSI.27.345-371⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00329960/file/thi-nam-wac-bulles-hal.pdf BibTex
titre
NewMadeleine : ordonnancement et optimisation de schemas de communication haute performance.
auteur
Elisabeth Brunet, Olivier Aumage, Raymond Namyst
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, 2008, vol. 27 (3-4/2008)
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00341270/file/tsi07.pdf BibTex

Conference papers

titre
Ocean-Atmosphere Application Scheduling within DIET
auteur
Yves Caniou, Eddy Caron, Ghislain Charrier, Frédéric Desprez, Eric Maisonnave, Vincent Pichon
article
APDCT 2008 – International Symposium on Advanced in Parallel and Distributed Computing Techniques, Dec 2008, Sydney, Australia. pp.1-6, ⟨10.1109/ISPA.2008.121⟩
Accès au bibtex
BibTex
titre
Improving Message Passing over Ethernet with I/OAT Copy Offload in Open-MX
auteur
Brice Goglin
article
Cluster 2008, Sep 2008, Tsukuba, Japan. ⟨10.1109/CLUSTR.2008.4663775⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00288757/file/Open-MX-IOAT.pdf BibTex
titre
A multicore-enabled multirail communication engine
auteur
Elisabeth Brunet, François Trahay, Alexandre Denis
article
IEEE International Conference on Cluster Computing, Sep 2008, Tsukuba, Japan. ⟨10.1109/CLUSTR.2008.4663788⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00327158/file/main.pdf BibTex
titre
A unified runtime system for heterogeneous multicore architectures
auteur
Cédric Augonnet, Raymond Namyst
article
2nd Workshop on Highly Parallel Processing on a Chip (HPPC 2008), Aug 2008, Las Palmas de Gran Canaria, Spain
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00326917/file/AugNam08HPPC.pdf BibTex
titre
Dynamic Scheduling for sparse direct Solver on NUMA architectures
auteur
Mathieu Faverge, Pierre Ramet
article
PARA’08, May 2008, Trondheim, Norway
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00344026/file/para08.pdf BibTex
titre
Scheduling Dynamic OpenMP Applications over Multicore Architectures
auteur
François Broquedis, François Diakhate, Samuel Thibault, Olivier Aumage, Raymond Namyst, Pierre-André Wacrenier
article
International Workshop on OpenMP, May 2008, West Lafayette, IN, United States. ⟨10.1007/978-3-540-79561-2_15⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00329934/file/soumis.pdf BibTex
titre
Design and Implementation of Open-MX: High-Performance Message Passing over generic Ethernet hardware
auteur
Brice Goglin
article
Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2008, Apr 2008, Miami, United States. ⟨10.1109/IPDPS.2008.4536140⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00210704/file/CAC-383-paper-1.pdf BibTex
titre
A multithreaded communication engine for multicore architectures
auteur
François Trahay, Elisabeth Brunet, Alexandre Denis, Raymond Namyst
article
Communication Architecture for Clusters, Apr 2008, Miami, United States. ⟨10.1109/IPDPS.2008.4536139⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00224999/file/main.pdf BibTex
titre
Exécution structurée d’applications OpenMP à grain fin sur architectures multicoeurs
auteur
François Broquedis
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00203188/file/main.pdf BibTex
titre
Ordonnancement et services différenciés pour réseaux rapides
auteur
Jérôme Clet-Ortega
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00332260/file/renpar18.pdf BibTex
titre
Impacts des effets NUMA sur les communications haute performance dans les grappes de calcul
auteur
Stéphanie Moreaud
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00257752/file/MorRenPar08.pdf BibTex
titre
PIOMan : un gestionnaire d’entrées-sorties générique
auteur
François Trahay
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00327177/file/renpar08.pdf BibTex
titre
A NUMA Aware Scheduler for a Parallel Sparse Direct Solver
auteur
Mathieu Faverge, Xavier Lacoste, Pierre Ramet
article
PMAA’08, 2008, Neuchâtel, Switzerland
Accès au bibtex
BibTex

Reports

titre
Vers des supports d’exécution capables d’exploiter les machines multicœurs hétérogènes
auteur
Cédric Augonnet
article
[Travaux universitaires] 2008, pp.48
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00289361/file/memoire-dea.pdf BibTex

Preprints, Working Papers, …

titre
Efficient shared memory message passing for inter-VM communications
auteur
François Diakhaté, Marc Pérache, Raymond Namyst, Hervé Jourdren
article
2008
Accès au texte intégral et bibtex
https://hal.science/hal-00368622/file/vhpc08.pdf BibTex

2007

Journal articles

titre
Implementation and Evaluation of Shared-Memory Communication and Synchronization Operations in MPICH2 using the Nemesis Communication Subsystem
auteur
Darius Buntinas, Guillaume Mercier, William Gropp
article
Parallel Computing, 2007, 33 (9), pp.634-644. ⟨10.1016/j.parco.2007.06.003⟩
Accès au texte intégral et bibtex
https://hal.science/hal-00344327/file/parco2k7_final.pdf BibTex
titre
Meta-communications in Component-base Communication Frameworks for Grids
auteur
Alexandre Denis
article
Cluster Computing, 2007, 10 (3), pp.253-263. ⟨10.1007/s10586-007-0036-5⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00410993/file/article.pdf BibTex

Conference papers

titre
Impact of NUMA Effects on High-Speed Networking with Multi-Opteron Machines
auteur
Stéphanie Moreaud, Brice Goglin
article
PDCS, Nov 2007, Cambridge, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00175747/file/PDCS07.pdf BibTex
titre
Improving Reactivity and Communication Overlap in MPI using a Generic I/O Manager
auteur
François Trahay, Alexandre Denis, Olivier Aumage, Raymond Namyst
article
EuroPVM/MPI 2007, Oct 2007, Paris, France. pp.170-177, ⟨10.1007/978-3-540-75416-9_27⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00177167/file/TRA07Improving.pdf BibTex
titre
Building Portable Thread Schedulers for Hierarchical Multiprocessors: the BubbleSched Framework
auteur
Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
EuroPar, Aug 2007, Rennes, France. ⟨10.1007/978-3-540-74466-5_6⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00154506/file/main.pdf BibTex
titre
An Efficient OpenMP Runtime System for Hierarchical Architectures
auteur
Samuel Thibault, François Broquedis, Brice Goglin, Raymond Namyst, Pierre-André Wacrenier
article
International Workshop on OpenMP (IWOMP), Jun 2007, Beijing, China. pp.148–159, ⟨10.1007/978-3-540-69303-1_19⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00154502/file/main.pdf BibTex
titre
BrlAPI: Simple, Portable, Concurrent, Application-level Control of Braille Terminals
auteur
Samuel Thibault, Sébastien Hinderer
article
The First International Conference on Information and Communication Technology and Accessibility – ICTA 2007, Apr 2007, Hammamet, Tunisia. pp.27–31
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00135946/file/thibault-hinderer-icta-2007.pdf BibTex
titre
High-Performance Multi-Rail Support with the NewMadeleine Communication Library
auteur
Olivier Aumage, Elisabeth Brunet, Guillaume Mercier, Raymond Namyst
article
The Sixteenth International Heterogeneity in Computing Workshop (HCW 2007), workshop held in conjunction with IPDPS 2007, Mar 2007, Long Beach, California, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00126254/file/hcw-final.pdf BibTex
titre
NewMadeleine: a Fast Communication Scheduling Engine for High Performance Networks
auteur
Olivier Aumage, Elisabeth Brunet, Nathalie Furmento, Raymond Namyst
article
Workshop on Communication Architecture for Clusters (CAC 2007), workshop held in conjunction with IPDPS 2007, Mar 2007, Long Beach, California, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00127356/file/cac-final.pdf BibTex

Reports

titre
Impact des architectures multiprocesseurs sur les communications dans les grappes de calcul : de l’exploration des effets NUMA au placement automatique
auteur
Stéphanie Moreaud
article
[Travaux universitaires] 2007, pp.36
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00177495/file/memoire_DEA_Moreaud.pdf BibTex
titre
De l’exécution structurée de programmes OpenMP sur architectures hiérarchiques
auteur
François Broquedis
article
[Rapport de recherche] 2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00177150/file/memoire.pdf BibTex
titre
NewMadeleine: a Fast Communication Scheduling Engine for High Performance Networks
auteur
Olivier Aumage, Elisabeth Brunet, Nathalie Furmento, Raymond Namyst
article
[Research Report] RR-6085, INRIA. 2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00122723/file/RR-6085.pdf BibTex
titre
Efficient Interaction between High-Speed Networks and Distributed Storage in Clusters
auteur
Brice Goglin
article
[Research Report] 2007, pp.28
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00070218/file/article.pdf BibTex
titre
Modification de PadicoTM afin de fournir une interface de type Madeleine
auteur
Christophe Frezier
article
[Rapport Technique] RT-0334, INRIA. 2007, pp.11
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00142872/file/RT-0334.pdf BibTex
titre
Ordonnancement et qualité de service pour réseaux rapides
auteur
Jérôme Clet-Ortega
article
[Rapport de recherche] 2007, pp.38
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00177230/file/memoire.pdf BibTex

Preprints, Working Papers, …

titre
Ordonnancements de threads dirigé par la mémoire sur architecture NUMA.
auteur
Sylvain Jeuland
article
2007
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00177129/file/memaware.pdf BibTex

2006

Journal articles

titre
PDMS-based microfluidics for proteomic analysis.
auteur
Arash Dodge, Edouard Brunet, Suelin Chen, Jacques Goulpeau, Valérie Labas, Joelle Vinh, Patrick Tabeling
article
Analyst, 2006, 131 (10), pp.1122-8. ⟨10.1039/b606394b⟩
Accès au bibtex
BibTex

Conference papers

titre
ACI Grid’5000, Site de Bordeaux
auteur
Nathalie Furmento, Guillaume Mercier, Raymond Namyst, Alexandre Denis
article
PaRISTIC : Panorama des Recherches Incitatives en STIC, Nov 2006, Nancy, France
Accès au bibtex
BibTex
titre
BubbleSched : construire son propre ordonnanceur de threads pour machines multiprocesseurs hirarchiques
auteur
Samuel Thibault
article
17ème Rencontres Francophones du Parallélisme, ACM/ASF – Université de Perpignan, Oct 2006, Canet en Roussillon, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00108984/file/papier_final.pdf BibTex
titre
NewMadeleine : ordonnancement et optimisation de schémas de communication haute performance.
auteur
Elisabeth Brunet
article
17ème Rencontres Francophones du Parallélisme, Oct 2006, Perpignan/France, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00110766/file/main.pdf BibTex
titre
Efficient runtime systems for grids
auteur
Nathalie Furmento, Alexandre Denis, Raymond Namyst
article
EXPGRID, Experimental Grid testbeds for the assessment of large-scale distributed applications and tools, Workshop held in conjunction with the 15th International Symposium on High Performance Distributed Computing (HPDC-15), Jun 2006, Paris, France
Accès au bibtex
BibTex
titre
Meta-communications in Component-based Communnication Frameworks for Grids
auteur
Alexandre Denis
article
HPC Grid programming Environments and COmponents (HPC-GECO), Jun 2006, Paris, France. pp.77–84
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00090066/file/article.pdf BibTex
titre
Short Paper : Dynamic Optimization of Communications over High Speed Networks
auteur
Elisabeth Brunet, Olivier Aumage, Raymond Namyst
article
The 15th IEEE International Symposium on High Performance Distributed Computing (HPDC-15), Jun 2006, Paris/France, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00110773/file/wik06.pdf BibTex

Book sections

titre
Des réseaux de calculateurs aux grilles de calcul
auteur
Christine Morin, Alexandre Denis, Raymond Namyst, Olivier Aumage, Renaud Lottiaux
article
Akoka, Jacky; Comyn-Wattiau, Isabelle. Encyclopédie de l’informatique et des systèmes d’information, Section 2 – Architectures et syst\`emes distribu\’es, Vuibert, pp.211-239, 2006, Collection informatique
Accès au bibtex
BibTex
titre
Programming the grid with components: models and runtime issues
auteur
Alexandre Denis, Sébastien Lacour, Christian Pérez, Thierry Priol, André Ribes
article
Beniamino Di Martino and Jack Dongarra and Adolfy Hoisie and Laurence T. Yang and Hans Zima. Engineering The Grid: Status and Perspective, American Scientific Publishers, 2006, 1-58883-038-1
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00411008/file/component.pdf BibTex

Reports

titre
Modeling the LU factorization for SMP clusters
auteur
Jack Dongarra, Emmanuel Jeannot, Julien Langou
article
[Research Report] 2006, pp.2
Accès au bibtex
BibTex
titre
Gestion de la réactivité des communications réseau
auteur
François Trahay
article
[Rapport de recherche] Universite Bordeaux 1. 2006, pp.31
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00177149/file/Tra06Memoire.pdf BibTex

2005

Conference papers

titre
Grid’5000: a large scale, reconfigurable, controlable and monitorable Grid platform
auteur
Franck Cappello, Frédéric Desprez, Michel Daydé, Emmanuel Jeannot, Yvon Jégou, Stephane Lanteri, Nouredine Melab, Raymond Namyst, Pascale Primet, Olivier Richard, Eddy Caron, Julien Leduc, Guillaume Mornet
article
6th IEEE/ACM International Workshop on Grid Computing – GRID 2005, Nov 2005, Seattle, USA, United States
Accès au bibtex
BibTex
titre
An Efficient Multi-level Trace Toolkit for Multi-threaded Applications
auteur
Vincent Danjean, Raymond Namyst, Pierre-André Wacrenier
article
Euro-Par 2005 Parallel Processing, Aug 2005, Lisbon, Portugal. pp.166-175, ⟨10.1007/11549468_21⟩
Accès au bibtex
BibTex
titre
A Flexible Thread Scheduler for Hierarchical Multiprocessor Machines
auteur
Samuel Thibault
article
Second International Workshop on Operating Systems, Programming Environments and Management Tools for High-Performance Computing on Clusters (COSET-2), ICS / ACM / IRISA, Jun 2005, Cambridge, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000138/file/coset.pdf BibTex
titre
NetIbis: An Efficient and Dynamic Communication System for Heterogeneous Grids
auteur
Olivier Aumage, Rutger Hofman, Henri Bal
article
Cluster Computing and Grid 2005, Cardiff University, May 2005, Cardiff/UK
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000031/file/netibis.pdf BibTex
titre
Un ordonnanceur flexible pour machines multiprocesseurs hiérarchiques
auteur
Samuel Thibault
article
16ème Rencontres Francophones du Parallélisme, ACM/ASF – École des Mines de Nantes, Apr 2005, Le Croisic, France
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000137/file/renpar.pdf BibTex

Reports

titre
Support d’ordonnancement et d’optimisation automatisés des communications pour les réseaux hautes performances
auteur
Elisabeth Brunet
article
RR-5641, INRIA. 2005, pp.38
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00070366/file/RR-5641.pdf BibTex
titre
Optimisation Mechanisms for MPICH/Madeleine
auteur
Nathalie Furmento, Guillaume Mercier
article
[Research Report] RT-0306, INRIA. 2005, pp.29
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00069874/file/RT-0306.pdf BibTex
titre
An Efficient Multi-level Trace Toolkit for Multi-threaded Applications
auteur
Vincent Danjean, Pierre-André Wacrenier, Raymond Namyst
article
[Research Report] RR-5513, INRIA. 2005, pp.12
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00070493/file/RR-5513.pdf BibTex
titre
MPICH/Madeleine Installer’s, User’s and Developer’s Guide
auteur
Nathalie Furmento, Guillaume Mercier
article
[Research Report] RT-0316, INRIA. 2005, pp.41
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00070940/file/RT-0316.pdf BibTex
titre
Developing a Software Tool for Precise Kernel Measurements
auteur
Samuel Thibault, Robert Russell
article
[Research Report] RR-5602, INRIA. 2005, pp.25
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000189/file/RR-5602.pdf https://inria.hal.science/inria-00000189/file/report.pdf BibTex

2004

Conference papers

titre
ALTA: Asynchronous Loss Tolerant Algorithms for Grid Computing
auteur
Olivier Aumage, Jacques M. Bahi, Sylvain Contassot-Vivier, Raphaël Couturier, Alexandre Denis, Raymond Namyst, Guillaume Papauré, Christian Pérez, Marc Sauget
article
3rd International workshop on Parallel Matrix Algorithms and Applications (PMAA’04), Oct 2004, Marseille, France
Accès au bibtex
BibTex
titre
Wide-Area Communication for Grids: An Integrated Solution to Connectivity, Performance and Security Problems
auteur
Alexandre Denis, Olivier Aumage, Rutger Hofman, Kees Verstoep, Thilo Kielmann, Henri E. Bal
article
the Thirteenth IEEE International Symposium on High-Performance Distributed Computing (HPDC’13), Jun 2004, Honolulu/Hawaii, United States
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00000126/file/hpdc2004.pdf BibTex

Master thesis

titre
Un ordonnanceur flexible pour machines multiprocesseurs hiérarchisées
auteur
Samuel Thibault
article
Calcul parallèle, distribué et partagé [cs.DC]. 2004
Accès au texte intégral et bibtex
https://inria.hal.science/hal-01962358/file/Samuel_Thibault_3.pdf BibTex

2003

Journal articles

titre
Achieving Portable and Efficient Parallel CORBA Objects
auteur
Alexandre Denis, Christian Pérez, Thierry Priol
article
Concurrency and Computation: Practice and Experience, 2003, 15 (10), pp.891-909. ⟨10.1002/cpe.738⟩
Accès au texte intégral et bibtex
https://inria.hal.science/inria-00411025/file/DenPerPriCCPE.pdf BibTex

Book sections

titre
Programming the Grid with Distributed Objects
auteur
Alexandre Denis, Christian Pérez, Thierry Priol, André Ribes
article
Craig Lee. Process Coordination and Ubiquitous Computing, CRC Press, 2003, 0849314704
Accès au bibtex
BibTex

Comments are closed.