Publications

Publications HAL de la structure storm;runtime

2017

Journal articles

titre
Bridging the gap between OpenMP and task-based runtime systems for the fast multipole method
auteur
Emmanuel Agullo, Olivier Aumage, Berenger Bramas, Olivier Coulaud, Samuel Pitoiset
article
IEEE Transactions on Parallel and Distributed Systems, Institute of Electrical and Electronics Engineers, 2017, pp.14. 〈10.1109/TPDS.2017.2697857〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01517153/file/tpds_kstar_scalfmm_print.pdf BibTex
titre
Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
IEEE Transactions on Parallel and Distributed Systems, Institute of Electrical and Electronics Engineers, A Paraître
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01618526/file/tpds14.pdf BibTex

Conference papers

titre
Characterizing the Performance of Modern Architectures Through Opaque Benchmarks: Pitfalls Learned the Hard Way
auteur
Luka Stanisic, Lucas Mello Schnorr, Augustin Degomme, Franz Heinrich, Arnaud Legrand, Brice Videau
article
IPDPS 2017 – 31st IEEE International Parallel & Distributed Processing Symposium (RepPar workshop), Jun 2017, Orlando, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01470399/file/IPDPS_REPPAR_2017_camera_ready.pdf BibTex
titre
Approximation Proofs of a Fast and Efficient List Scheduling Algorithm for Task-Based Runtime Systems on Multicores and GPUs
auteur
Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS), May 2017, Orlando, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01386174/file/heteroPrioApproxProofsRR.pdf BibTex
titre
Combining Both a Component Model and a Task-based Model for HPC Applications: a Feasibility Study on GYSELA
auteur
Olivier Aumage, Julien Bigot, Hélène Coullon, Christian Pérez, Jérôme Richard
article
17th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid)., May 2017, Madrid, Spain
Accès au bibtex
BibTex

Reports

titre
Task-based fast multipole method for clusters of multicore processors
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Martin Khannouz, Luka Stanisic
article
[Research Report] RR-8970, Inria Bordeaux Sud-Ouest. 2017, pp.15
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01387482/file/report-8970.pdf BibTex
titre
Modeling Irregular Kernels of Task-based codes: Illustration with the Fast Multipole Method
auteur
Emmanuel Agullo, Bérenger Bramas, Olivier Coulaud, Luka Stanisic, Samuel Thibault
article
[Research Report] RR-9036, INRIA Bordeaux. 2017, pp.35
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01474556/file/rapport.pdf BibTex

Preprints, Working Papers, …

titre
A Visual Performance Analysis Framework for Task-based Parallel Applications running on Hybrid Clusters
auteur
Vinicius Garcia Pinto, Lucas Schnorr, Luka Stanisic, Arnaud Legrand, Samuel Thibault, Vincent Danjean
article
2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01616632/file/CCPE_article_submitted_2017_09_29-gz.pdf BibTex

2016

Conference papers

titre
Scheduling of Linear Algebra Kernels on Multiple Heterogeneous Resources
auteur
Olivier Beaumont, Terry Cojean, Lionel Eyraud-Dubois, Abdou Guermouche, Suraj Kumar
article
International Conference on High Performance Computing, Data, and Analytics (HiPC 2016), Dec 2016, Hyderabad, India. IEEE, 2016, Proceedings of the IEEE International Conference on High Performance Computing (HiPC 2016). 〈http://www.hipc.org/hipc2016/〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01361992/file/HiPC.pdf BibTex
titre
Analyzing Dynamic Task-Based Applications on Hybrid Platforms: An Agile Scripting Approach
auteur
Vinicius Garcia Pinto, Luka Stanisic, Arnaud Legrand, Lucas Mello Schnorr, Samuel Thibault, Vincent Danjean
article
3rd Workshop on Visual Performance Analysis (VPA), Nov 2016, Salt Lake City, United States. 〈http://www.cedmav.org/events/vpa-2016.html〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01353962/file/VPA_2016_paper_3.pdf BibTex
titre
The StarPU Runtime System at Exascale ?
auteur
Terry Cojean
article
RESPA workshop at SC16, Nov 2016, Salt Lake City, Utah, United States. 2016, 〈http://sc16.supercomputing.org/presentation/?id=wksp153&sess=sess138〉
Accès au bibtex
BibTex
titre
Beyond Gbps Turbo Decoder on Multi-Core CPUs
auteur
Adrien Cassagne, Thibaud Tonnellier, Camille Leroux, Bertrand Le Gal, Olivier Aumage, Denis Barthou
article
International Symposium on Turbo Codes & Iterative Information Processing, Sep 2016, Brest, France. 2016, Turbo Codes and Iterative Information Processing. 〈10.1109/ISTC.2016.7593092〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01363980/file/article.pdf BibTex
titre
Energy Consumption Analysis of Software Polar Decoders on Low Power Processors
auteur
Adrien Cassagne, Olivier Aumage, Camille Leroux, Denis Barthou, Bertrand Le Gal
article
The 2016 European Signal Processing Conference (EUSIPCO 2016), Aug 2016, Budapest, Hungary. 〈http://www.eusipco2016.org/〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01363975/file/article.pdf BibTex
titre
Resource aggregation in task-based applications over accelerator-based multicore machines
auteur
Terry Cojean, Abdou Guermouche, Andra-Ecaterina Hugo, Raymond Namyst, Pierre-André Wacrenier
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France. 2016
Accès au bibtex
BibTex
titre
Resource aggregation for task-based Cholesky Factorization on top of heterogeneous machines
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
HeteroPar’2016 worshop of Euro-Par, Aug 2016, Grenoble, France. 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01181135/file/papier%20%281%29.pdf BibTex
titre
Automatic OpenCL Task Adaptation for Heterogeneous Architectures
auteur
Pierre Huchant, Marie-Christine Counilh, Denis Barthou
article
Euro-Par, Aug 2016, Grenoble, France. pp.684 – 696, 2016, Euro-Par 2016: Parallel Processing. 〈10.1007/978-3-319-43659-3_50〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01419366/file/Euro-Par_2016_paper_169.pdf BibTex
titre
Controlling the Memory Subscription of Distributed Applications with a Task-Based Runtime System
auteur
Marc Sergent, David Goudin, Samuel Thibault, Olivier Aumage
article
21st International Workshop on High-Level Parallel Programming Models and Supportive Environments, May 2016, Chicago, United States. 2016 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW), 2016, 〈http://www.cs.wm.edu/hpc/HIPS2016/〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01284004/file/PID4127657.pdf BibTex
titre
Are Static Schedules so Bad ? A Case Study on Cholesky Factorization
auteur
Emmanuel Agullo, Olivier Beaumont, Lionel Eyraud-Dubois, Suraj Kumar
article
IEEE International Parallel & Distributed Processing Symposium (IPDPS 2016), May 2016, Chicago, IL, United States. IEEE, 2016, 〈http://www.ipdps.org〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01223573/file/heteroprioCameraReady-ieeeCompatiable.pdf BibTex
titre
Exploiting Two-Level Parallelism by Aggregating Computing Resources in Task-Based Applications Over Accelerator-Based Machines
auteur
Terry Cojean
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France. 2016, 〈http://www.siam.org/meetings/pp16/〉
Accès au bibtex
BibTex
titre
Controlling the Memory Subscription of Distributed Applications with a Task-Based Runtime System
auteur
Marc Sergent, David Goudin, Samuel Thibault, Olivier Aumage
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2016), Apr 2016, Paris, France. pp.318 – 327, 2016, 〈http://www.siam.org/meetings/pp16/〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01380126/file/siampp.pdf BibTex
titre
A Stencil DSEL for Single Code Accelerated Computing with SYCL
auteur
Olivier Aumage, Denis Barthou, Alexandre Honorat
article
SYCL 2016 1st SYCL Programming Workshop during the 21st ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, Mar 2016, Barcelone, Spain. 2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01290099/file/main.pdf BibTex
titre
DKPN: A Composite Dataflow/Kahn Process Networks Execution Model
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Samuel Thibault
article
24th Euromicro International Conference on Parallel, Distributed and Network-based processing, Feb 2016, Heraklion Crete, Greece. 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01234333/file/dkpn.pdf BibTex

Reports

titre
Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
[Research Report] RR-8927, Inria Bordeaux Sud-Ouest; Bordeaux INP; CNRS; Université de Bordeaux; CEA. 2016, pp.27
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01332774/file/RR-8927.pdf BibTex
titre
Bridging the gap between OpenMP 4.0 and native runtime systems for the fast multipole method
auteur
Emmanuel Agullo, Olivier Aumage, Berenger Bramas, Olivier Coulaud, Samuel Pitoiset
article
[Research Report] RR-8953, Inria. 2016, pp.49
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01372022/file/RR-8953.pdf BibTex

Preprints, Working Papers, …

titre
Resource aggregation for task-based Cholesky Factorization on top of modern architectures
auteur
Terry Cojean, Abdou Guermouche, Andra Hugo, Raymond Namyst, Pierre-André Wacrenier
article
This paper is submitted for review to the Parallel Computing special issue for HCW and HeteroPar .. 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01409965/file/submission.pdf BibTex

2015

Journal articles

titre
List Scheduling in Embedded Systems Under Memory Constraints
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Arthur Stoutchinin, Samuel Thibault
article
International Journal of Parallel Programming, Springer Verlag, 2015, 43 (6), pp.1103-1128. 〈10.1007/s10766-014-0338-1〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01087067/file/ijpp.pdf BibTex
titre
Faithful Performance Prediction of a Dynamic Task-Based Runtime System for Heterogeneous Multi-Core Architectures
auteur
Luka Stanisic, Samuel Thibault, Arnaud Legrand, Brice Videau, Jean-François Méhaut
article
Concurrency and Computation: Practice and Experience, Wiley, 2015, pp.16. 〈10.1002/cpe〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01147997/file/CCPE14_article.pdf BibTex

Conference papers

titre
SPAWN: An Iterative, Potentials-Based, Dynamic Scheduling and Partitioning Tool
auteur
Jean-Charles Papin, Christophe Denoual, Laurent Colombet, Raymond Namyst
article
SuperComputing’15 – RESPA Workshop, Nov 2015, Austin, United States. 〈http://respa15.rice.edu/〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01223897/file/article.pdf BibTex
titre
Towards seismic wave modeling on heterogeneous many-core architectures using task-based runtime system
auteur
Víctor Martínez, David Michéa, Fabrice Dupros, Olivier Aumage, Samuel Thibault, Hideo Aochi, Philippe Olivier Alexandre Navaux
article
27th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), Oct 2015, Florianopolis, Brazil. IEEE, 2015, IEEE 27th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD). 〈http://www2.sbc.org.br/sbac/2015/〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01182746/file/sbac2015_soumission.pdf BibTex
titre
Correctness Analysis of MPI-3 Non-Blocking Communications in PARCOACH
auteur
Julien Jaeger, Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
European MPI Users’ Group Meeting , Sep 2015, Bordeaux, France. EuroMPI ’15 The 22nd European MPI Users’ Group Meeting 〈10.1145/1235〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01252321/file/EuroMPI_JSCB.pdf BibTex
titre
An Efficient, Portable and Generic Library for Successive Cancellation Decoding of Polar Codes
auteur
Adrien Cassagne, Bertrand Le Gal, Camille Leroux, Olivier Aumage, Denis Barthou
article
The 28th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2015)., Sep 2015, Raleigh, United States. The 28th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2015)., 2015, 〈http://www.csc2.ncsu.edu/workshops/lcpc2015/index.html〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01203105/file/polar_lcpc_2015.pdf BibTex
titre
PARCOACH Extension for Hybrid Applications with Interprocedural Analysis
auteur
Emmanuelle Saillard, Hugo Brunie, Patrick Carribault, Denis Barthou
article
9th International Workshop on Parallel Tools for High Performance Computing, Sep 2015, Dresden, Germany. pp.135 – 146, 2016, 〈https://tools.zih.tu-dresden.de/2015/〉. 〈10.1007/978-3-319-39589-0_11〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01420655/file/parcoach_9thPTW%20%281%29.pdf BibTex
titre
Automatic OpenCL code generation for multi-device heterogeneous architectures
auteur
Pei Li, Elisabeth Brunet, François Trahay, Christian Parrot, Gaël Thomas, Raymond Namyst
article
ICPP 2015 : 44th International Conference on Parallel Processing, Sep 2015, Beijing, China. IEEE, Proceedings ICPP 2015 : 44th International Conference on Parallel Processing, pp.959 – 968, 2015, 〈10.1109/ICPP.2015.105〉
Accès au bibtex
BibTex
titre
Bridging the Gap between Performance and Bounds of Cholesky Factorization on Heterogeneous Platforms
auteur
Emmanuel Agullo, Olivier Beaumont, Lionel Eyraud-Dubois, Julien Herrmann, Suraj Kumar, Loris Marchal, Samuel Thibault
article
Heterogeneity in Computing Workshop 2015, May 2015, Hyderabad, India. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01120507/file/Camera_ready.pdf BibTex
titre
pioman: a pthread-based Multithreaded Communication Engine
auteur
Alexandre Denis
article
Euromicro International Conference on Parallel, Distributed and Network-based Processing, Mar 2015, Turku, Finland. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01087775/file/final.pdf BibTex

Theses

titre
Virtualisation en contexte HPC
auteur
Antoine Capra
article
Analyse numérique [cs.NA]. Université de Bordeaux, 2015. Français. 〈NNT : 2015BORD0436〉
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01280434/file/CAPRA_ANTOINE_2015.pdf BibTex
titre
Ordonnancement d’applications à flux de données pour les MPSoC embarqués hybrides comprenant des unités de calcul programmables et des accélérateurs matériels
auteur
Paul-Antoine Arras
article
Architectures Matérielles [cs.AR]. Université de Bordeaux, 2015. Français. 〈NNT : 2015BORD0031〉
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01159519/file/ARRAS_PAUL-ANTOINE_2015.pdf BibTex

2014

Journal articles

titre
Process Placement in Multicore Clusters: Algorithmic Issues and Practical Techniques.
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
IEEE Transactions on Parallel and Distributed Systems, Institute of Electrical and Electronics Engineers, 2014, 25 (4), pp.993- 1002. 〈10.1109/TPDS.2013.104〉
Accès au bibtex
BibTex
titre
Composing multiple StarPU applications over heterogeneous machines: A supervised approach
auteur
Andra Hugo, Abdou Guermouche, Pierre-André Wacrenier, Raymond Namyst
article
The International Journal of High Performance Computing Applications, 2014, 28, pp.285 – 300. 〈10.1177/1094342014527575〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01101045/file/article.pdf BibTex
titre
PARCOACH: Combining static and dynamic validation of MPI collective communications
auteur
Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
International Journal of High Performance Computing Applications, SAGE Publications, 2014, pp.10.1177/1094342014552204. 〈10.1177/1094342014552204〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01078762/file/PARCOACH.pdf BibTex

Conference papers

titre
Specific Read Only Data Management for Memory Hierarchy Optimization
auteur
Gregory Vaumourin, Dombek Thomas, Guerre Alexandre, Denis Barthou
article
Jalil Boukhobza; Jean Philippe Diguet; Pierre Ficheux; José Rufino; Frank Singhoff. EWiLi 2014 – Workshop Embed With Linux, Nov 2014, Lisboa, Portugal. Vol-1291, pp.Session 2, 2014, Proceedings of the Embed With Linux 2014 Workshop. 〈http://ceur-ws.org/Vol-1291/〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01090218/file/ewili14_submission_15.pdf BibTex
titre
MBSPDiscover: An Automatic Benchmark for MultiBSP Performance Analysis
auteur
Marcelo Alaniz, Sergio Nesmachnow, Brice Goglin, Santiago Iturriaga, Veronica Gil Costa, Marcela Printista
article
First HPCLATAM – CLCAR Joint Latin American High Performance Computing Conference, Oct 2014, Valparaiso, Chile. Springer, 485, pp.158-172, 2014, Communications in Computer and Information Science (CCIS)
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01062528/file/MultiBSP-Benchmark.pdf BibTex
titre
Evaluation of OpenMP Dependent Tasks with the KASTORS Benchmark Suite
auteur
Philippe Virouleau, Pierrick Brunet, François Broquedis, Nathalie Furmento, Samuel Thibault, Olivier Aumage, Thierry Gautier
article
10th International Workshop on OpenMP, IWOMP2014, Sep 2014, Salvador, Brazil, France. Springer, 10th International Workshop on OpenMP, IWOMP2014, pp.16 – 29, 2014, 10th International Workshop on OpenMP, IWOMP2014. 〈10.1007/978-3-319-11454-5_2〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01081974/file/iwomp2014.pdf BibTex
titre
Static Validation of Barriers and Worksharing Constructs in OpenMP Applications
auteur
Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
IWOMP, Sep 2014, Salvador, Brazil. pp.73 – 86, 2014, 〈10.1007/978-3-319-11454-5_6〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01078759/file/Parcoach.pdf BibTex
titre
pioman: a Generic Framework for Asynchronous Progression and Multithreaded Communications
auteur
Alexandre Denis
article
IEEE International Conference on Cluster Computing (IEEE Cluster), Sep 2014, Madrid, Spain. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01064652/file/finale-short.pdf BibTex
titre
Exploring and Evaluating Array Layout Restructuration for SIMDization
auteur
Christopher Haine, Olivier Aumage, Petit Enguerrand, Denis Barthou
article
The 27th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2014), Sep 2014, Hillsboro, United States. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01070467/file/article_lcpc_2014.pdf BibTex
titre
A runtime approach to dynamic resource allocation for sparse direct solvers
auteur
A.-E Hugo, A Guermouche, P.-A Wacrenier, R Namyst
article
43rd International Conference on Parallel Processing, Sep 2014, Minneapolis, United States. International Conference on Parallel Processing (ICPP 2014), 2014, 〈10.1109/ICPP.2014.57〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01101054/file/AHugo.pdf BibTex
titre
netloc: Towards a Comprehensive View of the HPC System Topology
auteur
Brice Goglin, Joshua Hursey, Jeffrey M. Squyres
article
Fifth International Workshop on Parallel Software Tools and Tool Infrastructures (PSTI 2014), Sep 2014, Minneapolis, United States. IEEE, 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01010599/file/article.pdf BibTex
titre
Modeling and Simulation of a Dynamic Task-Based Runtime System for Heterogeneous Multi-Core Architectures
auteur
Luka Stanisic, Samuel Thibault, Arnaud Legrand, Brice Videau, Jean-François Méhaut
article
Euro-par – 20th International Conference on Parallel Processing, Aug 2014, Porto, Portugal. Springer International Publishing Switzerland, pp.50-62, 2014, Euro-Par 2014, LNCS 8632
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01011633/file/StarPUSG_article.pdf BibTex
titre
Dynamic Load Balancing with Pair Potentials
auteur
Jean-Charles Papin, Christophe Denoual, Laurent Colombet, Raymond Namyst
article
Euro-Par 2014 International Workshops, Aug 2014, Porto, Portugal. Springer International Publishing, Part pp.462–473, 2014, Euro-Par 2014: Parallel Processing Workshops – Euro-Par 2014 International Workshops, Porto, Portugal, August 25-26, 2014, Revised Selected Papers. 〈http://europar2014.dcc.fc.up.pt/〉. 〈10.1007/978-3-319-14313-2_39〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01223876/file/article.pdf BibTex
titre
Toward OpenCL Automatic Multi-Device Support
auteur
Sylvain Henry, Alexandre Denis, Denis Barthou, Marie-Christine Counilh, Raymond Namyst
article
Fernando Silva; Ines Dutra; Vitor Santos Costa. Euro-Par 2014, Aug 2014, Porto, Portugal. Springer, 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01005765/file/final.pdf BibTex
titre
SPAGHETtI: Scheduling/Placement Approach for Task-Graphs on HETerogeneous archItecture
auteur
Denis Barthou, Emmanuel Jeannot
article
Euro-Par, Aug 2014, Lisboa, Portugal. 8632, pp.174 – 185, 2014, LNCS. 〈10.1007/978-3-319-09873-9_15〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01100948/file/barthou_jeannot.pdf BibTex
titre
A Benchmark-based Performance Model for Memory-bound HPC Applications
auteur
Bertrand Putigny, Brice Goglin, Denis Barthou
article
International Conference on High Performance Computing & Simulation (HPCS 2014), Jul 2014, Bologna, Italy. IEEE, 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00985598/file/benchmark_based_memory_model.pdf BibTex
titre
Managing the Topology of Heterogeneous Cluster Nodes with Hardware Locality (hwloc)
auteur
Brice Goglin
article
International Conference on High Performance Computing & Simulation (HPCS 2014), Jul 2014, Bologna, Italy. IEEE, 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00985096/file/article.pdf BibTex
titre
Harnessing clusters of hybrid nodes with a sequential task-based programming model
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
International Workshop on Parallel Matrix Algorithms and Applications (PMAA 2014), Jul 2014, Lugano, Switzerland. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01283949/file/pmaa14.pdf BibTex
titre
Matching communication pattern with underlying hardware architecture
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
6th European Conference on Computational Fluid Dynamics, Jul 2014, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01087611/file/A4286.pdf BibTex
titre
Analysis of MPI Shared-Memory Communication Performance from a Cache Coherence Perspective
auteur
Bertrand Putigny, Benoit Ruelle, Brice Goglin
article
PDSEC – The 15th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing, held in conjunction with IPDPS, May 2014, Phoenix, AZ, United States. IEEE, 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00956307/file/article.pdf BibTex
titre
Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet, Samuel Thibault, George Bosilca
article
HCW’2014 workshop of IPDPS, May 2014, Phoenix, United States. IEEE, pp.29-38, 2014, 〈10.1109/IPDPSW.2014.9〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00987094/file/sparsegpus.pdf BibTex
titre
Modulariser les ordonnanceurs de tâches : une approche structurelle
auteur
Marc Sergent, Simon Archipoff
article
Pascal Felber; Laurent Philippe; Etienne Riviere; Arnaud Tisserand. ComPAS 2014 : conférence en parallélisme, architecture et systèmes, Apr 2014, Neuchâtel, Suisse. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00978364/file/ordonnanceurs_modulaires.pdf BibTex
titre
Overview of Distributed Linear Algebra on Hybrid Nodes over the StarPU Runtime
auteur
Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, Marc Sergent, Samuel Thibault
article
SIAM Conference on Parallel Processing for Scientific Computing (SIAM PP 2014), Feb 2014, Portland, Oregon, United States. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00978602/file/siampp14.pdf BibTex

Book sections

titre
An Overview of Process Mapping Techniques and Algorithms in High-Performance Computing
auteur
Torsten Hoefler, Emmanuel Jeannot, Guillaume Mercier
article
Emmanuel Jeannot and Julius Zilinskas. High Performance Computing on Complex Environments, Wiley, pp.75-94, 2014, 978-1-118-71205-4
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921626/file/Chapter_5.pdf BibTex
titre
DSL Stream Programming on Multicore Architectures
auteur
Pablo De Oliveira Castro, Stéphane Louise, Denis Barthou
article
Programming multi-core and many-core computing systems, John Wiley and Sons, chapter 12, 2014, 978-0-470-93690-0
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00952318/file/dsl-preprint11.pdf BibTex

Directions of work or proceedings

titre
Euro-Par 2014: Parallel Processing Workshops, Part I
auteur
Luis Lopez, Julius Zilinskas, Alexandru Costan, Roberto Gioacchino Cascella, Gabor Kecskemeti, Emmanuel Jeannot, Mario Cannataro, Laura Ricci, Siegfried Benkner, Salvador Petit, Vittorio Scarano, José Gracia, Sascha Hunold, Stephen L. Scott, Stefan Lankes, Christian Lengauer, Jesus Carretero, Jens Breitbart, Michael Alexander
article
Aug 2014, Porto, Portugal. 8805, Springer, 2014, Lecture Note In Computer Science, 978-3-319-14312-5
Accès au bibtex
BibTex
titre
Euro-Par 2014: Parallel Processing Workshops, Part II
auteur
Luis Lopez, Julius Zilinskas, Alexandru Costan, Roberto Gioacchino Cascella, Gabor Kecskemeti, Emmanuel Jeannot, Mario Cannataro, Laura Ricci, Siegfried Benkner, Salvador Petit, Vittorio Scarano, José Gracia, Sascha Hunold, Stephen L. Scott, Stefan Lankes, Christian Lengauer, Jesus Carretero, Jens Breitbart, Michael Alexander
article
Aug 2014, Porto, Portugal. 8806, Springer, 2014, Lecture Note In Computer Science, 978-3-319-14312-5
Accès au bibtex
BibTex

Habilitation à diriger des recherches

titre
Vers des mécanismes génériques de communication et une meilleure maîtrise des affinités dans les grappes de calculateurs hiérarchiques
auteur
Brice Goglin
article
Calcul parallèle, distribué et partagé [cs.DC]. Université de Bordeaux, 2014
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00979512/file/hdr.pdf BibTex

Books

titre
High Performance Computing on Complex Environments
auteur
Emmanuel Jeannot, Julius Žilinskas
article
Emmanuel Jeannot and Julius Žilinskas. Wiley, pp.512, 2014, 978-1-118-71205-4
Accès au bibtex
BibTex

Reports

titre
Programming Abstractions for Data Locality
auteur
Adrian Tate, Amir Kamil, Anshu Dubey, Armin Größlinger, Brad Chamberlain, Brice Goglin, Carter Edwards, Chris J. Newburn, David Padua, Didem Unat, Emmanuel Jeannot, Frank Hannig, Tobias Gysi, Hatem Ltaief, James Sexton, Jesus Labarta, John Shalf, Karl Fürlinger, Kathryn O’brien, Leonidas Linardakis, Maciej Besta, Marie-Christine Sawley, Mark Abraham, Mauro Bianco, Miquel Pericàs, Naoya Maruyama, Paul H. J. Kelly, Peter Messmer, Robert B. Ross, Romain Cledat, Satoshi Matsuoka, Thomas Schulthess, Torsten Hoefler, Vitus J. Leung
article
[Research Report] PADAL Workshop 2014, April 28–29, Swiss National Supercomputing Center (CSCS), Lugano, Switzerland. 2014, pp.54
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01083080/file/PADAL-report.pdf BibTex
titre
StarPU-MPI: Task Programming over Clusters of Machines Enhanced with Accelerators
auteur
Cédric Augonnet, Olivier Aumage, Nathalie Furmento, Samuel Thibault, Raymond Namyst
article
[Research Report] RR-8538, INRIA. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00992208/file/RR-8538.pdf BibTex
titre
Modeling and Simulation of a Dynamic Task-Based Runtime System for Heterogeneous Multi-Core Architectures
auteur
Luka Stanisic, Samuel Thibault, Arnaud Legrand, Brice Videau, Jean-François Méhaut
article
[Research Report] RR-8509, INRIA. 2014
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00966862/file/RR-8509.pdf BibTex
titre
Taking advantage of hybrid systems for sparse direct solvers via task-based runtimes
auteur
Xavier Lacoste, Mathieu Faverge, Pierre Ramet, Samuel Thibault, George Bosilca
article
[Research Report] RR-8446, INRIA. 2014, pp.25
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00925017/file/RR-8446.pdf BibTex

Theses

titre
Benchmark-driven approaches to performance modeling of multi-core architectures
auteur
Bertrand Putigny
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2014. English. 〈NNT : 2014BORD0155〉
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00984791/file/PUTIGNY_BERTRAND_2014.pdf BibTex

2013

Journal articles

titre
Les réseaux pour le calcul haute performance : facteur, livreur ou déménageur ?
auteur
Brice Goglin
article
Interstices, INRIA, 2013
Accès au bibtex
BibTex
titre
Process Placement in Multicore Clusters: Algorithmic Issues and Practical Techniques
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
IEEE Transactions on Parallel and Distributed Systems, Institute of Electrical and Electronics Engineers, 2013
Accès au bibtex
BibTex
titre
Idée reçue: Comparer la puissance de deux ordinateurs, c’est facile !
auteur
Brice Goglin, Bertrand Putigny
article
Interstices, INRIA, 2013, pp.1
Accès au bibtex
BibTex
titre
KNEM: a Generic and Scalable Kernel-Assisted Intra-node MPI Communication Framework
auteur
Brice Goglin, Stéphanie Moreaud
article
Journal of Parallel and Distributed Computing, Elsevier, 2013, 73 (2), pp.176-188. 〈10.1016/j.jpdc.2012.09.016〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00731714/file/article.pdf BibTex
titre
Symbolic Mapping and Allocation for the Cholesky Factorization on NUMA machines: Results and Optimizations
auteur
Emmanuel Jeannot
article
International Journal of High Performance Computing Applications, SAGE Publications, 2013, 27 (3), pp.283–290
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00921611/file/jeannot.pdf BibTex

Conference papers

titre
MIL : A language to build program analysis tools through static binary instrumentation
auteur
Andres Charif-Rubial, Denis Barthou, Cédric Valensi, Shende Sameer, Allen Malony, William Jalby
article
High Performance Computing, Dec 2013, India. pp. 206-215, 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00920875/file/MIL_HiPC13.pdf BibTex
titre
Adaptive Task Size Control on High Level Programming for GPU/CPU Work Sharing
auteur
Tetsuya Odajima, Taisuke Boku, Mitsuhisa Sato, Toshihiro Hanawa, Yuetsu Kodama, Raymond Namyst, Samuel Thibault, Olivier Aumage
article
The 2013 International Symposium on Advances of Distributed and Parallel Computing (ADPC 2013), Dec 2013, Vietri sul Mare, Italy. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00920915/file/ADPC2013-117.pdf BibTex
titre
High Performance Code Generation for Stencil Computation on Heterogeneous Multi-device Architectures
auteur
Pei Li, Elisabeth Brunet, Raymond Namyst
article
HPCC-15th IEEE International Conference on High Performance Computing and Communications, Nov 2013, Zhangjiajie, China. IEEE Computer Society, 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00925481/file/HPCC2013.pdf BibTex
titre
List Scheduling in Embedded Systems under Memory Constraints
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Arthur Stoutchinin, Samuel Thibault
article
Juan Guerrero. SBAC-PAD’2013 – 25th International Symposium on Computer Architecture and High-Performance Computing, Oct 2013, Porto de Galinhas, Brazil. IEEE Computer Society, pp.152-159, 2013, 〈10.1109/SBAC-PAD.2013.22〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00906117/file/sbac13_checked_by_PDF_eXpress_.pdf BibTex
titre
Detecting SIMDization Opportunities through Static/Dynamic Dependence Analysis
auteur
Olivier Aumage, Denis Barthou, Christopher Haine, Tamara Meunier
article
PROPER – 6th Workshop on Productivity and Performance – 2013, Sep 2013, Aachen, Germany. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00858004/file/proper_2013_paper_17_camera_ready.pdf BibTex
titre
Communication and Topology-aware Load Balancing in Charm++ with TreeMatch
auteur
Emmanuel Jeannot, Esteban Meneses, Guillaume Mercier, François Tessier, Gengbin Zheng
article
IEEE Cluster 2013, Sep 2013, Indianapolis, United States. IEEE, 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00851148/file/publi.pdf BibTex
titre
ViperVM: a Runtime System for Parallel Functional High-Performance Computing on Heterogeneous Architectures
auteur
Sylvain Henry
article
2nd Workshop on Functional High-Performance Computing (FHPC’13), Sep 2013, Boston, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00851122/file/fhpc13.pdf BibTex
titre
Combining Static and Dynamic Validation of MPI Collective Communication
auteur
Emmanuelle Saillard, Patrick Carribault, Denis Barthou
article
EuroMPI 2013, Sep 2013, Madrid, Spain. pp.117-122, 2013, 〈10.1145/2488551.2488555〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00920901/file/sigproc-sp.pdf BibTex
titre
Towards exascale with the ANR-JST japanese-french project FP3C (Framework and Programming for Post- Petascale Computing)
auteur
Gabriel Antoniu, Taisuke Boku, Christophe Calvin, Philippe Codognet, Michel Dayde, Nahid Emad, Yuyaka Ishikawa, Satoshi Matsuoka, Kengo Nakajima, Hiroshi Nakashima, Raymond Namyst, Serge Petiton, Tetsuya Sakurai, Mitsuhisa Sato
article
9th International Conference on Computer Science and Information Technologies, Sep 2013, Yerevan, Armenia. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00922754/file/FP3C-CSIT13-v3.pdf BibTex
titre
Dynamic Thread Pinning for Phase-Based OpenMP Programs
auteur
Abdelhafid Mazouz, Sid Touati, Denis Barthou
article
Wolf, Felix and Mohr, Bernd and an Mey, Dieter. The Euro-Par 2013 conference, Aug 2013, Aachen, Germany. Springer, 8097, pp.53-64, 2013, Lecture Notes in Computer Science. 〈10.1007/978-3-642-40047-6_8〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00847482/file/MainEuroPar2013.pdf BibTex
titre
Automated Code Generation for Lattice Quantum Chromodynamics and beyond
auteur
Denis Barthou, Olivier Brand-Foissac, Olivier Pene, Gilbert Grosdidier, Romain Dolbeau, Christine Eisenbeis, Michael Kruse, Konstantin Petrov, Claude Tadonki
article
25th IUPAP Conference on Computational Physics (CCP2013), Aug 2013, Moscow, Russia. IOP, Journal of Physics: Conference Series, 510, pp.012005, 2014, 〈10.1088/1742-6596/510/1/012005〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00926513/file/qiral.pdf BibTex
titre
A NUMA-aware fine grain parallelization framework for multi-core architecture
auteur
Corentin Rossignon, Hénon Pascal, Olivier Aumage, Samuel Thibault
article
PDSEC – 14th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing – 2013, May 2013, Boston, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00858350/file/taggre_pdsec_2013.pdf BibTex
titre
Composing multiple StarPU applications over heterogeneous machines: a supervised approach
auteur
Andra-Ecaterina Hugo, Abdou Guermouche, Raymond Namyst, Pierre-André Wacrenier
article
Third International Workshop on Accelerators and Hybrid Exascale Systems, May 2013, Boston, United States. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00824514/file/PID2692011.pdf BibTex
titre
Implementation of FEM Application on GPU with StarPU
auteur
Satoshi Ohshima, Satoshi Katagiri, Kengo Nakajima, Samuel Thibault, Raymond Namyst
article
SIAM CSE13 – SIAM Conference on Computational Science and Engineering 2013, Feb 2013, Boston, United States. 2013
Accès au bibtex
BibTex
titre
Hydra: Automatic algorithm exploration from linear algebra equations
auteur
Alexandre Duchâteau, David Padua, Denis Barthou
article
Code Generation and Optimization, Feb 2013, Shenzhen, China. pp.1-10, 2013
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00920869/file/paper.pdf BibTex
titre
TreeMatch : Un algorithme de placement de processus sur architectures multicœurs
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
RenPAR – 21e Rencontres Francophones du Parallélisme, Jan 2013, Grenoble, France. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00773254/file/publi.pdf BibTex
titre
Ordonnancement de liste dans les systèmes embarqués sous contrainte de mémoire
auteur
Paul-Antoine Arras, Didier Fuin, Emmanuel Jeannot, Arthur Stoutchinin, Samuel Thibault
article
ComPAS’13 / RenPar’21 – 21es Rencontres francophones du Parallélisme, Jan 2013, Grenoble, France. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772854/file/renpar.pdf BibTex
titre
Le problème de la composition parallèle : une approche supervisée
auteur
Andra-Ecaterina Hugo
article
RenPAR – 21e Rencontres Francophones du Parallélisme (2013), Jan 2013, Grenoble, France. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00773610/file/AH_Composabilite_Renpar.pdf BibTex
titre
Optimisation du produit matrice-vecteur creux sur architecture GPU pour un simulateur de réservoir
auteur
Corentin Rossignon
article
ComPAS’13 / RenPar’21 – 21es Rencontres francophones du Parallélisme, Jan 2013, Grenoble, France. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00773571/file/solver_gpu.pdf BibTex

Book sections

titre
Adding Virtualization Capabilities to the Grid’5000 Testbed
auteur
Daniel Balouek, Alexandra Carpen-Amarie, Ghislain Charrier, Frédéric Desprez, Emmanuel Jeannot, Emmanuel Jeanvoine, Adrien Lèbre, David Margery, Nicolas Niclausse, Lucas Nussbaum, Olivier Richard, Christian Pérez, Flavien Quesnel, Cyril Rohr, Luc Sarzyniec
article
Ivanov, IvanI. and Sinderen, Marten and Leymann, Frank and Shan, Tony. Cloud Computing and Services Science, 367, Springer International Publishing, pp.3-20, 2013, Communications in Computer and Information Science, 978-3-319-04518-4. 〈10.1007/978-3-319-04519-1_1〉
Accès au bibtex
BibTex

Master thesis

titre
Support exécutif scalable pour les architectures hybrides distribuées
auteur
Marc Sergent
article
Informatique [cs]. 2013
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01284235/file/Memoire-Master2-fr_FR.pdf BibTex

Reports

titre
Automated Code Generation for Lattice QCD Simulation
auteur
Denis Barthou, Gilbert Grosdidier, Konstantin Petrov, Michael Kruse, Christine Eisenbeis, Olivier Pène, Olivier Brand-Foissac, Claude Tadonki, Romain Dolbeau
article
[Research Report] RR-8417, INRIA. 2013, pp.13
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00918812/file/RR-8417.pdf BibTex
titre
SOCL: An OpenCL Implementation with Automatic Multi-Device Adaptation Support
auteur
Sylvain Henry, Denis Barthou, Alexandre Denis, Raymond Namyst, Marie-Christine Counilh
article
[Research Report] RR-8346, INRIA. 2013, pp.18
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00853423/file/RR-8346.pdf BibTex
titre
C Language Extensions for Hybrid CPU/GPU Programming with StarPU
auteur
Ludovic Courtès
article
[Research Report] RR-8278, INRIA. 2013, pp.25
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00807033/file/RR-8278.pdf BibTex
titre
Médiation Scientifique : une facette de nos métiers de la recherche
auteur
Antoine Rousseau, Aurélie Darnaud, Brice Goglin, Céline Acharian, Christine Leininger, Christophe Godin, Clarisse Holik, Claude Kirchner, Diane Rives, Elodie Darquie, Erwan Kerrien, Fabrice Neyret, Florent Masseglia, Florian Dufour, Gérard Berry, Gilles Dowek, Hélène Robak, Hélène Xypas, Irina Illina, Isabelle Gnaedig, Joanna Jongwane, Jocelyne Ehrel, Laurent Viennot, Laure Guion, Lisette Calderan, Lola Kovacic, Marie Collin, Marie-Agnès Enard, Marie-Hélène Comte, Martin Quinson, Martine Olivi, Mathieu Giraud, Mathilde Dorémus, Mia Ogouchi, Muriel Droin, Nathalie Lacaux, Nicolas Rougier, Nicolas Roussel, Pascal Guitton, Pierre Peterlongo, Rose-Marie Cornus, Simon Vandermeersch, Sophie Maheo, Sylvain Lefebvre, Sylvie Boldo, Thierry Viéville, Véronique Poirel, Aline Chabreuil, Arnaud Fischer, Claude Farge, Claude Vadel, Isabelle Astic, Jean-Pierre Dumont, Loic Féjoz, Patrick Rambert, Pierre Paradinas, Sophie De Quatrebarbes, Stéphane Laurent
article
[Interne] none. 2013, pp.34
Accès au bibtex
BibTex
titre
Process Placement in Multicore Clusters: Algorithmic Issues and Practical Techniques
auteur
Emmanuel Jeannot, Guillaume Mercier, François Tessier
article
[Research Report] RR-8269, INRIA. 2013, pp.32
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00803548/file/RR-8269.pdf BibTex

Theses

titre
Ordonnancement dynamique, adapté aux architectures hétérogènes, de la méthode multipôle pour les équations de Maxwell, en électromagnétisme
auteur
Cyril Bordage
article
Autre [cs.OH]. Université Sciences et Technologies – Bordeaux I, 2013. Français. 〈NNT : 2013BOR15026〉
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00958494/file/BORDAGE_CYRIL_2013_CORR.pdf BibTex
titre
Programming Models and Runtime Systems for Heterogeneous Architectures
auteur
Sylvain Henry
article
Other [cs.OH]. Université Sciences et Technologies – Bordeaux I, 2013. English. 〈NNT : 2013BOR14899〉
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00948309/file/HENRY_SYLVAIN_2013.pdf BibTex

2012

Journal articles

titre
Reliability of task graph schedules with transient and fail-stop failures: complexity and algorithms
auteur
Anne Benoit, Louis-Claude Canon, Emmanuel Jeannot, Yves Robert
article
Journal of Scheduling, Springer Verlag, 2012, 15 (5), pp.615-627. 〈10.1007/s10951-011-0236-y〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00653477/file/JoS_rev1.pdf BibTex
titre
Optimizing performance and reliability on heterogeneous parallel systems: Approximation algorithms and heuristics
auteur
Emmanuel Jeannot, Erik Saule, Denis Trystram
article
Journal of Parallel and Distributed Computing, Elsevier, 2012, 72 (2), pp.268-280
Accès au bibtex
BibTex
titre
Traitements d’Images sur Architectures Parallèles et Hétérogènes
auteur
Sidi Mahmoudi, Pierre Manneback, Cédric Augonnet, Samuel Thibault
article
Technique et Science Informatiques, Hermès-Lavoisier, 2012
Accès au bibtex
BibTex
titre
Programmation unifiée multi-accélérateur OpenCL
auteur
Henry Sylvain, Alexandre Denis, Denis Barthou
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, Lavoisier, 2012, 31 (8-9-10), pp.1233-1249. 〈10.3166/TSI.31.1233-1249〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772742/file/SOCL_TSI2011.pdf BibTex

Conference papers

titre
Automatic efficient data layout for multithreaded stencil codes on CPUs and GPUs
auteur
Julien Jaeger, Denis Barthou
article
High Performance Computing conference, Dec 2012, India. pp.1-10, 2012
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00793201/file/Jaeger_Barthou_hipc2012.pdf BibTex
titre
Performance Analysis and Optimization of the Tiled Cholesky Factorization on NUMA Machines
auteur
Emmanuel Jeannot
article
PAAP 2012 – IEEE International Symposium on Parallel Architectures, Algorithms and Programming, Dec 2012, Taipei, Taiwan. IEEE, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00772790/file/jeannot.pdf BibTex
titre
High performance checksum computation for fault-tolerant MPI over InfiniBand
auteur
Alexandre Denis, François Trahay, Yutaka Ishikawa
article
Jesper Larsson Träff, Siegfried Benkner and Jack Dongarra. the 19th European MPI Users’ Group Meeting (EuroMPI 2012), Sep 2012, Vienna, Austria. Springer, 7490, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00716478/file/final.pdf BibTex
titre
Parallelization on Heterogeneous Multicore and Multi-GPU Systems of the Fast Multipole Method for the Helmholtz Equation Using a Runtime System
auteur
Cyril Bordage
article
ADVCIMP12, Sep 2012, Barcelone, Spain. IARIA, pp.90-95, 2012, ADVCOMP 2012, The Sixth International Conference on Advanced Engineering Computing and Applications in Sciences. 〈http://www.thinkmind.org/index.php?view=article&articleid=advcomp_2012_4_30_20132〉
Accès au bibtex
BibTex
titre
StarPU-MPI: Task Programming over Clusters of Machines Enhanced with Accelerators
auteur
Cédric Augonnet, Olivier Aumage, Nathalie Furmento, Raymond Namyst, Samuel Thibault
article
Jesper Larsson Träff, Siegfried Benkner and Jack Dongarra. The 19th European MPI Users’ Group Meeting (EuroMPI 2012), Sep 2012, Vienna, Austria. Springer, 7490, 2012, LNCS
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00725477/file/submitted_poster.pdf BibTex
titre
High-Level Support for Pipeline Parallelism on Many-Core Architectures
auteur
Siegfried Benkner, Enes Bajrovic, Erich Marth, Martin Sandrieser, Raymond Namyst, Samuel Thibault
article
Europar – International European Conference on Parallel and Distributed Computing – 2012, Aug 2012, Rhodes Island, Greece. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00697020/file/europar2012-submitted.pdf BibTex
titre
QIRAL: A High Level Language for Lattice QCD Code Generation
auteur
Denis Barthou, Gilbert Grosdidier, Michael Kruse, Olivier Pène, Claude Tadonki
article
Electronic Proceedings in Theoretical Computer Science. ETAPS 2012, Mar 2012, Tallin, Estonia. pp.37-43, 2012, 〈10.4204/EPTCS〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00666885/file/paper.pdf BibTex
titre
Programmability and Performance Portability Aspects of Heterogeneous Multi-/Manycore Systems
auteur
Christoph Kessler, Usman Dastgeer, Samuel Thibault, Raymond Namyst, Andrew Richards, Uwe Dolinsky, Siegfried Benkner, Jesper Larsson Träff, Sabri Pllana
article
Design, Automation and Test in Europe (DATE), Mar 2012, Dresden, Germany. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00776610/file/date12-paper.pdf BibTex

Master thesis

titre
Programmation des architectures hétérogènes à l’aide de tâches divisibles
auteur
Marc Sergent
article
Informatique [cs]. 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01284136/file/Internship-report-Master1-fr_FR.pdf BibTex

Books

titre
Proceedings of Euro-Par 2011: Parallel Processing Workshops – CCPI, CGWS, HeteroPar, HiBB, HPCVirt, HPPC, HPSS, MDGS, ProPer, Resilience, UCHPC, VHPC, Bordeaux, France, August 29 – September 2, 2011, Revised Selected Papers, Part I
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Michael Alexander and Pasqua D’Ambra and Adam Belloum and George Bosilca and Mario Cannataro and Marco Danelutto and Beniamino Di Martino and Michael Gerndt and Emmanuel Jeannot and Raymond Namyst and Jean Roman and Stephen L. Scott and Jesper Larsson Trä. Springer, 7155, pp.524, 2012, LNCS, 978-3-642-29736-6
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011: Parallel Processing Workshops – CCPI, CGWS, HeteroPar, HiBB, HPCVirt, HPPC, HPSS, MDGS, ProPer, Resilience, UCHPC, VHPC, Bordeaux, France, August 29 – September 2, 2011, Revised Selected Papers, Part II
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Michael Alexander and Pasqua D’Ambra and Adam Belloum and George Bosilca and Mario Cannataro and Marco Danelutto and Beniamino Di Martino and Michael Gerndt and Emmanuel Jeannot and Raymond Namyst and Jean Roman and Stephen L. Scott and Jesper Larsson Trä. Springer, 7156, pp.480, 2012, 978-3-642-29739-7
Accès au bibtex
BibTex

Reports

titre
Supporting Experimental Computer Science
auteur
Frédéric Desprez, Geoffrey Fox, Emmanuel Jeannot, Kate Keahey, Michael Kozuch, David Margery, Pierre Neyron, Lucas Nussbaum, Christian Pérez, Olivier Richard, Warren Smith, Gregor Von Laszewski, Jens Vöckler
article
[Research Report] RR-8035, INRIA. 2012, pp.29
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00722605/file/RR-8035.pdf BibTex
titre
Adding Virtualization Capabilities to Grid’5000
auteur
Daniel Balouek, Alexandra Carpen-Amarie, Ghislain Charrier, Frédéric Desprez, Emmanuel Jeannot, Emmanuel Jeanvoine, Adrien Lèbre, David Margery, Nicolas Niclausse, Lucas Nussbaum, Olivier Richard, Christian Pérez, Flavien Quesnel, Cyril Rohr, Luc Sarzyniec
article
[Research Report] RR-8026, INRIA. 2012, pp.18
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00720910/file/RR-8026.pdf BibTex
titre
Supporting Experimental Computer Science
auteur
Frédéric Desprez, Geoffrey Fox, Emmanuel Jeannot, Kate Keahey, Michael Kozuch, David Margery, Pierre Neyron, Lucas Nussbaum, Christian Pérez, Olivier Richard, Warren Smith, Gregor Von Laszewski, Jens Vöckler
article
[Research Report] Argonne National Laboratory Technical Memo 326, 2012
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00720815/file/Supporting_Experimental_Computer_Science_final_draft.pdf BibTex

Theses

titre
Exploitation efficace des architectures parallèles de type grappes de NUMA à l’aide de modèles hybrides de programmation
auteur
Jérôme Clet-Ortega
article
Calcul parallèle, distribué et partagé [cs.DC]. Université Sciences et Technologies – Bordeaux I, 2012. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00773007/file/CLET-ORTEGA_JEROME_2012.pdf BibTex

2011

Journal articles

titre
Process optimisation using the combination of simulation and experimental design approach: Application to wet air oxidation
auteur
Sébastien Lefèvre, Jean-Henry Ferrasse, Olivier Boutin, Michelle Sergent, Rémy Faucherand, Alain Viand
article
Chemical Engineering Research and Design, Elsevier, 2011, 89 (7), pp.1045-1055. 〈10.1016/j.cherd.2010.12.009〉
Accès au bibtex
BibTex
titre
Hardware Locality: Peering under the hood of your server
auteur
Brice Goglin, Jeffrey Squyres, Samuel Thibault
article
Linux Pro Magazine, Linux New Media USA, LLC, 2011, pp.28-33
Accès au bibtex
BibTex
titre
Et plus vite si affinités…
auteur
Brice Goglin
article
Interstices, INRIA, 2011
Accès au bibtex
BibTex
titre
De votre boulangerie à un système d’exploitation multiprocesseur
auteur
Brice Goglin
article
Interstices, INRIA, 2011
Accès au bibtex
BibTex
titre
High-Performance Message Passing over generic Ethernet Hardware with Open-MX
auteur
Brice Goglin
article
Parallel Computing, Elsevier, 2011, 37 (2), pp.85-100. 〈10.1016/j.parco.2010.11.001〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00533058/file/article.pdf BibTex
titre
PEPPHER: Efficient and Productive Usage of Hybrid Computing Systems
auteur
Siegfried Benkner, Sabri Pllana, Jesper Larsson Träff, Philippas Tsigas, Uwe Dolinsky, Cédric Augonnet, Beverly Bachmayer, Christoph Kessler, David Moloney, Vitaly Osipov
article
IEEE Micro, Institute of Electrical and Electronics Engineers, 2011, 31 (5), pp.28-41. 〈10.1109/MM.2011.67〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00648480/file/micro2011.pdf BibTex
titre
NIC-assisted cache-efficient receive stack for message passing over Ethernet
auteur
Brice Goglin
article
Concurrency and Computation: Practice and Experience, Wiley, 2011, Special Issue: Euro-Par 2009, 23 (2), pp.199-210. 〈10.1002/cpe.1632〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00496301/file/article.pdf BibTex
titre
StarPU: a unified platform for task scheduling on heterogeneous multicore architectures
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
Concurrency and Computation: Practice and Experience, Wiley, 2011, Euro-Par 2009 best papers, 23 (2), pp.187-198
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00550877/file/ccpe10.pdf BibTex

Conference papers

titre
Performance modeling for power consumption reduction on SCC
auteur
Bertrand Putigny, Brice Goglin, Denis Barthou
article
Hasso Plattner Institute at University of Potsdam. 4th Many-core Applications Research Community (MARC) Symposium, Dec 2011, Potsdam, Germany. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00649635/file/Performance_modeling_for_power_consumption_reduction_on_SCC_-_INIRA_Putigny_Goglin_Barthou.pdf BibTex
titre
Modélisation du coût de la cohérence de cache pour améliorer le tuilage de boucles
auteur
Bertrand Putigny, Denis Barthou, Brice Goglin
article
Quatrièmes rencontres de la communauté française de compilation, Dec 2011, Saint-Hippolyte, France. 2011
Accès au bibtex
BibTex
titre
A sampling-based approach for communication libraries auto-tuning
auteur
Élisabeth Brunet, François Trahay, Alexandre Denis, Raymond Namyst
article
IEEE International Conference on Cluster Computing, Sep 2011, Austin, United States. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00605735/file/main.pdf BibTex
titre
Improving MPI Applications Performance on Multicore Clusters with Rank Reordering
auteur
Guillaume Mercier, Emmanuel Jeannot
article
Springer. EuroMPI, Sep 2011, Santorini, Italy. 6960, pp.39-49, 2011, Recent Advances in the Message Passing Interface – Proceedings of the 18th European MPI Users’ Group Meeting. 〈http://www.springerlink.com/content/t3n258x7702668l0/〉. 〈10.1007/978-3-642-24449-0〉
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00643151/file/Mercier_Jeannot_eurompi2k11_final.pdf BibTex
titre
Kernel Assisted Collective Intra-node MPI Communication Among Multi-core and Many-core CPUs
auteur
Teng Ma, George Bosilca, Aurélien Bouteiller, Brice Goglin, Jeffrey Squyres, Jack Dongarra
article
IEEE. 40th International Conference on Parallel Processing (ICPP-2011), Sep 2011, Taipei, Taiwan. 2011, 〈10.1109/ICPP.2011.29〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00602877/file/collknem.pdf BibTex
titre
Flexible runtime support for efficient skeleton programming on hybrid systems
auteur
Usman Dastgeer, Christoph Kessler, Samuel Thibault
article
International conference on Parallel Computing (ParCo), Aug 2011, Gent, Belgium. 2011
Accès au bibtex
BibTex
titre
The PEPPHER Approach to Programmability and Performance Portability for Heterogeneous many-core Architectures
auteur
Siegfried Benkner, Sabri Pllana, Jesper Larsson Träff, Philippas Tsigas, Andrew Richards, Raymond Namyst, Beverly Bachmayer, Christoph Kessler, David Moloney, Peter Sanders
article
ParCo, Aug 2011, Ghent, Belgium. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00661320/file/peppher_parco_2011.pdf BibTex
titre
A High-Performance Superpipeline Protocol for InfiniBand
auteur
Alexandre Denis
article
E. Jeannot AND R. Namyst AND J. Roman. Euro-Par 2011, Aug 2011, Bordeaux, France. Springer, 6853, pp.276-287, 2011, Lecture Notes in Computer Science
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00586015/file/main.pdf BibTex
titre
Reducing Memory Requirements of Stream Programs by Graph Transformations
auteur
Pablo De Oliveira Castro, Stéphane Louise, Denis Barthou
article
International IEEE Conference on High Performance Computing and Simulation, Jun 2011, Caen, France. p171-180, 2010, 〈10.1109/HPCS.2010.5547134〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00551584/file/streammemory-hpcs10.pdf BibTex
titre
LU Factorization for Accelerator-based Systems
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Mathieu Faverge, Julien Langou, Hatem Ltaief, Stanimire Tomov
article
9th ACS/IEEE International Conference on Computer Systems and Applications (AICCSA 11), Jun 2011, Sharm El-Sheikh, Egypt. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00654193/file/plagma_lu.pdf BibTex
titre
A Scheduling and Certification Algorithm for Defeating Collusion in Desktop Grids
auteur
Louis-Claude Canon, Emmanuel Jeannot, Jon Weissman
article
International Conference on Distributed Computing Systems, Jun 2011, Minneapolis, United States. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00653493/file/camera.pdf BibTex
titre
Towards Real-Time, Volunteer Distributed Computing
auteur
Sangho Yi, Emmanuel Jeannot, Derrick Kondo, David P. Anderson
article
11th IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing (CCGrid 2011), May 2011, Newport Beach, CA, United States. 2011
Accès au bibtex
BibTex
titre
EZTrace: a generic framework for performance analysis
auteur
François Trahay, François Rue, Mathieu Faverge, Yutaka Ishikawa, Raymond Namyst, Jack Dongarra
article
IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid), May 2011, Newport Beach, CA, United States. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00587216/file/short_paper_eztrace_ccgrid2011.pdf BibTex
titre
MO-Greedy: an extended beam-search approach for solving a multi-criteria scheduling problem on heterogeneous machines
auteur
Louis-Claude Canon, Emmanuel Jeannot
article
International Heterogeneity in Computing Workshop, May 2011, Anchorage, United States. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00653724/file/hcw11.pdf BibTex
titre
Dodging Non-Uniform I/O Access in Hierarchical Collective Operations for Multicore Clusters
auteur
Brice Goglin, Stéphanie Moreaud
article
IEEE. CASS 2011: The 1st Workshop on Communication Architecture for Scalable Systems, held in conjunction with IPDPS 2011, May 2011, Anchorage, United States. 7p, 2011, 〈10.1109/IPDPS.2011.222〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00566246/file/article.pdf BibTex
titre
QR Factorization on a Multicore Node Enhanced with Multiple GPU Accelerators
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Mathieu Faverge, Hatem Ltaief, Samuel Thibault, Stanimire Tomov
article
25th IEEE International Parallel & Distributed Processing Symposium, May 2011, Anchorage, United States. 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00547614/file/plagma_qr.pdf BibTex
titre
Détection optimale des coins et contours dans des bases d’images volumineuses sur architectures multicœurs hétérogènes
auteur
Sidi Mahmoudi, Pierre Manneback, Cédric Augonnet, Samuel Thibault
article
Rencontres francophones du parallélisme, May 2011, Saint-Malo, France. 2011
Accès au bibtex
BibTex
titre
Programmation multi-accélérateurs unifiée en OpenCL
auteur
Henry Sylvain
article
RenPAR’20, May 2011, Saint Malo, France. pp.XXX, 2011
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00643257/file/SOCLRenpar2011.pdf BibTex
titre
Analysing the Variability of OpenMP Programs Performances on Multicore Architectures
auteur
Abdelhafid Mazouz, Sid Touati, Denis Barthou
article
Fourth Workshop on Programmability Issues for Heterogeneous Multicores (MULTIPROG-2011), Jan 2011, Heraklion, Greece. pp.14, 2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00637957/file/Analysing_the_Variability.pdf BibTex

Master thesis

titre
Optimisation des communications pour les calculs parallèles avec SALOME/YACS et PadicoTM
auteur
Sébastien Barascou
article
Réseaux et télécommunications [cs.NI]. 2011
Accès au bibtex
BibTex
titre
Association de modèles de programmation pour l’exploitation de clusters de GPUs dans le calcul intensif
auteur
C. Roelandt, Olivier Aumage, Samuel Thibault
article
Calcul parallèle, distribué et partagé [cs.DC]. 2011
Accès au bibtex
BibTex
titre
Etude de la parallélisation du produit Matrice/Vecteur creux sur processeurs hétérogènes.
auteur
Corentin Rossignon, Olivier Aumage, Samuel Thibault
article
Calcul parallèle, distribué et partagé [cs.DC]. 2011
Accès au bibtex
BibTex

Books

titre
Computing Networks: From Cluster to Cloud Computing
auteur
Pascale Vicat-Blanc Primet, Brice Goglin, Romaric Guillier, Sebastien Soudan
article
Wiley-ISTE, pp.261, 2011, 978-1-84821-286-2
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011 Parallel Processing – 17th International Conference, Part I
auteur
Emmanuel Jeannot, Jean Roman, Raymond Namyst
article
Emmanuel Jeannot and Raymond Namyst and Jean Roman. Springer, 6852, pp.598, 2011, LNCS, 978-3-642-23399-9. 〈10.1007/978-3-642-29737-3〉
Accès au bibtex
BibTex
titre
Proceedings of Euro-Par 2011 Parallel Processing – 17th International Conference, Part II
auteur
Emmanuel Jeannot, Raymond Namyst, Jean Roman
article
Emmanuel Jeannot and Raymond Namyst and Jean Roman. Springer, 6853, pp.488, 2011, LNCS, 978-3-642-23396-8. 〈10.1007/978-3-642-23397-5〉
Accès au bibtex
BibTex

Documents associated with scientific events

titre
Programming heterogeneous, accelerator-based multicore machines:current situation and main challenges
auteur
Raymond Namyst
article
International Conference On Preconditioning Techniques For Scientific And Industrial Applications, Preconditioning 2011, May 2011, Bordeaux, France
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00590670/file/precond11-Namyst-1.pdf BibTex

Theses

titre
Scheduling Tasks over Multicore machines enhanced with acelerators: a Runtime System’s Perspective
auteur
Cédric Augonnet
article
Distributed, Parallel, and Cluster Computing [cs.DC]. Université Bordeaux 1, 2011. English
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00777154/file/thesis_augonnet.pdf BibTex
titre
Mouvement de données et placement des tâches pour les communications haute performance sur machines hiérarchiques
auteur
Stéphanie Moreaud
article
Réseaux et télécommunications [cs.NI]. Université Sciences et Technologies – Bordeaux I, 2011. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00635651/file/these_moreaud_2011.pdf BibTex

Preprints, Working Papers, …

titre
Composabilité de codes parallèles sur architectures hétérogènes
auteur
Andra-Ecaterina Hugo
article
2011
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00619654/file/Ahugo11Master.pdf BibTex

2010

Journal articles

titre
Efficiency of a hierarchical protocol for highthroughput structure-based virtual screening on Grid5000 cluster grid
auteur
Leo Ghemtio, Emmanuel Jeannot, Bernard Maigret
article
Open Access Bioinformatics, Dove Medical Press, 2010, 2, pp.41-53. 〈10.2147/OAB.S7272〉
Accès au bibtex
BibTex
titre
Defining and Controlling the Heterogeneity of a Cluster: the Wrekavoc Tool
auteur
Louis-Claude Canon, Olivier Dubuisson, Jens Gustedt, Emmanuel Jeannot
article
Journal of Systems and Software, Elsevier, 2010, 83 (5), pp.786-802. 〈10.1016/j.jss.2009.11.734〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00438616/file/RR-7135.pdf BibTex
titre
ForestGOMP: an efficient OpenMP environment for NUMA architectures
auteur
François Broquedis, Nathalie Furmento, Brice Goglin, Pierre-André Wacrenier, Raymond Namyst
article
International Journal of Parallel Programming, Springer Verlag, 2010, 〈10.1007/s10766-010-0136-3〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00496295/file/IJPP.pdf BibTex

Conference papers

titre
Data-Aware Task Scheduling on Multi-Accelerator based Platforms
auteur
Cédric Augonnet, Jérôme Clet-Ortega, Samuel Thibault, Raymond Namyst
article
16th International Conference on Parallel and Distributed Systems, Dec 2010, Shangai, China. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00523937/file/icpads10-starpu.pdf BibTex
titre
Adaptive MPI Multirail Tuning for Non-Uniform Input/Output Access
auteur
Stéphanie Moreaud, Brice Goglin, Raymond Namyst
article
Springer. The 17th European MPI Users Group conference, Sep 2010, Stuttgart, Germany. 6305, pp.239-248, 2010, Lecture Notes in Computer Science. 〈10.1007/978-3-642-15646-5_25〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00486178/file/article.pdf BibTex
titre
Near-Optimal Placement of MPI processes on Hierarchical NUMA Architectures
auteur
Emmanuel Jeannot, Guillaume Mercier
article
Pasqua D’Ambra and Mario Rosario Guarracino and Domenico Talia. Europar, Aug 2010, Ischia, Italy. Springer, 6272, pp.199-210, 2010, Lecture Notes on Computer Science. 〈http://www.springerlink.com/content/xp747253w1641rk3/〉. 〈10.1007/978-3-642-15291-7_20〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00544346/file/europar10.pdf BibTex
titre
Dynamically scheduled Cholesky factorization on multicore architectures with GPU accelerators.
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Hatem Ltaief, Raymond Namyst, Jean Roman, Samuel Thibault, Stanimire Tomov
article
Symposium on Application Accelerators in High Performance Computing (SAAHPC), Jul 2010, Knoxville, United States. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00547616/file/saahpc.pdf BibTex
titre
Automatic Mapping of Stream Programs on Multicore Architectures
auteur
Pablo De Oliveira Castro, Stéphane Louise, Denis Barthou
article
International Workshop on Compilers for Parallel Computers, Jul 2010, Vienna, Austria
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00551680/file/cpc10.pdf BibTex
titre
FADAlib: an open source C++ library for fuzzy array dataflow analysis
auteur
Marouane Belaoucha, Denis Barthou, Adrien Eliche, Sid Touati
article
International Conference on Computational Science, May 2010, Amsterdam, Netherlands. p2075-2084, 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00551673/file/main_fadalib.pdf BibTex
titre
Structuring the execution of OpenMP applications for multicore architectures
auteur
François Broquedis, Olivier Aumage, Brice Goglin, Samuel Thibault, Pierre-André Wacrenier, Raymond Namyst
article
IEEE. International Parallel and Distributed Symposium (IPDPS 2010), Apr 2010, Atltanta, United States. 2010, 〈10.1109/IPDPS.2010.5470442〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00441472/file/PID1125911.pdf BibTex
titre
Optimizing MPI Communication within large Multicore nodes with Kernel assistance
auteur
Stéphanie Moreaud, Brice Goglin, David Goodell, Raymond Namyst
article
IEEE. Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2010, Apr 2010, Atlanta, United States. 7 p., 2010, 〈10.1109/IPDPSW.2010.5470849〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00451471/file/CAC10.pdf BibTex
titre
A Dynamic Approach for Characterizing Collusion in Desktop Grids
auteur
Louis-Claude Canon, Emmanuel Jeannot, Jon Weissman
article
24th IEEE International Parallel and Distributed Processing Symposium – IPDPS 2010, Apr 2010, Atlanta, United States. IEEE, pp.1-12, 2010, 2010 IEEE International Symposium on Parallel & Distributed Processing (IPDPS). 〈10.1109/IPDPS.2010.5470422〉
Accès au bibtex
BibTex
titre
hwloc: a Generic Framework for Managing Hardware Affinities in HPC Applications
auteur
François Broquedis, Jérôme Clet-Ortega, Stéphanie Moreaud, Nathalie Furmento, Brice Goglin, Guillaume Mercier, Samuel Thibault, Raymond Namyst
article
IEEE. PDP 2010 – The 18th Euromicro International Conference on Parallel, Distributed and Network-Based Computing, Feb 2010, Pisa, Italy. 2010, 〈10.1109/PDP.2010.67〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00429889/file/main.pdf BibTex
titre
A multidimensional array slicing DSL for Stream Programming
auteur
Pablo De Oliveira Castro, Stéphane Louise, Denis Barthou
article
International IEEE Workshop on Practical Aspects of High-Level Parallel Programming, Feb 2010, Krakow, Poland. p913-918, 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00551572/file/camera_ready.pdf BibTex

Book sections

titre
Faster, Cheaper, Better – a Hybridization Methodology to Develop Linear Algebra Software for GPUs
auteur
Emmanuel Agullo, Cédric Augonnet, Jack Dongarra, Hatem Ltaief, Raymond Namyst, Samuel Thibault, Stanimire Tomov
article
Wen-mei W. Hwu. GPU Computing Gems, 2, Morgan Kaufmann, 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00547847/file/gpucomputinggems_plagma.pdf BibTex

Books

titre
Réseaux de calcul – des grappes aux nuages de calcul
auteur
Pascale Vicat-Blanc Primet, Romaric Guillier, Sebastien Soudan, Brice Goglin
article
Hermès Science – Lavoisier, pp.213, 2010, 978-2-7462-3006-4
Accès au bibtex
BibTex
titre
Réseaux rapides et stockage distribué dans les grappes de calculateurs
auteur
Brice Goglin
article
Editions Universitaires Européennes, pp.194, 2010, 978-613-1-51872-0
Accès au bibtex
BibTex

Reports

titre
A Generic and High Performance Approach for Fault Tolerance in Communication Library
auteur
François Trahay, Alexandre Denis, Yutaka Ishikawa
article
[Research Report] INRIA Bordeaux. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00793176/file/main.pdf BibTex
titre
Kernel Assisted Collective Intra-node Communication Among Multicore and Manycore CPUs
auteur
Teng Ma, George Bosilca, Aurélien Bouteiller, Brice Goglin, Jeffrey Squyres, Jack Dongarra
article
[Research Report] 2010, pp.11
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00544872/file/kernel-assisted-comm-multicore.pdf BibTex
titre
A Scheduling Algorithm for Defeating Collusion
auteur
Louis-Claude Canon, Emmanuel Jeannot, Jon Weissman
article
[Research Report] RR-7403, INRIA. 2010
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00524493/file/RR-7403.pdf BibTex
titre
StarPU: a Runtime System for Scheduling Tasks over Accelerator-Based Multicore Machines
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst
article
[Research Report] RR-7240, INRIA. 2010, pp.33
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00467677/file/RR-7240.pdf BibTex

Theses

titre
Outils et algorithmes pour gérer l’incertitude lors de l’ordonnancement d’application sur plateformes distribuées
auteur
Louis-Claude Canon
article
Informatique [cs]. Université Henri Poincaré – Nancy I, 2010. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00576781/file/these.pdf BibTex

Preprints, Working Papers, …

titre
On the complexity of task graph scheduling with transient and fail-stop failures
auteur
Anne Benoit, Louis-Claude Canon, Emmanuel Jeannot, Yves Robert
article
RR-LIP-2010-01. 2010
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00457511/file/rr-lip-2010-01.pdf BibTex

2009

Conference papers

titre
Cache-Efficient, Intranode, Large-Message MPI Communication with MPICH2-Nemesis
auteur
Darius Buntinas, Brice Goglin, David Goodell, Guillaume Mercier, Stéphanie Moreaud
article
IEEE. 38th International Conference on Parallel Processing (ICPP-2009), Sep 2009, Vienne, Austria. 2009, 〈10.1109/ICPP.2009.22〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00390064/file/article.pdf BibTex
titre
Adaptation des communications MPI intra-nœud aux architectures multicœurs modernes
auteur
Stéphanie Moreaud
article
19ème Rencontres Francophones du Parallélisme (2009), Sep 2009, Toulouse, France. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00430021/file/MorRenPar09.pdf BibTex
titre
StarPU : un support exécutif unifié pour les architectures multicoeurs hétérogènes
auteur
Cédric Augonnet
article
19ème Rencontres Francophones du Parallélisme, Sep 2009, Toulouse, France. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00411581/file/Aug09RENPAR.pdf BibTex
titre
Bibliothèque de communication multi-threadée pour architectures multi-coeurs
auteur
François Trahay
article
19ème Rencontres Francophones du Parallélisme, Sep 2009, Toulouse, France. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00410355/file/renpar09.pdf BibTex
titre
Towards an efficient process placement policy for MPI applications in multicore environments
auteur
Guillaume Mercier, Jérôme Clet-Ortega
article
M. Ropo and al. Europvm/mpi 2009, Sep 2009, Espoo, Finland. Springer-Verlag, 5759, pp 104–115, 2009, Lecture Notes in Computer Science. 〈10.1007/978-3-642-03770-2_17〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00392581/file/Mercier_Clet-Ortega_europvmmpi2k9_Corrected_Final.pdf BibTex
titre
Finding a Tradeoff between Host Interrupt Load and MPI Latency over Ethernet
auteur
Brice Goglin, Nathalie Furmento
article
IEEE. Cluster 2009, Sep 2009, New Orleans, United States. 2009, 〈10.1109/CLUSTR.2009.5289165〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00397328/file/article.pdf BibTex
titre
Ordonnancement de threads OpenMP et placement de données coordonnés sur architectures hiérarchiques
auteur
François Broquedis
article
Rencontres Francophones du Parallélisme (RenPar), Sep 2009, Toulouse, France. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00422213/file/paper17.pdf BibTex
titre
Une stratégie efficace pour le placement de processus en environnement multicœur
auteur
Jérôme Clet-Ortega
article
19ème Rencontres Francophones du Parallélisme (2009), Sep 2009, Toulouse, France. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00410756/file/article.pdf BibTex
titre
Automatic Calibration of Performance Models on Heterogeneous Multicore Architectures
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst
article
3rd Workshop on Highly Parallel Processing on a Chip (HPPC 2009), Aug 2009, Delft, Netherlands. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00421333/file/AugThiNam09HPPC.pdf BibTex
titre
NIC-assisted Cache-Efficient Receive Stack for Message Passing over Ethernet
auteur
Brice Goglin
article
Springer Verlag. 15th International Euro-Par Conference, Aug 2009, Delft, Netherlands. 2009, Lecture Notes in Computer Science. 〈10.1007/978-3-642-03869-3_981〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00379168/file/EuroPar09-submit.pdf BibTex
titre
StarPU: A Unified Platform for Task Scheduling on Heterogeneous Multicore Architectures
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
Euro-Par 2009, Aug 2009, Delft, Netherlands. 2009, LNCS
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00384363/file/AugThiNamWac09Europar.pdf BibTex
titre
A scalable and generic task scheduling system for communication libraries
auteur
François Trahay, Alexandre Denis
article
IEEE International Conference on Cluster Computing, Aug 2009, New Orleans, LA, United States. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00408521/file/cluster09.pdf BibTex
titre
Exploiting the Cell/BE architecture with the StarPU unified runtime system
auteur
Cédric Augonnet, Samuel Thibault, Raymond Namyst, Maik Nijhuis
article
Springer Verlag. SAMOS Workshop, Jul 2009, SAMOS, Greece. 2009, LNCS
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00378705/file/samos09-starpu.pdf BibTex
titre
Memory Migration on Next-Touch
auteur
Brice Goglin, Nathalie Furmento
article
Linux Symposium, Jul 2009, Montreal, Canada. 2009
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00378580/file/goglin.pdf BibTex
titre
Dynamic Task and Data Placement over NUMA Architectures: an OpenMP Runtime Perspective
auteur
François Broquedis, Nathalie Furmento, Brice Goglin, Raymond Namyst, Pierre-André Wacrenier
article
International Workshop on OpenMP (IWOMP), Jun 2009, Dresden, Germany. 2009, 〈10.1007/978-3-642-02303-3_7〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00367570/file/cameraReadyVersion.pdf BibTex
titre
Enabling High-Performance Memory Migration for Multithreaded Applications on Linux
auteur
Brice Goglin, Nathalie Furmento
article
IEEE. MTAAP’09: Workshop on Multithreaded Architectures and Applications, held in conjunction with IPDPS 2009, May 2009, Rome, Italy. 2009, 〈10.1109/IPDPS.2009.5161101〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00358172/file/article.pdf BibTex
titre
Decoupling Memory Pinning from the Application with Overlapped on-Demand Pinning and MMU Notifiers
auteur
Brice Goglin
article
IEEE. Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2009, May 2009, Rome, Italy. 2009, 〈10.1109/IPDPS.2009.5160888〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00356236/file/article.pdf BibTex
titre
NewMadeleine: An Efficient Support for High-Performance Networks in MPICH2
auteur
Guillaume Mercier, François Trahay, Darius Buntinas, Elisabeth Brunet
article
International Parallel and Distributed Processing Symposium, May 2009, Rome, Italy. pp.35, 2009
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00360275/file/PID817771.pdf BibTex
titre
An analysis of the impact of multi-threading on communication performance
auteur
François Trahay, Elisabeth Brunet, Alexandre Denis
article
Communication Architecture for Clusters, May 2009, Rome, Italy. 2009, 〈10.1109/IPDPS.2009.5160893〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00381670/file/main.pdf BibTex
titre
High Throughput Intra-Node MPI Communication with Open-MX
auteur
Brice Goglin
article
IEEE. 17th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP2009), Feb 2009, Weimar, Germany. 2009, 〈10.1109/PDP.2009.20〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00331209/file/article.pdf BibTex
titre
Mapping and Synchronizing Streaming Applications on Cell Processors
auteur
Maik Nijhuis, Herbert Bos, Henri E. Bal, Cédric Augonnet
article
André Seznec and Joel Emer and Mike O’Boyle and Margaret Martonosi and Theo Ungerer. HiPEAC 2009 – High Performance and Embedded Architectures and Compilers, Jan 2009, Paphos, Cyprus. Springer, 2009, 〈10.1007/978-3-540-92990-1_17〉
Accès au bibtex
BibTex

Theses

titre
Ordonnancement hybride statique-dynamique en algèbre linéaire creuse pour de grands clusters de machines NUMA et multi-cœurs
auteur
Mathieu Faverge
article
Modélisation et simulation. Université Sciences et Technologies – Bordeaux I, 2009. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00453997/file/these1.pdf BibTex
titre
De l’interaction des communications et de l’ordonnancement de threads au sein des grappes de machines multi-coeurs
auteur
François Trahay
article
Modélisation et simulation. Université Sciences et Technologies – Bordeaux I, 2009. Français
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-00469488/file/these_trahay.pdf BibTex

2008

Journal articles

titre
BubbleSched, plate-forme de conception d’ordonnanceurs de threads sur machines hiérarchiques
auteur
Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, Lavoisier, 2008, Nouveaux algorithmes pour les nouvelles plates-formes parallèles, 27 (3-4/2008), pp.345-371. 〈10.3166/TSI.27.345-371〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00329960/file/thi-nam-wac-bulles-hal.pdf BibTex
titre
NewMadeleine : ordonnancement et optimisation de schemas de communication haute performance.
auteur
Elisabeth Brunet, Olivier Aumage, Raymond Namyst
article
Revue des Sciences et Technologies de l’Information – Série TSI : Technique et Science Informatiques, Lavoisier, 2008, vol. 27 (3-4/2008)
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00341270/file/tsi07.pdf BibTex

Conference papers

titre
Improving Message Passing over Ethernet with I/OAT Copy Offload in Open-MX
auteur
Brice Goglin
article
IEEE. Cluster 2008, Sep 2008, Tsukuba, Japan. 2008, 〈10.1109/CLUSTR.2008.4663775〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00288757/file/Open-MX-IOAT.pdf BibTex
titre
A multicore-enabled multirail communication engine
auteur
Elisabeth Brunet, François Trahay, Alexandre Denis
article
IEEE. IEEE International Conference on Cluster Computing, Sep 2008, Tsukuba, Japan. 2008, 〈10.1109/CLUSTR.2008.4663788〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00327158/file/main.pdf BibTex
titre
A unified runtime system for heterogeneous multicore architectures
auteur
Cédric Augonnet, Raymond Namyst
article
2nd Workshop on Highly Parallel Processing on a Chip (HPPC 2008), Aug 2008, Las Palmas de Gran Canaria, Spain. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00326917/file/AugNam08HPPC.pdf BibTex
titre
Dynamic Scheduling for sparse direct Solver on NUMA architectures
auteur
Mathieu Faverge, Pierre Ramet
article
PARA’08, May 2008, Trondheim, Norway. 2008, LNCS
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00344026/file/para08.pdf BibTex
titre
Scheduling Dynamic OpenMP Applications over Multicore Architectures
auteur
François Broquedis, François Diakhate, Samuel Thibault, Olivier Aumage, Raymond Namyst, Pierre-André Wacrenier
article
International Workshop on OpenMP, May 2008, West Lafayette, IN, United States. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00329934/file/soumis.pdf BibTex
titre
Design and Implementation of Open-MX: High-Performance Message Passing over generic Ethernet hardware
auteur
Brice Goglin
article
Workshop on Communication Architecture for Clusters, held in conjunction with IPDPS 2008, Apr 2008, Miami, United States. 2008, 〈10.1109/IPDPS.2008.4536140〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00210704/file/CAC-383-paper-1.pdf BibTex
titre
A multithreaded communication engine for multicore architectures
auteur
François Trahay, Elisabeth Brunet, Alexandre Denis, Raymond Namyst
article
Communication Architecture for Clusters, Apr 2008, Miami, United States. 2008, 〈10.1109/IPDPS.2008.4536139〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00224999/file/main.pdf BibTex
titre
Exécution structurée d’applications OpenMP à grain fin sur architectures multicoeurs
auteur
François Broquedis
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00203188/file/main.pdf BibTex
titre
PIOMan : un gestionnaire d’entrées-sorties générique
auteur
François Trahay
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00327177/file/renpar08.pdf BibTex
titre
Impacts des effets NUMA sur les communications haute performance dans les grappes de calcul
auteur
Stéphanie Moreaud
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00257752/file/MorRenPar08.pdf BibTex
titre
Ordonnancement et services différenciés pour réseaux rapides
auteur
Jérôme Clet-Ortega
article
18ème Rencontres Francophones du Parallélisme, Feb 2008, Fribourg, Suisse. 2008
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00332260/file/renpar18.pdf BibTex
titre
A NUMA Aware Scheduler for a Parallel Sparse Direct Solver
auteur
Mathieu Faverge, Xavier Lacoste, Pierre Ramet
article
PMAA’08, 2008, Neuchâtel, Switzerland. 2008
Accès au bibtex
BibTex

Reports

titre
Vers des supports d’exécution capables d’exploiter les machines multicœurs hétérogènes
auteur
Cédric Augonnet
article
[Travaux universitaires] 2008, pp.48
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00289361/file/memoire-dea.pdf BibTex

Preprints, Working Papers, …

titre
Efficient shared memory message passing for inter-VM communications
auteur
François Diakhaté, Marc Pérache, Raymond Namyst, Hervé Jourdren
article
2008
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00368622/file/vhpc08.pdf BibTex

2007

Journal articles

titre
Implementation and Evaluation of Shared-Memory Communication and Synchronization Operations in MPICH2 using the Nemesis Communication Subsystem
auteur
Darius Buntinas, Guillaume Mercier, William Gropp
article
Parallel Computing, Elsevier, 2007, 33 (9), pp.634-644. 〈10.1016/j.parco.2007.06.003〉
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00344327/file/parco2k7_final.pdf BibTex
titre
Meta-communications in Component-base Communication Frameworks for Grids
auteur
Alexandre Denis
article
Cluster Computing, Springer Verlag, 2007, 10 (3), pp.253-263. 〈10.1007/s10586-007-0036-5〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00410993/file/article.pdf BibTex

Conference papers

titre
Impact of NUMA Effects on High-Speed Networking with Multi-Opteron Machines
auteur
Stéphanie Moreaud, Brice Goglin
article
PDCS, Nov 2007, Cambridge, United States. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00175747/file/PDCS07.pdf BibTex
titre
Improving Reactivity and Communication Overlap in MPI using a Generic I/O Manager
auteur
François Trahay, Alexandre Denis, Olivier Aumage, Raymond Namyst
article
Capello, Herault, Dongarra (Eds). EuroPVM/MPI 2007, Oct 2007, Paris, France. Springer, 4757, pp.170-177, 2007, 〈10.1007/978-3-540-75416-9_27〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00177167/file/TRA07Improving.pdf BibTex
titre
Building Portable Thread Schedulers for Hierarchical Multiprocessors: the BubbleSched Framework
auteur
Samuel Thibault, Raymond Namyst, Pierre-André Wacrenier
article
EuroPar, Aug 2007, Rennes, France. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00154506/file/main.pdf BibTex
titre
An Efficient OpenMP Runtime System for Hierarchical Architectures
auteur
Samuel Thibault, François Broquedis, Brice Goglin, Raymond Namyst, Pierre-André Wacrenier
article
International Workshop on OpenMP (IWOMP), Jun 2007, Beijing, China. pp.148–159, 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00154502/file/main.pdf BibTex
titre
BrlAPI: Simple, Portable, Concurrent, Application-level Control of Braille Terminals
auteur
Samuel Thibault, Sébastien Hinderer
article
The First International Conference on Information and Communication Technology and Accessibility – ICTA 2007, Apr 2007, Hammamet, Tunisia. pp.27–31, 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00135946/file/thibault-hinderer-icta-2007.pdf BibTex
titre
High-Performance Multi-Rail Support with the NewMadeleine Communication Library
auteur
Olivier Aumage, Elisabeth Brunet, Guillaume Mercier, Raymond Namyst
article
The Sixteenth International Heterogeneity in Computing Workshop (HCW 2007), workshop held in conjunction with IPDPS 2007, Mar 2007, Long Beach, California, United States. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00126254/file/hcw-final.pdf BibTex
titre
NewMadeleine: a Fast Communication Scheduling Engine for High Performance Networks
auteur
Olivier Aumage, Elisabeth Brunet, Nathalie Furmento, Raymond Namyst
article
Workshop on Communication Architecture for Clusters (CAC 2007), workshop held in conjunction with IPDPS 2007, Mar 2007, Long Beach, California, United States. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00127356/file/cac-final.pdf BibTex

Reports

titre
NewMadeleine: a Fast Communication Scheduling Engine for High Performance Networks
auteur
Olivier Aumage, Elisabeth Brunet, Nathalie Furmento, Raymond Namyst
article
[Research Report] RR-6085, INRIA. 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00122723/file/RR-6085.pdf BibTex
titre
Ordonnancement et qualité de service pour réseaux rapides
auteur
Jérôme Clet-Ortega
article
[Rapport de recherche] 2007, pp.38
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00177230/file/memoire.pdf BibTex
titre
De l’exécution structurée de programmes OpenMP sur architectures hiérarchiques
auteur
François Broquedis
article
[Rapport de recherche] 2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00177150/file/memoire.pdf BibTex
titre
Efficient Interaction between High-Speed Networks and Distributed Storage in Clusters
auteur
Brice Goglin
article
[Research Report] 2007, pp.28
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070218/file/article.pdf BibTex
titre
Impact des architectures multiprocesseurs sur les communications dans les grappes de calcul : de l’exploration des effets NUMA au placement automatique
auteur
Stéphanie Moreaud
article
[Travaux universitaires] 2007, pp.36
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00177495/file/memoire_DEA_Moreaud.pdf BibTex
titre
Modification de PadicoTM afin de fournir une interface de type Madeleine
auteur
Christophe Frezier
article
[Rapport Technique] RT-0334, INRIA. 2007, pp.11
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00142872/file/RT-0334.pdf BibTex

Preprints, Working Papers, …

titre
Ordonnancements de threads dirigé par la mémoire sur architecture NUMA.
auteur
Sylvain Jeuland
article
2007
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00177129/file/memaware.pdf BibTex

2006

Journal articles

titre
PDMS-based microfluidics for proteomic analysis.
auteur
Arash Dodge, Edouard Brunet, Suelin Chen, Jacques Goulpeau, Valérie Labas, Joelle Vinh, Patrick Tabeling
article
The Analyst / Analyst Lond; Analyst (London), 2006, 131 (10), pp.1122-8. 〈10.1039/b606394b〉
Accès au bibtex
BibTex

Conference papers

titre
ACI Grid’5000, Site de Bordeaux
auteur
Nathalie Furmento, Guillaume Mercier, Raymond Namyst, Alexandre Denis
article
PaRISTIC : Panorama des Recherches Incitatives en STIC, Nov 2006, Nancy, France. 2006
Accès au bibtex
BibTex
titre
BubbleSched : construire son propre ordonnanceur de threads pour machines multiprocesseurs hirarchiques
auteur
Samuel Thibault
article
17ème Rencontres Francophones du Parallélisme, Oct 2006, Canet en Roussillon, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00108984/file/papier_final.pdf BibTex
titre
NewMadeleine : ordonnancement et optimisation de schémas de communication haute performance.
auteur
Elisabeth Brunet
article
17ème Rencontres Francophones du Parallélisme, Oct 2006, Perpignan/France, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00110766/file/main.pdf BibTex
titre
Efficient runtime systems for grids
auteur
Nathalie Furmento, Alexandre Denis, Raymond Namyst
article
EXPGRID, Experimental Grid testbeds for the assessment of large-scale distributed applications and tools, Workshop held in conjunction with the 15th International Symposium on High Performance Distributed Computing (HPDC-15), Jun 2006, Paris, France. 2006
Accès au bibtex
BibTex
titre
Short Paper : Dynamic Optimization of Communications over High Speed Networks
auteur
Elisabeth Brunet, Olivier Aumage, Raymond Namyst
article
The 15th IEEE International Symposium on High Performance Distributed Computing (HPDC-15), Jun 2006, Paris/France, France. 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00110773/file/wik06.pdf BibTex
titre
Meta-communications in Component-based Communnication Frameworks for Grids
auteur
Alexandre Denis
article
HPC Grid programming Environments and COmponents (HPC-GECO), Jun 2006, Paris, France. pp.77–84, 2006
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00090066/file/article.pdf BibTex

Book sections

titre
Des réseaux de calculateurs aux grilles de calcul
auteur
Christine Morin, Alexandre Denis, Raymond Namyst, Olivier Aumage, Renaud Lottiaux
article
Akoka, Jacky; Comyn-Wattiau, Isabelle. Encyclopédie de l’informatique et des systèmes d’information, Section 2 – Architectures et syst\`emes distribu\’es, Vuibert, pp.211-239, 2006, Collection informatique
Accès au bibtex
BibTex
titre
Programming the grid with components: models and runtime issues
auteur
Alexandre Denis, Sébastien Lacour, Christian Pérez, Thierry Priol, André Ribes
article
Beniamino Di Martino and Jack Dongarra and Adolfy Hoisie and Laurence T. Yang and Hans Zima. Engineering The Grid: Status and Perspective, American Scientific Publishers, 2006, 1-58883-038-1
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00411008/file/component.pdf BibTex

Reports

titre
Gestion de la réactivité des communications réseau
auteur
François Trahay
article
[Rapport de recherche] Universite Bordeaux 1. 2006, pp.31
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00177149/file/Tra06Memoire.pdf BibTex
titre
Modeling the LU factorization for SMP clusters
auteur
Jack Dongarra, Emmanuel Jeannot, Julien Langou
article
[Research Report] 2006, pp.2
Accès au bibtex
BibTex

2005

Conference papers

titre
Grid’5000: a large scale, reconfigurable, controlable and monitorable Grid platform
auteur
Franck Cappello, Frédéric Desprez, Michel Dayde, Emmanuel Jeannot, Yvon Jégou, Stephane Lanteri, Nouredine Melab, Raymond Namyst, Pascale Primet, Olivier Richard, Eddy Caron, Julien Leduc, Guillaume Mornet
article
6th IEEE/ACM International Workshop on Grid Computing – GRID 2005, Nov 2005, Seattle, USA, United States. 2005
Accès au bibtex
BibTex
titre
An Efficient Multi-level Trace Toolkit for Multi-threaded Applications
auteur
Vincent Danjean, Raymond Namyst, Pierre-André Wacrenier
article
Springer, Berlin. Euro-Par 2005 Parallel Processing, Aug 2005, Lisbon, Portugal. 3648, pp.166-175, 2005, 〈10.1007/11549468_21〉
Accès au bibtex
BibTex
titre
A Flexible Thread Scheduler for Hierarchical Multiprocessor Machines
auteur
Samuel Thibault
article
Second International Workshop on Operating Systems, Programming Environments and Management Tools for High-Performance Computing on Clusters (COSET-2), Jun 2005, Cambridge, United States. 2005
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000138/file/coset.pdf BibTex
titre
NetIbis: An Efficient and Dynamic Communication System for Heterogeneous Grids
auteur
Olivier Aumage, Rutger Hofman, Henri Bal
article
IEEE Computer Society. Cluster Computing and Grid 2005, May 2005, Cardiff/UK, 2005
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000031/file/netibis.pdf BibTex
titre
Un ordonnanceur flexible pour machines multiprocesseurs hiérarchiques
auteur
Samuel Thibault
article
16ème Rencontres Francophones du Parallélisme, Apr 2005, Le Croisic, France. 2005
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000137/file/renpar.pdf BibTex

Reports

titre
Support d’ordonnancement et d’optimisation automatisés des communications pour les réseaux hautes performances
auteur
Élisabeth Brunet
article
RR-5641, INRIA. 2005, pp.38
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070366/file/RR-5641.pdf BibTex
titre
An Efficient Multi-level Trace Toolkit for Multi-threaded Applications
auteur
Vincent Danjean, Pierre-André Wacrenier, Raymond Namyst
article
[Research Report] RR-5513, INRIA. 2005, pp.12
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070493/file/RR-5513.pdf BibTex
titre
Optimisation Mechanisms for MPICH/Madeleine
auteur
Nathalie Furmento, Guillaume Mercier
article
[Research Report] RT-0306, INRIA. 2005, pp.29
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00069874/file/RT-0306.pdf BibTex
titre
MPICH/Madeleine Installer’s, User’s and Developer’s Guide
auteur
Nathalie Furmento, Guillaume Mercier
article
[Research Report] RT-0316, INRIA. 2005, pp.41
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00070940/file/RT-0316.pdf BibTex
titre
Developing a Software Tool for Precise Kernel Measurements
auteur
Samuel Thibault, Robert Russell
article
[Research Report] RR-5602, INRIA. 2005, pp.25
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000189/file/RR-5602.pdf https://hal.inria.fr/inria-00000189/file/report.pdf BibTex

2004

Conference papers

titre
ALTA: Asynchronous Loss Tolerant Algorithms for Grid Computing
auteur
Olivier Aumage, Jacques M. Bahi, Sylvain Contassot-Vivier, Raphaël Couturier, Alexandre Denis, Raymond Namyst, Guillaume Papauré, Christian Perez, Marc Sauget
article
3rd International workshop on Parallel Matrix Algorithms and Applications (PMAA’04), Oct 2004, Marseille, France
Accès au bibtex
BibTex
titre
Wide-Area Communication for Grids: An Integrated Solution to Connectivity, Performance and Security Problems
auteur
Alexandre Denis, Olivier Aumage, Rutger Hofman, Kees Verstoep, Thilo Kielmann, Henri E. Bal
article
IEEE. the Thirteenth IEEE International Symposium on High-Performance Distributed Computing (HPDC’13), Jun 2004, Honolulu/Hawaii, United States. 2004
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00000126/file/hpdc2004.pdf BibTex

2003

Journal articles

titre
Achieving Portable and Efficient Parallel CORBA Objects
auteur
Alexandre Denis, Christian Pérez, Thierry Priol
article
Concurrency and Computation: Practice and Experience, Wiley, 2003, 15 (10), pp.891-909. 〈http://www3.interscience.wiley.com/cgi-bin/fulltext/104548523/PDFSTART〉. 〈10.1002/cpe.738〉
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00411025/file/DenPerPriCCPE.pdf BibTex

Book sections

titre
Programming the Grid with Distributed Objects
auteur
Alexandre Denis, Christian Pérez, Thierry Priol, André Ribes
article
Craig Lee. Process Coordination and Ubiquitous Computing, CRC Press, 2003, 0849314704
Accès au bibtex
BibTex

Comments are closed