s'authentifier
version française rss feed
HAL : inria-00597576, version 1

Voir la fiche concise  BibTeX,EndNote,...
Spherical harmonic transform on heterogeneous architectures using hybrid programming
Szydlarski M., Esterie P., Falcou J., Grigori L., Stompor R.
Research reports (2011) 17 - http://hal.inria.fr/inria-00597576
Versions disponibles
Informatique/Calcul parallèle, distribué et partagé
Physique/Astrophysique/Cosmologie et astrophysique extra-galactique
Planète et Univers/Astrophysique/Cosmologie et astrophysique extra-galactique
Physique/Physique/Physique Atmosphérique et Océanique
Physique/Physique/Géophysique
Planète et Univers/Sciences de la Terre/Géophysique
Sciences de l'environnement/Milieux et Changements globaux
Spherical harmonic transform on heterogeneous architectures using hybrid programming
Mikolaj Szydlarski ()1, Pierre Esterie ()2, Joel Falcou ()2, Laura Grigori ()1, R. Stompor ()3
1 :  INRIA Saclay - Ile de France - GRAND-LARGE
http://grand-large.lri.fr/index.php/Main_Page
INRIA – CNRS : UMR8623 – Université Paris XI - Paris Sud
PCRI - Université de Paris-Sud, Bâtiment 650, 91405 ORSAY Cedex
France
2 :  LRI - Laboratoire de Recherche en Informatique
http://www.lri.fr/
CNRS : UMR8623 – Université Paris Sud
LRI - Bâtiments 650-660 Université Paris-Sud 91405 Orsay Cedex
France
3 :  APC - UMR 7164 - AstroParticule et Cosmologie
http://www.apc.univ-paris7.fr/
CNRS : UMR7164 – IN2P3 – Observatoire de Paris – Université Paris VII - Paris Diderot – CEA : DSM/IRFU
APC - UMR 7164, Université Paris Diderot, 10 rue Alice Domon et Léonie Duquet, case postale 7020, F-75205 Paris Cedex 13
France
Spherical Harmonic Transforms (SHT) are at the heart of many scientific and practical ap- plications ranging from climate modeling to cosmological observations. In many of these areas a new wave of exciting, cutting-edge science goals have been recently proposed calling for simulations and analyses of actual experimental or observational data at very high resolutions, accompanied by producing or processing unprecedented volumes of the data. Both these aspects pose formidable challenge for the currently existing implementations of the transforms. This paper describes a multi CPU-GPUs implementation of an inverse SHT, based on hybrid program- ming combining MPI and CUDA, and discusses its tests as motivated by these forthcoming applications. We present performance comparisons of the multi GPU version and a hybrid, MPI/OpenMP version of the same transform. We find that one NVIDIA Tesla S1070 can accelerate overall execution time of the SHT by as much as 3 times with respect to the MPI/OpenMP version executed on one quad-core processor (Intel Nehalem 2.93 GHz) and, owing to very good scalability of both versions, 128 Tesla cards perform as good as 256 twelve-core processor (AMD Opteron 2.1 GHz).
Les transformations en harmoniques sphériques (SHT) sont au cœur de nombreuses applications scientifiques et pratiques allant de la modélisation du climat aux observations cosmologiques. Ces domaines nécessitent des simulations et des analyses de données expérimentales engendrant des larges volumes de données. Ceci représente un défi important pour les implémentations actuelles des transformations en harmoniques sphériques. Ce papier décrit la mise en œuvre multi CPU-GPU d'une SHT inverse, basée sur une programmation hybride, combinant MPI et CUDA. Nous comparons les performances de la version multi GPU par rapport à une version hybride MPI / OpenMP de la même transformation. Nous constatons qu'une NVIDIA Tesla S1070 peut exécuter la SHT 3 fois plus rapidement que la version MPI / OpenMP exécutée sur un processeur quad-core (Intel Nehalem cadencé à 2,93 GHz) . De plus, en raison d'un très bon passage à l'échelle des deux versions, 128 cartes Tesla donnent d'aussi bonnes performances que 256 processeurs à 12 coeurs (AMD Op te ron 2,1 GHz).
Anglais

Rapport de recherche
17
Rapports
15/04/2011

Spherical Harmonic Transforms – hybrid architectures – hybrid programming – OpenMP – CUDA – Multi-GPU – CMB
RR-7635
Liste des fichiers attachés à ce document :
TEX
latex8.bst(19.1 KB)
Logo-INRIA-couleur.eps(35.3 KB)
Logo-INRIA-couleur.ps(35.1 KB)
Logo-INRIA-picto.eps(24.7 KB)
Logo-INRIA-picto.ps(24.4 KB)
logo_saclay.eps(327.6 KB)
rap-rech1.eps(19.8 KB)
rap-rech1.ps(19.5 KB)
RR-7635.aux(6.8 KB)
RR-7635.bbl(2.4 KB)
RR-7635.blg(891 B)
RR-7635.pdf(580.9 KB)
RR-7635.tex(6.1 KB)
RR-biblio.bib(2.9 KB)
RR.sty(20.7 KB)
figures
big_comp.eps(106 KB)
bscale_gpu_new.eps(107.3 KB)
bscale_hopper_new.eps(105.8 KB)
deltam_hopper.eps(103.4 KB)
f3_bscale_bars.eps(224.2 KB)
f4_totalt_scalability.eps(192.5 KB)
f5_deltam_scalability.eps(188.3 KB)
f6_deltam_scalability_gflops.eps(151.5 KB)
f7_fft_vs_cufft.eps(107.8 KB)
f8_map_example.eps(2.3 MB)
gpu_bars.eps(107.6 KB)
gpu_delta_scalability.eps(106.2 KB)
heterogeneus_alm2map.eps(571.6 KB)
hopped_delta_scalability.eps(105.5 KB)
hopper_bars.eps(105.1 KB)
pie_plot.eps(229.7 KB)
small_comp.eps(106.1 KB)
titane_bars.eps(107.5 KB)
titane_delta_scalability.eps(105.5 KB)
sections
acknowledgment.tex(390 B)
background.tex(24.8 KB)
conclusions.tex(761 B)
experimental.tex(10.3 KB)
introduction.tex(10 KB)
PDF
RR-7635.pdf(572.1 KB)
PS
RR-7635.ps(5.3 MB)