Masking Communication Overhead for a Finite Difference Shallow Water Equations Solver
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3100367Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
Sammendrag
I denne avhandlingen fokuserer vi på å undersøke effekten av varierende tykkelser på kantutvekslinger for en proxy-applikasjon. Mengden data i utvekslingene påvirker kostnaden av beregningene og overheaden i forbindelse med kommunikasjon. Proxy-applikasjonen løser gruntvannlikningene, som er en serie av partielle differensiallikninger som beskriver vannstrømmen i en flate.
Vi lager en ytelsesmodell ved hjelp av Bulk Synchronous Parallel-modellen for å analysere de ulike kostnadene knyttet til de ulike tilstandene i proxy-applikasjonen. Vi samler inn data for sub-domener fra 50 x 50 til 1000 x 1000, med en økning på 50 for hver størrelse, og med varierende tykkelser på kantutvekslingen fra 1 til 20. Kostnadene for tilstandene brukes deretter til å forutsi beregnings- og kommunikasjonstiden for hver kombinasjon av sub-domenestørrelser og kanttykkelser. Konfigurasjonene som forutsier en ytelsesfordel, blir eksperimentelt testet for å se om ytelsesmodellen er i stand til å karakterisere proxy-applikasjonen.
Resultatene viser at det er konfigurasjoner der en hastighetsøkning kan oppnås, men ytelsesmodellen modellerer ikke proxy-applikasjonen helt nøyaktig, og trenger videre forbedringer. In this thesis, we focus on investigating the impact of varying border exchange thicknesses for a proxy application. The amount of data in the exchanges impact the computational load, and communication overhead. The proxy application is numerically solving the Shallow Water Equations, which are a set of partial differential equations that describe the flow of water in a pressure surface.
We create a performance model using Bulk Synchronous Parallel model to analyze the various costs attributed to the different states in the proxy application. We gather data for sub-domains sizes ranging from 50 x 50 to, 1000 x 1000 with increments of 50 for varying border exchange thicknesses of 1-20. The costs of the states are then used to predict the calculation and communication time of the sub-domain size and border exchange thickness configurations. The configurations that predict a performance benefit are experimentally tested to see if the performance model is able to characterize the proxy application.
The results show that there are configurations where a speedup can be achieved, but the performance model is lacking accuracy and needs further improvements to accurately model the proxy application.