• Analysing Deep Halos on Modern GPUs 

      Valen, Ruben Solvang (Master thesis, 2023)
      Stensilalgoritmer er en familie av algoritmer som oppdaterer punkter i et flerdi- mensjonalt datanett med naboverdiene som vekter. De er beregningsintensive og brukes i mange domener, og utgjør dermed en betydelig del av ...
    • Analyzing GPU Mixed-Precision and Tensor Cores for High-Order FEM for Seismic Wave Propagation 

      Wessel-Berg, Maren (Master thesis, 2022)
      Spektrale elementers metode (SEM) er en høyere ordens endelige elementers metode (FEM) som brukes til å finne tilnærmede løsninger av partielle differensialligninger. Metoden kan blant annet brukes når man simulerer seismisk ...
    • Applying Natural-Language-Processing-Based Machine-Learning Techniques to our Large Scale CUDA AutoTuning Dataset 

      Bjertnes, Lars (Master thesis, 2021)
      Autotuning oppgaver er nesten umulige for mennesker å gjennomføre. Den abstrakte relasjonen mellom maskinvare parametere og program ytelse, gjør parameter setting uegnet for hånd. Uten autotuning, mangler programvare ...
    • Autotuning Benchmarking Techniques: A Roofline Model Case Study 

      Tørring, Jacob; Meyer, Jan Christian; Elster, Anne C. (Peer reviewed; Journal article, 2021)
      Peak performance metrics published by vendors often do not correspond to what can be achieved in practice. It is therefore of great interest to do extensive benchmarking on core applications and library routines. Since ...
    • Autotuning CUDA: Applying NLP Techniques to LS-CAT 

      Bjertnes, Lars; Tørring, Jacob Odgård; Elster, Anne C. (Peer reviewed; Journal article, 2021)
      The abstract relation between hardware parameters and program performance makes setting program parameters a difficult task. Without autotuning, software can miss low-level optimizations, resulting in lower performance. ...
    • BAT: A Benchmark Suite for Auto-Tuners - Development of BAT and Tuning DGX-2 and More 

      Kirkhorn, Knut Aasgaard (Master thesis, 2020)
      HPC (High Performance Computing) systemer har i de siste årene blitt mer og mer heterogene, og inneholder forskjellige arkitekturer som flerkjernede CPUer og akseleratorer som GPUer og FPGAer. På grunn av mangfoldet i ...
    • BAT: A Benchmark suite for AutoTuners 

      Sund, Ingunn; Kirkhorn, Knut Aasgaard; Tørring, Jacob Odgård; Elster, Anne C. (Peer reviewed; Journal article, 2021)
      An autotuner takes a parameterized code as input and tries to optimize the code by finding the best possible values for a given architecture. To our knowledge, there are currently no standardized benchmark suites for ...
    • BAT: A Benchmark suite for AutoTuners - Development of BAT and Tuning on 20x Tesla T4 GPUs and More 

      Sund, Ingunn (Master thesis, 2020)
      Autotuning løser ytelsesportabilitetsutfordringen når man lager applikasjoner som skal kjøres på forskjellige arkitekturer. En autotuner er et program som tar en parameterisert kode som input og prøver å finne de best ...
    • Benchmarking Popular SVD libraries and Optimizing and Autotuning RSVD Targeting the Real-Time Applications 

      Bergquist, Jon Åby (Master thesis, 2023)
      Parallelle datamaskiner og GPUer tilbyr nå en tidligere utilgjenglig beregningskraft som kan utnyttes for sanntidsapplikasjoner. En slik sanntidsapplikasjon er DAS (Distributed Acoustic Sensing). DAS er spesielt interessant ...
    • Exploring NVIDIA Ampere Tensor Cores for an Event Generator Code for High-Energy Physics 

      Høgstøyl, Ingvild Brevik (Master thesis, 2021)
      Det er en økende interesse og etterspørsel etter mer kosteffektive løsninger for hvordan en kan utnytte regneresursene til store HPC-systemer. Datasentrene er tilbyr nå mer heterogen databehandling, som inkluderer systemer ...
    • Exploring OpenMP GPU-Offloading for the Lattice Boltzmann Method 

      Nordstrand, Håvard O. (Master thesis, 2023)
      Lattice-Boltzmann-metoden (LBM) er en av de populære numeriske metodene for simulering av både enkle og komplekse fluidsimuleringer innen numerisk fluiddynamikk (CFD). I dette arbeidet implementerer vi en enkel LVM ...
    • GPU accelerated Fourier Ptychography 

      Treland, Anders Nikolai (Master thesis, 2020)
      Fourier Ptychography er en nylig utviklet teknikk innenfor beregningsbasert mik- roskopi, som rekonstruerer et høyoppløselig bilde, med stort synsfelt, ut i fra et sett med lavoppløselige mikroskop-bilder. En programmerbar ...
    • GPU-Accelerated Visualization of Scattered Point Data 

      Falch, Thomas Løfsgaard; Fløystad, Jostein Bø; Breiby, Dag Werner; Elster, Anne C. (Journal article; Peer reviewed, 2013)
      As data sets continue to grow in size, visualization has become a vitally important tool for extracting meaningful knowledge. Scattered point data, which are unordered sets of point coordinates with associated measured ...
    • GPU-Based Airway Tree Segmentation and Centerline Extraction 

      Smistad, Erik (Master thesis, 2012)
      Lung cancer is one of the deadliest and most common types of cancer inNorway. Early and precise diagnosis is crucial for improving the survivalrate. Diagnosis is often done by extracting a tissue sample in the lung throughthe ...
    • GPU-enabled Laplace-Dirichlet Rule-Based Method for Cardiac Fiber Computations 

      Håkonsen, Iver (Master thesis, 2023)
      Kardiologi er et viktig felt innenfor medisin, og muligheten til å presist simulere hjertefunksjoner er av stor interesse i modellering av hjerte. Informasjon om ori- enteringen til hjertefibre er en essensiell del av mange ...
    • GPU-FAST-PROCLUS: A Fast GPU-parallelized Approach to Projected Clustering 

      Jørgensen, Jakob Rødagaard; Scheel, Katrine; Assent, Ira; Ram, Ajeet; Elster, Anne C. (Journal article, 2022)
      Projected and subspace clustering aim to find groups of similar objects within a subspace of the full-dimensional space. Where subspace clustering tries to identify clusters in all possible subspaces, projected clustering ...
    • Hardware and software surveillance 

      Braathen, Andreas (Master thesis, 2005)
      The surveillance of computer equipment is an important task at the European Laboratory for Particle Physics (CERN). Given the nature and size of its installations, constant feedback about the health state of its hosts is ...
    • ImageCL and Other Techniques and Tools for Optimizing Applications Utilizing Heterogeneous Computing 

      Falch, Thomas Løfsgaard (Doctoral theses at NTNU;2018:92, Doctoral thesis, 2018)
      Several technological and economic trends have recently caused a rise in the use and adoption of systems with heterogeneous and parallel hardware. These systems include different computing devices with different architectures, ...
    • Improving Parallel SPH for Snow Simulations: Neighborhood Search and Kernel Derivatives 

      Haug, Steffen André (Master thesis, 2023)
      Bruk av GPUar for HPC er allereie veletablert. SPH (“smoothed-particle hydrodynamics”) er ein Lagrange teknikk for numerisk simulasjon av væsker som nylig har demonstrert gode resultat for simulasjon av snø på grunn av ...
    • Integrating PFLOTRAN-OGS for CO2 Storage with CUDA-based PETSc Solver 

      Dyngeland, Tobias (Master thesis, 2022)
      Klimautfordringene vi står overfor knyttet til økt CO2 i atmosfæren, har økt interessen hos geofysikere for å modellere langtidslagring av CO2. I moderne prosjekter for karbonfangst og lagring (CCS) er beregningenes ...