Breiter, S. (2020):

Performanceanalyse von Stencil-Kernels auf FPGAs


In dieser Arbeit wird die Performance von OpenCL Stencil-Kernels auf Field-programmable Gate Arrays (FPGAs) untersucht. Ausgehend von einer naiven Implementierung werden inkrementell algorithmische und FPGA-spezifische OpenCL Compiler-Optimierungen ange- wandt und deren Auswirkung auf die Performance analysiert. Zur gezielten Optimierung und Analyse der Performance wird die Hardware-Architektur von FPGAs studiert. Es wird gezeigt, dass eine optimierte Implementierung, welche FPGA-spezifische Architek- tureigenschaften ausnutzt, eine Beschleunigung um einen Faktor von über 150 gegenüber einer naiven Implementierung eines Stencil-Algorithmus erreichen kann. Die erwartete Ener- gieeffizienz des optimierten Kernels liegt in der selben Größenordnung, wie die der besten Supercomputer aus der Green500-Liste im November 2019.

In this study the performance of OpenCL stencil kernels on Field-programmable Gate Ar- rays (FPGAs) is investigated. Starting from a naive implementation, incremental algorithmic and FPGA-specific OpenCL compiler optimizations are applied and their impact on perfor- mance is analyzed. The hardware architecture of FPGAs is studied to optimize and analyze the performance in a targeted manner. It is shown that an optimized implementation, which takes advantage of FPGA-specific architecture properties, can achieve an acceleration by a factor of over 150 compared to a naive implementation of a stencil algorithm. The expected energy efficiency of the optimi- zed kernel is of the same order of magnitude as that of the best supercomputers from the Green500 list in November 2019.




Last Change: Wed, 25 Jun 2025 12:58:18 +0200 - Viewed on: Sun, 29 Jun 2025 09:52:45 +0200
Copyright © MNM-Team http://www.mnm-team.org - Impressum / Legal Info  - Datenschutz / Privacy