Fundamentals of Accelerated Computing with CUDA Python

Fundamentals of Accelerated Computing with CUDA PythonFACCPNVNvidiaNV-FACCP1.0Am Ende des Workshops werden Sie die grundlegenden Werkzeuge und Techniken für GPU-beschleunigte Python-Anwendungen mit CUDA und Numba kennenlernen: <ul> <li>GPU-Beschleunigung von NumPy-ufuncs mit ein paar Zeilen Code.</li><li>Konfigurieren Sie die Code-Parallelisierung mithilfe der CUDA-Thread-Hierarchie.</li><li>Schreiben Sie benutzerdefinierte CUDA-Gerätekernel für maximale Leistung und Flexibilität.</li><li>Verwenden Sie Memory Coalescing und On-Device Shared Memory, um die CUDA Kernel-Bandbreite zu erhöhen.</li></ul><ul> <li>Grundlegende Python-Kenntnisse, einschliesslich Vertrautheit mit Variablentypen, Schleifen, bedingten Anweisungen, Funktionen und Array-Manipulationen</li><li>NumPy-Kenntnisse, einschliesslich der Verwendung von ndarrays und ufuncs</li><li>Es sind keine Vorkenntnisse in der CUDA-Programmierung erforderlich.</li></ul>Einführung <ul> <li>Treffen Sie den Ausbilder.</li><li>Erstellen Sie ein Konto bei https://learn.nvidia.com/join</li></ul>Einführung in CUDA Python mit Numba <ul> <li>Beginn der Arbeit mit dem Numba-Compiler und der CUDA-Programmierung in Python.</li><li>Verwenden Sie Numba-Dekoratoren zur GPU-Beschleunigung von numerischen Python-Funktionen.</li><li>Optimieren Sie die Speicherübertragungen vom Host zum Gerät und vom Gerät zum Host.</li></ul>Benutzerdefinierte CUDA-Kernel in Python mit Numba <ul> <li>Lernen Sie die parallele Thread-Hierarchie von CUDA kennen und erfahren Sie, wie Sie die Möglichkeiten paralleler Programme erweitern können.</li><li>Starten Sie massiv parallele benutzerdefinierte CUDA-Kernel auf der GPU.</li><li>Verwenden Sie atomare CUDA-Operationen, um Wettlaufbedingungen während der parallelen Ausführung zu vermeiden.</li></ul>Mehrdimensionale Raster und gemeinsamer Speicher für CUDA Python mit Numba <ul> <li>Lernen Sie, wie man mehrdimensionale Gitter erstellt und wie man parallel an 2D-Matrizen arbeitet.</li><li>Nutzung des gemeinsamen Speichers auf dem Gerät zur Förderung der Speicherkoaleszenz bei der Umformung von 2D-Matrizen.</li></ul>Abschlussbericht <ul> <li>Besprechung der wichtigsten Erkenntnisse und abschliessende Fragen.</li><li>Schliessen Sie die Bewertung ab, um ein Zertifikat zu erhalten.</li><li>Nehmen Sie an der Workshop-Umfrage teil.</li></ul>Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte <a class="fl-href-prod" href="/swisscom/en/course/nvidia-faccp"><svg role="img" aria-hidden="true" focusable="false" data-nosnippet class="cms-linkmark"><use xlink:href="/css/img/icnset-linkmarks.svg#linkmark"></use></svg>hier</a>.Am Ende des Workshops werden Sie die grundlegenden Werkzeuge und Techniken für GPU-beschleunigte Python-Anwendungen mit CUDA und Numba kennenlernen: - GPU-Beschleunigung von NumPy-ufuncs mit ein paar Zeilen Code. - Konfigurieren Sie die Code-Parallelisierung mithilfe der CUDA-Thread-Hierarchie. - Schreiben Sie benutzerdefinierte CUDA-Gerätekernel für maximale Leistung und Flexibilität. - Verwenden Sie Memory Coalescing und On-Device Shared Memory, um die CUDA Kernel-Bandbreite zu erhöhen.- Grundlegende Python-Kenntnisse, einschliesslich Vertrautheit mit Variablentypen, Schleifen, bedingten Anweisungen, Funktionen und Array-Manipulationen - NumPy-Kenntnisse, einschliesslich der Verwendung von ndarrays und ufuncs - Es sind keine Vorkenntnisse in der CUDA-Programmierung erforderlich.Einführung - Treffen Sie den Ausbilder. - Erstellen Sie ein Konto bei https://learn.nvidia.com/join Einführung in CUDA Python mit Numba - Beginn der Arbeit mit dem Numba-Compiler und der CUDA-Programmierung in Python. - Verwenden Sie Numba-Dekoratoren zur GPU-Beschleunigung von numerischen Python-Funktionen. - Optimieren Sie die Speicherübertragungen vom Host zum Gerät und vom Gerät zum Host. Benutzerdefinierte CUDA-Kernel in Python mit Numba - Lernen Sie die parallele Thread-Hierarchie von CUDA kennen und erfahren Sie, wie Sie die Möglichkeiten paralleler Programme erweitern können. - Starten Sie massiv parallele benutzerdefinierte CUDA-Kernel auf der GPU. - Verwenden Sie atomare CUDA-Operationen, um Wettlaufbedingungen während der parallelen Ausführung zu vermeiden. Mehrdimensionale Raster und gemeinsamer Speicher für CUDA Python mit Numba - Lernen Sie, wie man mehrdimensionale Gitter erstellt und wie man parallel an 2D-Matrizen arbeitet. - Nutzung des gemeinsamen Speichers auf dem Gerät zur Förderung der Speicherkoaleszenz bei der Umformung von 2D-Matrizen. Abschlussbericht - Besprechung der wichtigsten Erkenntnisse und abschliessende Fragen. - Schliessen Sie die Bewertung ab, um ein Zertifikat zu erhalten. - Nehmen Sie an der Workshop-Umfrage teil.Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.1 Tag500.00500.00500.00500.00500.00420.00500.00690.00