<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE FL_Course SYSTEM "https://www.flane.de/dtd/fl_course095.dtd"><?xml-stylesheet type="text/xsl" href="https://portal.flane.ch/css/xml-course.xsl"?><course productid="34485" language="de" source="https://portal.flane.ch/swisscom/xml-course/nvidia-faccp" lastchanged="2025-11-11T16:22:08+01:00" parent="https://portal.flane.ch/swisscom/xml-courses"><title>Fundamentals of Accelerated Computing with CUDA Python</title><productcode>FACCP</productcode><vendorcode>NV</vendorcode><vendorname>Nvidia</vendorname><fullproductcode>NV-FACCP</fullproductcode><version>1.0</version><objective>&lt;p&gt;Am Ende des Workshops werden Sie die grundlegenden Werkzeuge und Techniken f&amp;uuml;r GPU-beschleunigte Python-Anwendungen mit CUDA und Numba kennenlernen:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;GPU-Beschleunigung von NumPy-ufuncs mit ein paar Zeilen Code.&lt;/li&gt;&lt;li&gt;Konfigurieren Sie die Code-Parallelisierung mithilfe der CUDA-Thread-Hierarchie.&lt;/li&gt;&lt;li&gt;Schreiben Sie benutzerdefinierte CUDA-Ger&amp;auml;tekernel f&amp;uuml;r maximale Leistung und Flexibilit&amp;auml;t.&lt;/li&gt;&lt;li&gt;Verwenden Sie Memory Coalescing und On-Device Shared Memory, um die CUDA Kernel-Bandbreite zu erh&amp;ouml;hen.&lt;/li&gt;&lt;/ul&gt;</objective><essentials>&lt;ul&gt;
&lt;li&gt;Grundlegende Python-Kenntnisse, einschliesslich Vertrautheit mit Variablentypen, Schleifen, bedingten Anweisungen, Funktionen und Array-Manipulationen&lt;/li&gt;&lt;li&gt;NumPy-Kenntnisse, einschliesslich der Verwendung von ndarrays und ufuncs&lt;/li&gt;&lt;li&gt;Es sind keine Vorkenntnisse in der CUDA-Programmierung erforderlich.&lt;/li&gt;&lt;/ul&gt;</essentials><outline>&lt;p&gt;&lt;strong&gt;Einf&amp;uuml;hrung&lt;/strong&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Treffen Sie den Ausbilder.&lt;/li&gt;&lt;li&gt;Erstellen Sie ein Konto bei https://learn.nvidia.com/join&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&lt;strong&gt;Einf&amp;uuml;hrung in CUDA Python mit Numba&lt;/strong&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Beginn der Arbeit mit dem Numba-Compiler und der CUDA-Programmierung in Python.&lt;/li&gt;&lt;li&gt;Verwenden Sie Numba-Dekoratoren zur GPU-Beschleunigung von numerischen Python-Funktionen.&lt;/li&gt;&lt;li&gt;Optimieren Sie die Speicher&amp;uuml;bertragungen vom Host zum Ger&amp;auml;t und vom Ger&amp;auml;t zum Host.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&lt;strong&gt;Benutzerdefinierte CUDA-Kernel in Python mit Numba&lt;/strong&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Lernen Sie die parallele Thread-Hierarchie von CUDA kennen und erfahren Sie, wie Sie die M&amp;ouml;glichkeiten paralleler Programme erweitern k&amp;ouml;nnen.&lt;/li&gt;&lt;li&gt;Starten Sie massiv parallele benutzerdefinierte CUDA-Kernel auf der GPU.&lt;/li&gt;&lt;li&gt;Verwenden Sie atomare CUDA-Operationen, um Wettlaufbedingungen w&amp;auml;hrend der parallelen Ausf&amp;uuml;hrung zu vermeiden.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&lt;strong&gt;Mehrdimensionale Raster und gemeinsamer Speicher f&amp;uuml;r CUDA Python mit Numba&lt;/strong&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Lernen Sie, wie man mehrdimensionale Gitter erstellt und wie man parallel an 2D-Matrizen arbeitet.&lt;/li&gt;&lt;li&gt;Nutzung des gemeinsamen Speichers auf dem Ger&amp;auml;t zur F&amp;ouml;rderung der Speicherkoaleszenz bei der Umformung von 2D-Matrizen.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&lt;strong&gt;Abschlussbericht&lt;/strong&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Besprechung der wichtigsten Erkenntnisse und abschliessende Fragen.&lt;/li&gt;&lt;li&gt;Schliessen Sie die Bewertung ab, um ein Zertifikat zu erhalten.&lt;/li&gt;&lt;li&gt;Nehmen Sie an der Workshop-Umfrage teil.&lt;/li&gt;&lt;/ul&gt;</outline><comments>&lt;p&gt;&lt;em&gt;Dieser Text wurde automatisiert &amp;uuml;bersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte &lt;span class=&quot;cms-link-marked&quot;&gt;&lt;a class=&quot;fl-href-prod&quot; href=&quot;/swisscom/en/course/nvidia-faccp&quot;&gt;&lt;svg role=&quot;img&quot; aria-hidden=&quot;true&quot; focusable=&quot;false&quot; data-nosnippet class=&quot;cms-linkmark&quot;&gt;&lt;use xlink:href=&quot;/css/img/icnset-linkmarks.svg#linkmark&quot;&gt;&lt;/use&gt;&lt;/svg&gt;hier&lt;/a&gt;&lt;/span&gt;.&lt;/em&gt;&lt;/p&gt;</comments><objective_plain>Am Ende des Workshops werden Sie die grundlegenden Werkzeuge und Techniken für GPU-beschleunigte Python-Anwendungen mit CUDA und Numba kennenlernen:



- GPU-Beschleunigung von NumPy-ufuncs mit ein paar Zeilen Code.
- Konfigurieren Sie die Code-Parallelisierung mithilfe der CUDA-Thread-Hierarchie.
- Schreiben Sie benutzerdefinierte CUDA-Gerätekernel für maximale Leistung und Flexibilität.
- Verwenden Sie Memory Coalescing und On-Device Shared Memory, um die CUDA Kernel-Bandbreite zu erhöhen.</objective_plain><essentials_plain>- Grundlegende Python-Kenntnisse, einschliesslich Vertrautheit mit Variablentypen, Schleifen, bedingten Anweisungen, Funktionen und Array-Manipulationen
- NumPy-Kenntnisse, einschliesslich der Verwendung von ndarrays und ufuncs
- Es sind keine Vorkenntnisse in der CUDA-Programmierung erforderlich.</essentials_plain><outline_plain>Einführung



- Treffen Sie den Ausbilder.
- Erstellen Sie ein Konto bei https://learn.nvidia.com/join
Einführung in CUDA Python mit Numba



- Beginn der Arbeit mit dem Numba-Compiler und der CUDA-Programmierung in Python.
- Verwenden Sie Numba-Dekoratoren zur GPU-Beschleunigung von numerischen Python-Funktionen.
- Optimieren Sie die Speicherübertragungen vom Host zum Gerät und vom Gerät zum Host.
Benutzerdefinierte CUDA-Kernel in Python mit Numba



- Lernen Sie die parallele Thread-Hierarchie von CUDA kennen und erfahren Sie, wie Sie die Möglichkeiten paralleler Programme erweitern können.
- Starten Sie massiv parallele benutzerdefinierte CUDA-Kernel auf der GPU.
- Verwenden Sie atomare CUDA-Operationen, um Wettlaufbedingungen während der parallelen Ausführung zu vermeiden.
Mehrdimensionale Raster und gemeinsamer Speicher für CUDA Python mit Numba



- Lernen Sie, wie man mehrdimensionale Gitter erstellt und wie man parallel an 2D-Matrizen arbeitet.
- Nutzung des gemeinsamen Speichers auf dem Gerät zur Förderung der Speicherkoaleszenz bei der Umformung von 2D-Matrizen.
Abschlussbericht



- Besprechung der wichtigsten Erkenntnisse und abschliessende Fragen.
- Schliessen Sie die Bewertung ab, um ein Zertifikat zu erhalten.
- Nehmen Sie an der Workshop-Umfrage teil.</outline_plain><comments_plain>Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.</comments_plain><duration unit="d" days="1">1 Tag</duration><pricelist><price country="US" currency="USD">500.00</price><price country="DE" currency="EUR">500.00</price><price country="AT" currency="EUR">500.00</price><price country="SE" currency="EUR">500.00</price><price country="SI" currency="EUR">500.00</price><price country="GB" currency="GBP">420.00</price><price country="IT" currency="EUR">500.00</price><price country="CA" currency="CAD">690.00</price></pricelist><miles/></course>