<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE FL_Course SYSTEM "https://www.flane.de/dtd/fl_course095.dtd"><?xml-stylesheet type="text/xsl" href="https://portal.flane.ch/css/xml-course.xsl"?><course productid="34058" language="de" source="https://portal.flane.ch/swisscom/xml-course/google-bbdp" lastchanged="2025-11-24T18:07:03+01:00" parent="https://portal.flane.ch/swisscom/xml-courses"><title>Building Batch Data Pipelines on Google Cloud</title><productcode>BBDP</productcode><vendorcode>GO</vendorcode><vendorname>Google</vendorname><fullproductcode>GO-BBDP</fullproductcode><version>3.0</version><objective>&lt;ul&gt;
&lt;li&gt;Bestimmen Sie, ob Batch-Datenpipelines die richtige Wahl f&amp;uuml;r Ihren gesch&amp;auml;ftlichen Anwendungsfall sind.&lt;/li&gt;&lt;li&gt;Entwerfen und Erstellen skalierbarer Batch-Datenpipelines f&amp;uuml;r die Aufnahme und Transformation grosser Datenmengen.&lt;/li&gt;&lt;li&gt;Implementierung von Datenqualit&amp;auml;tskontrollen in Batch-Pipelines zur Gew&amp;auml;hrleistung der Datenintegrit&amp;auml;t.&lt;/li&gt;&lt;li&gt;Orchestrierung, Verwaltung und &amp;Uuml;berwachung von Batch-Datenpipeline-Workflows, Implementierung von Fehlerbehandlung und Beobachtbarkeit mit Hilfe von Protokollierungs- und &amp;Uuml;berwachungstools.&lt;/li&gt;&lt;/ul&gt;</objective><essentials>&lt;ul&gt;
&lt;li&gt;Grundkenntnisse in Data Warehousing und ETL/ELT-Konzepten&lt;/li&gt;&lt;li&gt;Grundlegende SQL-Kenntnisse&lt;/li&gt;&lt;li&gt;Grundlegende Programmierkenntnisse (Python empfohlen)&lt;/li&gt;&lt;li&gt;Vertrautheit mit gcloud CLI und der Google Cloud-Konsole&lt;/li&gt;&lt;li&gt;Vertrautheit mit den wichtigsten Google Cloud-Konzepten und -Diensten&lt;/li&gt;&lt;/ul&gt;</essentials><audience>&lt;ul&gt;
&lt;li&gt;Daten-Ingenieure&lt;/li&gt;&lt;li&gt;Datenanalysten&lt;/li&gt;&lt;/ul&gt;</audience><outline>&lt;h4&gt;Modul 1 - Wann sollte man Batch-Datenpipelines w&amp;auml;hlen?&lt;/h4&gt;&lt;p&gt;
&lt;strong&gt;Beschreibung:&lt;/strong&gt; Sie lernen die entscheidende Rolle eines Dateningenieurs bei der Entwicklung und Wartung von Batch-Datenpipelines kennen, verstehen deren Kernkomponenten und Lebenszyklus und analysieren h&amp;auml;ufige Herausforderungen bei der Batch-Datenverarbeitung. Ausserdem lernen Sie die wichtigsten Google Cloud-Dienste kennen, die diese Herausforderungen bew&amp;auml;ltigen.&lt;/p&gt;
&lt;p&gt;Themen:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Batch-Datenpipelines und ihre Anwendungsf&amp;auml;lle&lt;/li&gt;&lt;li&gt;Verarbeitung und gemeinsame Herausforderungen&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Aktivit&amp;auml;ten:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Quiz&lt;/li&gt;&lt;/ul&gt;
&lt;h4&gt;Modul 2 - Entwurf und Aufbau von Batch-Datenpipelines&lt;/h4&gt;&lt;p&gt;
&lt;strong&gt;Beschreibung:&lt;/strong&gt; Sie entwerfen skalierbare Batch-Datenpipelines f&amp;uuml;r die Aufnahme und Transformation grosser Datenmengen. Ausserdem optimieren Sie Batch-Auftr&amp;auml;ge f&amp;uuml;r hohen Durchsatz und Kosteneffizienz, indem Sie verschiedene Techniken zur Ressourcenverwaltung und Leistungsoptimierung anwenden.&lt;/p&gt;
&lt;p&gt;Themen:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Entwurf von Batch-Pipelines&lt;/li&gt;&lt;li&gt;Grossfl&amp;auml;chige Datentransformationen&lt;/li&gt;&lt;li&gt;Datenfluss und Serverless f&amp;uuml;r Apache Spark&lt;/li&gt;&lt;li&gt;Datenverbindungen und Orchestrierung&lt;/li&gt;&lt;li&gt;Ausf&amp;uuml;hren einer Apache Spark-Pipeline&lt;/li&gt;&lt;li&gt;Optimieren der Batch-Pipeline-Leistung&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Aktivit&amp;auml;ten:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Quiz&lt;/li&gt;&lt;li&gt;&amp;Uuml;bung: Erstellen einer einfachen Batch-Datenpipeline mit Serverless f&amp;uuml;r Apache Spark&lt;/li&gt;&lt;li&gt;&amp;Uuml;bung: Erstellen einer einfachen Batch-Datenpipeline mit Dataflow Job Builder UI&lt;/li&gt;&lt;/ul&gt;&lt;h4&gt;Modul 3 - Kontrolle der Datenqualit&amp;auml;t in Batch-Datenpipelines&lt;/h4&gt;&lt;p&gt;
&lt;strong&gt;Beschreibung:&lt;/strong&gt; Sie entwickeln Datenvalidierungsregeln und Bereinigungslogik, um die Datenqualit&amp;auml;t in Batch-Pipelines sicherzustellen. Ausserdem implementieren Sie Strategien f&amp;uuml;r die Verwaltung der Schemaentwicklung und die Durchf&amp;uuml;hrung der Datendeduplizierung in grossen Datens&amp;auml;tzen.&lt;/p&gt;
&lt;p&gt;Themen:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Validierung und Bereinigung von Batch-Daten&lt;/li&gt;&lt;li&gt;Fehler protokollieren und auswerten&lt;/li&gt;&lt;li&gt;Schemaentwicklung f&amp;uuml;r Batch-Pipelines&lt;/li&gt;&lt;li&gt;Datenintegrit&amp;auml;t und Duplizierung&lt;/li&gt;&lt;li&gt;Deduplizierung mit Serverless f&amp;uuml;r Apache Spark&lt;/li&gt;&lt;li&gt;Deduplizierung mit Dataflow&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Aktivit&amp;auml;ten:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Quiz&lt;/li&gt;&lt;li&gt;&amp;Uuml;bung: Validieren der Datenqualit&amp;auml;t in einer Batch-Pipeline mit Serverless f&amp;uuml;r Apache Spark&lt;/li&gt;&lt;/ul&gt;&lt;h4&gt;Modul 4 - Orchestrierung und &amp;Uuml;berwachung von Batch-Datenpipelines&lt;/h4&gt;&lt;p&gt;
&lt;strong&gt;Beschreibung:&lt;/strong&gt; Sie orchestrieren komplexe Batch-Datenpipeline-Workflows f&amp;uuml;r eine effiziente Planung und Verlaufsverfolgung. Ausserdem implementieren Sie eine robuste Fehlerbehandlung, &amp;Uuml;berwachung und Beobachtbarkeit f&amp;uuml;r Batch-Daten-Pipelines.&lt;/p&gt;
&lt;p&gt;Themen:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Orchestrierung f&amp;uuml;r die Stapelverarbeitung&lt;/li&gt;&lt;li&gt;Cloud-Komponist&lt;/li&gt;&lt;li&gt;Vereinheitlichte Beobachtbarkeit&lt;/li&gt;&lt;li&gt;Warnmeldungen und Fehlerbehebung&lt;/li&gt;&lt;li&gt;Visuelles Pipeline-Management&lt;/li&gt;&lt;li&gt;Herzlichen Gl&amp;uuml;ckwunsch! Zusammenfassung des Kurses&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;Aktivit&amp;auml;ten:
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Quiz&lt;/li&gt;&lt;li&gt;&amp;Uuml;bung: Aufbau von Batch-Pipelines in der Cloud Data Fusion&lt;/li&gt;&lt;/ul&gt;</outline><comments>&lt;p&gt;&lt;em&gt;Dieser Text wurde automatisiert &amp;uuml;bersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte &lt;span class=&quot;cms-link-marked&quot;&gt;&lt;a class=&quot;fl-href-prod&quot; href=&quot;/swisscom/en/course/google-bbdp&quot;&gt;&lt;svg role=&quot;img&quot; aria-hidden=&quot;true&quot; focusable=&quot;false&quot; data-nosnippet class=&quot;cms-linkmark&quot;&gt;&lt;use xlink:href=&quot;/css/img/icnset-linkmarks.svg#linkmark&quot;&gt;&lt;/use&gt;&lt;/svg&gt;hier&lt;/a&gt;&lt;/span&gt;.&lt;/em&gt;&lt;/p&gt;</comments><objective_plain>- Bestimmen Sie, ob Batch-Datenpipelines die richtige Wahl für Ihren geschäftlichen Anwendungsfall sind.
- Entwerfen und Erstellen skalierbarer Batch-Datenpipelines für die Aufnahme und Transformation grosser Datenmengen.
- Implementierung von Datenqualitätskontrollen in Batch-Pipelines zur Gewährleistung der Datenintegrität.
- Orchestrierung, Verwaltung und Überwachung von Batch-Datenpipeline-Workflows, Implementierung von Fehlerbehandlung und Beobachtbarkeit mit Hilfe von Protokollierungs- und Überwachungstools.</objective_plain><essentials_plain>- Grundkenntnisse in Data Warehousing und ETL/ELT-Konzepten
- Grundlegende SQL-Kenntnisse
- Grundlegende Programmierkenntnisse (Python empfohlen)
- Vertrautheit mit gcloud CLI und der Google Cloud-Konsole
- Vertrautheit mit den wichtigsten Google Cloud-Konzepten und -Diensten</essentials_plain><audience_plain>- Daten-Ingenieure
- Datenanalysten</audience_plain><outline_plain>Modul 1 - Wann sollte man Batch-Datenpipelines wählen?


Beschreibung: Sie lernen die entscheidende Rolle eines Dateningenieurs bei der Entwicklung und Wartung von Batch-Datenpipelines kennen, verstehen deren Kernkomponenten und Lebenszyklus und analysieren häufige Herausforderungen bei der Batch-Datenverarbeitung. Ausserdem lernen Sie die wichtigsten Google Cloud-Dienste kennen, die diese Herausforderungen bewältigen.

Themen:



- Batch-Datenpipelines und ihre Anwendungsfälle
- Verarbeitung und gemeinsame Herausforderungen
Aktivitäten:



- Quiz

Modul 2 - Entwurf und Aufbau von Batch-Datenpipelines


Beschreibung: Sie entwerfen skalierbare Batch-Datenpipelines für die Aufnahme und Transformation grosser Datenmengen. Ausserdem optimieren Sie Batch-Aufträge für hohen Durchsatz und Kosteneffizienz, indem Sie verschiedene Techniken zur Ressourcenverwaltung und Leistungsoptimierung anwenden.

Themen:



- Entwurf von Batch-Pipelines
- Grossflächige Datentransformationen
- Datenfluss und Serverless für Apache Spark
- Datenverbindungen und Orchestrierung
- Ausführen einer Apache Spark-Pipeline
- Optimieren der Batch-Pipeline-Leistung
Aktivitäten:



- Quiz
- Übung: Erstellen einer einfachen Batch-Datenpipeline mit Serverless für Apache Spark
- Übung: Erstellen einer einfachen Batch-Datenpipeline mit Dataflow Job Builder UI
Modul 3 - Kontrolle der Datenqualität in Batch-Datenpipelines


Beschreibung: Sie entwickeln Datenvalidierungsregeln und Bereinigungslogik, um die Datenqualität in Batch-Pipelines sicherzustellen. Ausserdem implementieren Sie Strategien für die Verwaltung der Schemaentwicklung und die Durchführung der Datendeduplizierung in grossen Datensätzen.

Themen:



- Validierung und Bereinigung von Batch-Daten
- Fehler protokollieren und auswerten
- Schemaentwicklung für Batch-Pipelines
- Datenintegrität und Duplizierung
- Deduplizierung mit Serverless für Apache Spark
- Deduplizierung mit Dataflow
Aktivitäten:



- Quiz
- Übung: Validieren der Datenqualität in einer Batch-Pipeline mit Serverless für Apache Spark
Modul 4 - Orchestrierung und Überwachung von Batch-Datenpipelines


Beschreibung: Sie orchestrieren komplexe Batch-Datenpipeline-Workflows für eine effiziente Planung und Verlaufsverfolgung. Ausserdem implementieren Sie eine robuste Fehlerbehandlung, Überwachung und Beobachtbarkeit für Batch-Daten-Pipelines.

Themen:



- Orchestrierung für die Stapelverarbeitung
- Cloud-Komponist
- Vereinheitlichte Beobachtbarkeit
- Warnmeldungen und Fehlerbehebung
- Visuelles Pipeline-Management
- Herzlichen Glückwunsch! Zusammenfassung des Kurses
Aktivitäten:



- Quiz
- Übung: Aufbau von Batch-Pipelines in der Cloud Data Fusion</outline_plain><comments_plain>Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.</comments_plain><duration unit="d" days="1">1 Tag</duration><pricelist><price country="US" currency="USD">595.00</price><price country="IT" currency="EUR">650.00</price><price country="GB" currency="GBP">660.00</price><price country="CA" currency="CAD">820.00</price><price country="AT" currency="EUR">950.00</price><price country="SE" currency="EUR">950.00</price><price country="DE" currency="EUR">950.00</price><price country="FR" currency="EUR">790.00</price><price country="CH" currency="CHF">950.00</price></pricelist><miles/></course>