<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE FL_Course SYSTEM "https://www.flane.de/dtd/fl_course095.dtd"><?xml-stylesheet type="text/xsl" href="https://portal.flane.ch/css/xml-course.xsl"?><course productid="18695" language="en" source="https://portal.flane.ch/swisscom/en/xml-course/sap-54010" lastchanged="2025-07-29T12:17:56+02:00" parent="https://portal.flane.ch/swisscom/en/xml-courses"><title>Big Data - Data Engineering Grundlagen</title><productcode>54010</productcode><vendorcode>SA</vendorcode><vendorname>SAP</vendorname><fullproductcode>SA-54010</fullproductcode><version>1.0</version><essentials>&lt;p&gt;Neben generellen IT Kenntnissen in SQL und Programmierung sind keine besonderen Vorkenntnisse erforderlich. Der vorherige Besuch unseres Grundlagenseminars Big Data &amp;ndash; Definitionen, Technologien und Produkte im &amp;Uuml;berblick erleichtert das Verst&amp;auml;ndnis.&lt;/p&gt;</essentials><audience>&lt;p&gt;Das Seminar richtet sich an Datenbank Experten, BigData Experten, Sicherheitsexperten, Systemadministratoren, Netzwerkadministratoren, Data Science Mitarbeiter, Entwickler sowie alle Interessierten, die dem Thema BigData tiefer unter die Haube schauen m&amp;ouml;chten.&lt;/p&gt;</audience><contents>&lt;h5&gt;Data Engineering&lt;/h5&gt;&lt;h5&gt;Einf&amp;uuml;hrung Big Data:&lt;/h5&gt;&lt;ul&gt;
&lt;li&gt;Was ist Big Data?&lt;/li&gt;&lt;li&gt;Die drei Vs&lt;/li&gt;&lt;li&gt;Abgrenzung zu relationalen Datenbanken&lt;/li&gt;&lt;li&gt;Data Lake und hybride Architektur Konzept&lt;/li&gt;&lt;/ul&gt;&lt;h5&gt;IT Grundlagen:&lt;/h5&gt;&lt;ul&gt;
&lt;li&gt;Basiswissen Netzwerke&lt;/li&gt;&lt;li&gt;Basiswissen verteilte Systeme&lt;/li&gt;&lt;/ul&gt;&lt;h5&gt;&amp;Ouml;kosystem Hadoop:&lt;/h5&gt;&lt;ul&gt;
&lt;li&gt;Hadoop Cluster Architektur&lt;/li&gt;&lt;li&gt;&amp;Uuml;berblick &amp;uuml;ber die Hadoop Distributionen&lt;/li&gt;&lt;li&gt;HBase&lt;/li&gt;&lt;li&gt;HDFS&lt;/li&gt;&lt;li&gt;Hive&lt;/li&gt;&lt;li&gt;Kafka&lt;/li&gt;&lt;li&gt;NiFi&lt;/li&gt;&lt;li&gt;Pig&lt;/li&gt;&lt;li&gt;Spark / Spark Streaming&lt;/li&gt;&lt;li&gt;Sqoop&lt;/li&gt;&lt;li&gt;Ambari&lt;/li&gt;&lt;li&gt;Zookeeper&lt;/li&gt;&lt;li&gt;&amp;Uuml;berblick weiterer Komponenten&lt;/li&gt;&lt;/ul&gt;&lt;h5&gt;Security in Hadoop:&lt;/h5&gt;&lt;ul&gt;
&lt;li&gt;Ranger&lt;/li&gt;&lt;li&gt;Kerberos&lt;/li&gt;&lt;/ul&gt;&lt;h5&gt;Hands on Hadoop &amp;ndash; Praxisteil:&lt;/h5&gt;&lt;ul&gt;
&lt;li&gt;HDFS Puzzle&lt;/li&gt;&lt;li&gt;Administration Grundlagen&lt;/li&gt;&lt;li&gt;Ambari Monitoring M/R&lt;/li&gt;&lt;li&gt;HDFS Strukturen anlegen&lt;/li&gt;&lt;li&gt;Zookeeper Nodes&lt;/li&gt;&lt;li&gt;HBase&lt;/li&gt;&lt;li&gt;HDFS&lt;/li&gt;&lt;li&gt;Hive&lt;/li&gt;&lt;li&gt;Kafka&lt;/li&gt;&lt;li&gt;NiFi&lt;/li&gt;&lt;li&gt;Pig&lt;/li&gt;&lt;li&gt;Spark / Spark Streaming&lt;/li&gt;&lt;li&gt;Sqoop&lt;/li&gt;&lt;/ul&gt;&lt;h5&gt;Vertiefung der Hadoop Komponenten - Praxisteil:&lt;/h5&gt;&lt;ul&gt;
&lt;li&gt;Streaming&lt;/li&gt;&lt;li&gt;Buffering&lt;/li&gt;&lt;li&gt;Archivierung&lt;/li&gt;&lt;li&gt;Transformation&lt;/li&gt;&lt;li&gt;Analyse&lt;/li&gt;&lt;/ul&gt;</contents><essentials_plain>Neben generellen IT Kenntnissen in SQL und Programmierung sind keine besonderen Vorkenntnisse erforderlich. Der vorherige Besuch unseres Grundlagenseminars Big Data – Definitionen, Technologien und Produkte im Überblick erleichtert das Verständnis.</essentials_plain><audience_plain>Das Seminar richtet sich an Datenbank Experten, BigData Experten, Sicherheitsexperten, Systemadministratoren, Netzwerkadministratoren, Data Science Mitarbeiter, Entwickler sowie alle Interessierten, die dem Thema BigData tiefer unter die Haube schauen möchten.</audience_plain><contents_plain>Data Engineering

Einführung Big Data:


- Was ist Big Data?
- Die drei Vs
- Abgrenzung zu relationalen Datenbanken
- Data Lake und hybride Architektur Konzept
IT Grundlagen:


- Basiswissen Netzwerke
- Basiswissen verteilte Systeme
Ökosystem Hadoop:


- Hadoop Cluster Architektur
- Überblick über die Hadoop Distributionen
- HBase
- HDFS
- Hive
- Kafka
- NiFi
- Pig
- Spark / Spark Streaming
- Sqoop
- Ambari
- Zookeeper
- Überblick weiterer Komponenten
Security in Hadoop:


- Ranger
- Kerberos
Hands on Hadoop – Praxisteil:


- HDFS Puzzle
- Administration Grundlagen
- Ambari Monitoring M/R
- HDFS Strukturen anlegen
- Zookeeper Nodes
- HBase
- HDFS
- Hive
- Kafka
- NiFi
- Pig
- Spark / Spark Streaming
- Sqoop
Vertiefung der Hadoop Komponenten - Praxisteil:


- Streaming
- Buffering
- Archivierung
- Transformation
- Analyse</contents_plain><duration unit="d" days="3">3 days</duration><pricelist><price country="AT" currency="EUR">2990.00</price></pricelist><miles/></course>