{"course":{"productid":18695,"modality":6,"active":true,"language":"de","title":"Big Data - Data Engineering Grundlagen","productcode":"54010","vendorcode":"SA","vendorname":"SAP","fullproductcode":"SA-54010","courseware":{"has_ekit":false,"has_printkit":true,"language":""},"url":"https:\/\/portal.flane.ch\/course\/sap-54010","essentials":"<p>Neben generellen IT Kenntnissen in SQL und Programmierung sind keine besonderen Vorkenntnisse erforderlich. Der vorherige Besuch unseres Grundlagenseminars Big Data &ndash; Definitionen, Technologien und Produkte im &Uuml;berblick erleichtert das Verst&auml;ndnis.<\/p>","audience":"<p>Das Seminar richtet sich an Datenbank Experten, BigData Experten, Sicherheitsexperten, Systemadministratoren, Netzwerkadministratoren, Data Science Mitarbeiter, Entwickler sowie alle Interessierten, die dem Thema BigData tiefer unter die Haube schauen m&ouml;chten.<\/p>","contents":"<h5>Data Engineering<\/h5><h5>Einf&uuml;hrung Big Data:<\/h5><ul>\n<li>Was ist Big Data?<\/li><li>Die drei Vs<\/li><li>Abgrenzung zu relationalen Datenbanken<\/li><li>Data Lake und hybride Architektur Konzept<\/li><\/ul><h5>IT Grundlagen:<\/h5><ul>\n<li>Basiswissen Netzwerke<\/li><li>Basiswissen verteilte Systeme<\/li><\/ul><h5>&Ouml;kosystem Hadoop:<\/h5><ul>\n<li>Hadoop Cluster Architektur<\/li><li>&Uuml;berblick &uuml;ber die Hadoop Distributionen<\/li><li>HBase<\/li><li>HDFS<\/li><li>Hive<\/li><li>Kafka<\/li><li>NiFi<\/li><li>Pig<\/li><li>Spark \/ Spark Streaming<\/li><li>Sqoop<\/li><li>Ambari<\/li><li>Zookeeper<\/li><li>&Uuml;berblick weiterer Komponenten<\/li><\/ul><h5>Security in Hadoop:<\/h5><ul>\n<li>Ranger<\/li><li>Kerberos<\/li><\/ul><h5>Hands on Hadoop &ndash; Praxisteil:<\/h5><ul>\n<li>HDFS Puzzle<\/li><li>Administration Grundlagen<\/li><li>Ambari Monitoring M\/R<\/li><li>HDFS Strukturen anlegen<\/li><li>Zookeeper Nodes<\/li><li>HBase<\/li><li>HDFS<\/li><li>Hive<\/li><li>Kafka<\/li><li>NiFi<\/li><li>Pig<\/li><li>Spark \/ Spark Streaming<\/li><li>Sqoop<\/li><\/ul><h5>Vertiefung der Hadoop Komponenten - Praxisteil:<\/h5><ul>\n<li>Streaming<\/li><li>Buffering<\/li><li>Archivierung<\/li><li>Transformation<\/li><li>Analyse<\/li><\/ul>","summary":"<p>Das Thema Big Data ist aktueller denn je, pro Tag werde viele Petabyte an Daten generiert und warten darauf analysiert und verarbeitet zu werden.<\/p>\n<p>Mit dem Apache Hadoop &Ouml;kosystem wurde eine M&ouml;glichkeit geschaffen, grosse Datenmengen in einem verteilten System zu persistieren und Analysen und Vorhersagen auszuf&uuml;hren.<\/p>\n<p>Die damit verbundenen Begriffe rund um Data Science und Data Engineering sind allgegenw&auml;rtig. Nur was verbirgt sich hinter all den Trendbegriffen?<\/p>\n<p>Die Schulung gibt einen ersten Ein- und &Uuml;berblick &uuml;ber die Komponenten, Methoden und Begrifflichkeiten zu diesen Themen. Dieser beschr&auml;nkt sich nicht auf reine Theorie, sondern erm&ouml;glicht Ihnen erste praktische Erfahrungen anhand eines fiktiven Projekts zu sammeln.<\/p>\n<p>Nach einer Einf&uuml;hrung in die Paradigmen von Big Data lernen Sie anhand eines realen Twitter Datensets, wie einfach Sie Daten in den Hadoop Cluster streamen k&ouml;nnen. Danach nehmen Sie eigenh&auml;ndig Daten-Transformationen vor und orientieren sich dabei immer am besprochenen Data Lake Konzept. Am Ende des Data Engineering Parts haben Sie die Daten soweit verdichtet und aufbereitet, dass Sie im n&auml;chsten Schritt mit Data Science Methoden Analysen darauf ausf&uuml;hren.<\/p>","essentials_plain":"Neben generellen IT Kenntnissen in SQL und Programmierung sind keine besonderen Vorkenntnisse erforderlich. Der vorherige Besuch unseres Grundlagenseminars Big Data \u2013 Definitionen, Technologien und Produkte im \u00dcberblick erleichtert das Verst\u00e4ndnis.","audience_plain":"Das Seminar richtet sich an Datenbank Experten, BigData Experten, Sicherheitsexperten, Systemadministratoren, Netzwerkadministratoren, Data Science Mitarbeiter, Entwickler sowie alle Interessierten, die dem Thema BigData tiefer unter die Haube schauen m\u00f6chten.","contents_plain":"Data Engineering\n\nEinf\u00fchrung Big Data:\n\n\n- Was ist Big Data?\n- Die drei Vs\n- Abgrenzung zu relationalen Datenbanken\n- Data Lake und hybride Architektur Konzept\nIT Grundlagen:\n\n\n- Basiswissen Netzwerke\n- Basiswissen verteilte Systeme\n\u00d6kosystem Hadoop:\n\n\n- Hadoop Cluster Architektur\n- \u00dcberblick \u00fcber die Hadoop Distributionen\n- HBase\n- HDFS\n- Hive\n- Kafka\n- NiFi\n- Pig\n- Spark \/ Spark Streaming\n- Sqoop\n- Ambari\n- Zookeeper\n- \u00dcberblick weiterer Komponenten\nSecurity in Hadoop:\n\n\n- Ranger\n- Kerberos\nHands on Hadoop \u2013 Praxisteil:\n\n\n- HDFS Puzzle\n- Administration Grundlagen\n- Ambari Monitoring M\/R\n- HDFS Strukturen anlegen\n- Zookeeper Nodes\n- HBase\n- HDFS\n- Hive\n- Kafka\n- NiFi\n- Pig\n- Spark \/ Spark Streaming\n- Sqoop\nVertiefung der Hadoop Komponenten - Praxisteil:\n\n\n- Streaming\n- Buffering\n- Archivierung\n- Transformation\n- Analyse","summary_plain":"Das Thema Big Data ist aktueller denn je, pro Tag werde viele Petabyte an Daten generiert und warten darauf analysiert und verarbeitet zu werden.\n\nMit dem Apache Hadoop \u00d6kosystem wurde eine M\u00f6glichkeit geschaffen, grosse Datenmengen in einem verteilten System zu persistieren und Analysen und Vorhersagen auszuf\u00fchren.\n\nDie damit verbundenen Begriffe rund um Data Science und Data Engineering sind allgegenw\u00e4rtig. Nur was verbirgt sich hinter all den Trendbegriffen?\n\nDie Schulung gibt einen ersten Ein- und \u00dcberblick \u00fcber die Komponenten, Methoden und Begrifflichkeiten zu diesen Themen. Dieser beschr\u00e4nkt sich nicht auf reine Theorie, sondern erm\u00f6glicht Ihnen erste praktische Erfahrungen anhand eines fiktiven Projekts zu sammeln.\n\nNach einer Einf\u00fchrung in die Paradigmen von Big Data lernen Sie anhand eines realen Twitter Datensets, wie einfach Sie Daten in den Hadoop Cluster streamen k\u00f6nnen. Danach nehmen Sie eigenh\u00e4ndig Daten-Transformationen vor und orientieren sich dabei immer am besprochenen Data Lake Konzept. Am Ende des Data Engineering Parts haben Sie die Daten soweit verdichtet und aufbereitet, dass Sie im n\u00e4chsten Schritt mit Data Science Methoden Analysen darauf ausf\u00fchren.","skill_level":"Expert","version":"1.0","duration":{"unit":"d","value":3,"formatted":"3 Tage"},"pricelist":{"List Price":{"AT":{"country":"AT","currency":"EUR","taxrate":20,"price":2990}}},"lastchanged":"2025-07-29T12:17:56+02:00","parenturl":"https:\/\/portal.flane.ch\/swisscom\/json-courses","nexturl_course_schedule":"https:\/\/portal.flane.ch\/swisscom\/json-course-schedule\/18695","source_lang":"de","source":"https:\/\/portal.flane.ch\/swisscom\/json-course\/sap-54010"}}