Nur 3 Tage
Classroom
18.03.2025 (Dienstag)
Überblick
Erlangen Sie die Fähigkeiten, um Apache Hadoop zu erstellen, warten und zu optimieren. Die Cloudera Certified Developer for Apache Hadoop (CCDH) Zertifizierung vermittelt Ihnen die Schlüsselkonzepte und die Expertise, welche für die Erstellung robuster Datenprozess-Anwendungen mit Apache Hadoop nötig sind. Von Arbeitsflussimplementierungen und dem Arbeiten mit APIs über das Schreiben des MapReduce Codes und die Ausführung von Joins - Clouderas Trainingskurs ist die beste Vorbereitung für reale Harausforderungen, welche Hadoop Entwickler gegenüber stehen.
Während des Kurses erlangen Sie das nötige Wissen, um die CCDH Prüfung zu bestehen, welche Teil des Kurses ist. Mithilfe von Vorträgen und praktischen Übungseinheiten werden folgende Themengebiete behandelt:
- MapReduce, das Hadoop Distributed File System (HDFS) und die Erstellung von MapReduce Codes
- Best Practices und Überlegungen für die Entwicklung von Hadoop, Fehlerbehebungstechniken und die Implementierung von Arbeitsflüssen und gebräuchlichen Algorithmen
- Die Wirkungsoptimierung von Hive, Pig, Sqoop, Flume, Oozie und anderen Projekten des Apache Hadoop Ökosystems
- Erstellung angepasster Komponenten, wie WritableComparables und InputFormats zur Steuerung des Schreibens komplexer Datentypen und der Ausführung von Joins zur Verbindung von Datensets in MapReduce
- Erweiterte Hadoop API Themen, welche für die Datenanalyse in der Praxis relevant sind
Lehrplan
The Motivation for Hadoop
- Problems with traditional large-scale systems
- Introducing Hadoop
- Hadoopable problems
Hadoop: Basic Concepts and HDFS
- The Hadoop project and Hadoop components
- The Hadoop Distributed File System
Introduction to MapReduce
- MapReduce overview
- Example: WordCount
- Mappers
- Reducers
Hadoop Clusters and the Hadoop Ecosystem
- Hadoop cluster overview
- Hadoop jobs and tasks
- Other Hadoop ecosystem components
Writing a MapReduce Program in Java
- Basic MapReduce API Concepts
- Writing MapReduce Drivers, Mappers, and Reducers in Java
- Speeding up Hadoop development by using eclipse
- Differences between the old and new MapReduce APIs
Writing a MapReduce Program Using Streaming
- Writing Mappers and Reducers with the streaming API
Unit Testing MapReduce Programs
- Unit testing
- The JUnit and MRUnit testing frameworks
- Writing unit tests with MRUnit
- Running unit tests
Delving Deeper into the Hadoop API
- Using the ToolRunner class
- Setting up and tearing down Mappers and Reducers
- Decreasing the amount of intermediate data with combiners
- Accessing HDFS programmatically
- Using the distributed cache
- Using the Hadoop API’s Library of Mappers, Reducers, and Partitioners
Practical Development Tips and Techniques
- Strategies for debugging MapReduce code
- Testing MapReduce code locally by using LocalJobRunner
- Writing and viewing log files
- Retrieving job information with counters
- Reusing objects
- Creating map-only MapReduce jobs
Partitioners and Reducers
- How partitioners and Reducers work together
- Determining the optimal number of Reducers for a job
- Writing customer partitioners
Data Input and Output
- Creating custom writable and WritableComparable implementations
- Saving binary data using sequenceFile and Avro data files
- Issues to consider when using file compression
- Implementing custom InputFormats and OutputFormats
Common MapReduce Algorithms
- Sorting and searching large data sets
- Indexing data
- Computing term frequency — Inverse Document Frequency
- Calculating word co-occurrence
- Performing Secondary Sort
Joining Data Sets in MapReduce Jobs
- Writing a Map-Side Join
- Writing a Reduce-Side Join
Integrating Hadoop into the Enterprise Workflow
- Integrating Hadoop into an existing enterprise
- Loading data from an RDBMS into HDFS by using Sqoop
- Managing real-time data using Flume
- Accessing HDFS from legacy systems with FuseDFS and HttpFS
An Introduction to Hive, Imapala, and Pig
- The motivation for Hive, Impala, and Pig
- Hive overview
- Impala overview
- Pig overview
- Choosing Between Hive, Impala, and Pig
An Introduction to Oozie
- Introduction to Oozie
- Creating Oozie workflows
Zertifizierung
Für die Erlangung der CCDH Zertifizierung müssen Sie folgende Prüfung bestehen, welche Teil des Intensivkurses ist:
- Cloudera Certified Developer for Apache Hadoop (CCD-410)
Die Prüfung besteht aus 55 Fragen und Sie haben 90 Minuten Bearbeitungszeit. Bei einem richtigen Anteil von mindestens 70% gilt die Prüfung als bestanden.
Leistungspaket
Als Teil des Kurses erhalten Sie:
- Offizielle Cloudera Kursunterlagen
Voraussetzungen
Dieser Kurs richtet sich an Entwickler, welche über Entwicklungserfahrung verfügen. Java Wissen ist sehr empfehlenswert und wird für die Fertigstellung der praktischen Übungen vorausgesetzt. Vorwissen zum Thema Apache Hadoop wird nicht vorausgesetzt.
Leistungspaket
Unser Kurspaket umfasst:
- Umfassende Schulungsmaterialien
- Praxiserfahrene Trainer, die das bewährte Lecture | Lab | ReviewTM-Konzept anwenden
- Moderne Trainingseinrichtungen
- 24 Stunden Zugang zur IT-Lernumgebung
- Prüfungsgebühren*
- Prüfungen werden während des Kurses abgelegt**
- Bei Präsenzkursen: Unterkunft, Frühstück, Mittagessen, Abendessen, Snacks und Getränke
- Firebrand Leistungsgarantie gemäß unseren AGB***
* Ausnahme: Prüfungsgutscheine sind bei folgenden Kursen nicht einbegriffen: Kurse von CREST, BSI Grundschutz Berater und GIAC. Bei diesen Kursen muss die Prüfungsgebühr direkt an den entsprechenden Partner entrichtet werden.
** Ausnahme: Die Prüfungen der COBIT, Cybersecurity Audit, CCAK, IT Risk Fundamentals, IT Audit Fundamentals, CSX-P, ITCA, CET, GIAC, CCSK, CREST Kurse , MSP , BSI Grundschutz Berater sowie EC-Council CPENT werden nicht während des Kurses abgelegt.
*** Wenn ein Kursteilnehmer die Prüfung nicht erfolgreich bestehen sollte, kann der Trainingskurs innerhalb eines Jahres wiederholt werden. Dabei fallen nur die Kosten für die Unterkunft und Verpflegung sowie ggf. die Prüfungsgebühren an. Ausnahme: Bei Kursen von Cisco und VMware entstehen außerdem zusätzliche Kosten für die Nutzung der (digitalen) Kursunterlagen und der Lab-/Übungsumgebung.
Vorteile
Sieben Gründe, warum Sie Ihren Kurs bei Firebrand Training absolvieren sollten
- Zwei Möglichkeiten der Schulung. Wählen Sie zwischen Präsenz- und Online-Kursen.
- Schnell zertifiziert. Mit uns werden Sie in Rekordzeit geschult.
- Unser Kurspreis beinhaltet alles. Eine einmalige Kursgebühr deckt alle Kursmaterialien, Prüfungen**, Unterkunft* und Mahlzeiten* ab. Keine versteckten Extrakosten.
- Bestehen Sie beim ersten Mal oder trainieren Sie erneut kostenlos. Das ist unsere Garantie. Wir sind sicher, dass Sie Ihren Kurs beim ersten Mal bestehen werden. Wenn nicht, kommen Sie innerhalb eines Jahres wieder und zahlen nur für Unterkunft, Prüfungen und Nebenkosten.
- Sie werden mehr lernen. Ein Tag bei einem traditionellen Schulungsanbieter dauert in der Regel von 9 bis 17 Uhr, mit einer schönen langen Mittagspause. Bei Firebrand Training erhalten Sie mindestens 10 Stunden pro Tag, in denen Sie mit Ihrem Trainer lernen.
- Sie werden schneller lernen. Wahrscheinlich haben Sie einen anderen Lernstil als Ihre Mitschüler. Wir kombinieren visuelle, auditive und taktile Methoden, um den Stoff so zu vermitteln, so dass Sie schneller und leichter lernen.
- Sie werden von den Besten lernen. Seit 2010 wurden wir jedes Jahr von der Schulungsbranche zu den „Top 20 IT-Schulungsunternehmen des Jahres“ gewählt. Wir haben nicht nur viele weitere Auszeichnungen erhalten, sondern auch über 135.000 Fachleute geschult und zertifiziert.
- Nur für Schulungen vor Ort. Gilt nicht für Online-Kurse.
** Es gelten einige Ausnahmen. Bitte lesen Sie die Prüfungsübersicht oder sprechen Sie mit unseren Experten
Machen Sie einen kostenlosen Praxistest, um Ihr Wissen einzuschätzen! Kostenloser Übungstest