Cloudera - CCA Data Analyst

Looptijd

Looptijd:

Slechts 3 dagen

Methode

Methode:

Klas / Online / Hybride

Volgende datum

Volgende datum:

24/6/2024 (Maandag)

Overview

On this accelerated 3-day Cloudera CCA Data Analyst course, you'll get the skills you need to apply traditional data analytics and business intelligence skills to big data.

Your expert instructor will introduce you to the tools and techniques you need to access, manipulate, transform, and analyse complex data sets using SQL and familiar scripting languages.

You'll learn topics such as:

  • The features that Pig, Hive, and Impala offer for data acquisition, storage, and analysis
  • The fundamentals of Apache Hadoop and data ETL (extract, transform, load), ingestion, and processing with Hadoop
  • How Pig, Hive, and Impala improve productivity for typical analysis tasks
  • Joining diverse datasets to gain valuable business insight
  • Performing real-time, complex queries on datasets

Access to 24/7 labs means that you can test your hands-on skills in navigating the Hadoop ecosystem whenever you like. Through our unique Lecture | Lab | Review technique, you'll gain Apache Hadoop skills faster.

On this course, you'll prepare for and sit the CCA Data Analyst exam, covered by your Certification Gurantee.

If you're a data analyst, business intelligence specialist, developer, system architect or database administrator, this course is ideal for you.

Zeven redenen waarom u met uw CCA Data Analyst cursus voor Firebrand Training moet kiezen

  1. U zult in slechts 3 dagen CCA Data Analyst gecertificeerd zijn. Met ons bent u in recordtijd CCA Data Analyst getraind
  2. Onze CCA Data Analyst cursus is all-inclusive. Een eenmalige contributie bekostigt alle cursusmaterialen, accommodaties en maaltijden.
  3. Slaag de eerste keer voor CCA Data Analyst of volg de training nogmaals. Dit is onze garantie. Wij zijn er zeker van dat u de eerste keer zult slagen voor uw CCA Data Analyst cursus. Mocht dit niet het geval zijn, dan kunt u binnen het jaar terugkomen en enkel voor de accommodatie en examens te betalen. De rest is gratis
  4. U zult meer CCA Data Analyst leren. Een dag met een traditionele training aanbieder duurt over het algemeen van 9 uur 's ochtends tot 17 uur in de middag, met een lange lunchpauze. Met Firebrand Training kunt u rekenen op minstens 12 uur leren per dag met uw instructeur
  5. U zult CCA Data Analyst snellerde theorie beheersen. De kans bestaat dat u een andere manier van leren heeft dan uw omgeving. Wij combineren visuele, auditieve en tastbare leerstijlen, dit zorgt voor een snellere en eenvoudigere manier van leren
  6. U zult CCA Data Analyst studeren met de beste. We hebben het Q-For kwaliteit label, dat onze standaarden en professionaliteit in de training markt erkent. Naast het winnen van nog vele andere prijzen, hebben we inmiddels 134561 professionals getraind en gecertificeerd en we zijn partners met alle grote namen in deze tak van het bedrijfsleven
  7. U zult meer doen dan alleen CCA Data Analyst de cursusstof bestuderen. We maken gebruik van laboratoria, case-studies en oefentests, om ervoor te zorgen dat u uw nieuwe kennis in uw werkomgeving kan toepassen. Onze instructeurs gebruiken demonstraties en hun eigen ervaringen om de dag interessant en boeiend te houden

Benefits

Curriculum

Introduction Apache Hadoop Fundamentals

  • The Motivation for Hadoop
  • Hadoop Overview
  • Data Storage: HDFS
  • Distributed Data Processing: YARN, MapReduce, and Spark
  • Data Processing and Analysis: Pig, Hive, and Impala
  • Database Integration: Sqoop
  • Other Hadoop Data Tools
  • Exercise Scenarios

Introduction to Apache Pig

  • What is Pig?
  • Pig's Features
  • Pig Use Cases
  • Interacting with Pig

Basic Data Analysis with Apache Pig

  • Pig Latin Syntax
  • Loading Data
  • Simple Data Types
  • Field Definitions
  • Data Output
  • Viewing the Schema
  • Filtering and Sorting Data
  • Commonly Used Functions

Processing Complex Data with Apache Pig

  • Storage Formats
  • Complex/Nested Data Types
  • Grouping
  • Built-In Functions for Complex Data
  • Iterating Grouped Data

Multi-Dataset Operations with Apache Pig

  • Techniques for Combining Datasets
  • Joining Datasets in Pig
  • Set Operations
  • Splitting Datasets

Apache Pig Troubleshooting and Optimisation

  • Troubleshooting Pig
  • Logging
  • Using Hadoop's Web UI
  • Data Sampling and Debugging
  • Performance Overview
  • Understanding the Execution Plan
  • Tips for Improving the Performance of Pig Jobs

Introduction to Apache Hive and Impala

  • What is Hive?
  • What is Impala?
  • Why Use Hive and Impala?
  • Schema and Data Storage
  • Comparing Hive and Impala to Traditional Databases
  • Use Cases

Querying with Apache Hive and Impala

  • Databases and Tables
  • Basic Hive and Impala Query Language Syntax
  • Data Types
  • Using Hue to Execute Queries
  • Using Beeline (Hive's Shell)
  • Using the Impala Shell

Apache Hive and Impala Data Management

  • Data Storage
  • Creating Databases and Tables
  • Loading Data
  • Altering Databases and Tables
  • Simplifying Queries with Views
  • Storing Query Results

Data Storage and Performance

  • Partitioning Tables
  • Loading Data into Partitioned Tables
  • When to Use Partitioning
  • Choosing a File Format
  • Using Avro and Parquet File Formats

Relational Data Analysis with Apache Hive and Impala

  • Joining Datasets
  • Common Built-In Functions
  • Aggregation and Windowing

Complex Data with Apache Hive and Impala

  • Complex Data with Hive
  • Complex Data with Impala

Analysing Text with Apache Hive and Impala

  • Using Regular Expressions with
  • Hive and Impala
  • Processing Text Data with SerDes in Hive
  • Sentiment Analysis and n-grams in Hive

Apache Hive Optimisation

  • Understanding Query Performance
  • Bucketing
  • Indexing Data
  • Hive on Spark

Apache Impala Optimisation

  • How Impala Executes Queries
  • Improving Impala Performance

Extending Apache Hive and Impala

  • Custom SerDes and File Formats in Hive
  • Data Transformation with
    • Custom Scripts in Hive
    • User-Defined Functions
    • Parameterised Queries

Choosing the Best Tool for the Job

  • Comparing Pig, Hive, Impala, and Relational Databases

Exam Track

On this course, you'll prepare for and take the following exam at the Firebrand Training centre, covered by your Certification Guarantee.

CCA Data Analyst Exam (CCA159)

  • Number of questions: 8-12
  • Format: performance-based
  • Duration: 120 minutes
  • Passing Score: 70%

What's Included

On this course, you'll receive:

  • Official Cloudera Data Analyst courseware

Prerequisites

Before attending this course, you should have knowledge of:

  • SQL
  • Linux command line
  • At least one scripting language (e.g., Bash scripting, Perl, Python, Ruby).

You don't need to have experience in Apache Hadoop.

Weet je niet zeker of je aan de vereisten voldoet? Maak je geen zorgen. Jouw trainingsadviseur bespreekt jouw achtergrond met je om te begrijpen of deze cursus geschikt is voor je.

Beoordelingen

Wereldwijd heeft Firebrand in haar 10-jarig bestaan al 134561 studenten opgeleid! We hebben ze allemaal gevraagd onze versnelde opleidingen te evalueren. De laatste keer dat we onze resultaten analyseerden, bleek 96.41% ons te beoordelen als 'boven verwachting'


"De kennis van de trainer en zijn vermogen om deze hoeveelheid stof in 2 dagen over te brengen zijn een groot compliment waard. Kwaliteit van de locatie is uitstekend."
Arie van der Sman, Ventus. (25/3/2024 (Maandag) t/m 27/3/2024 (Woensdag))

"Van het begin tot het einde professionele dienstverlening"
Philip Lebesque. (25/3/2024 (Maandag) t/m 26/3/2024 (Dinsdag))

"Very good training!"
MK. (25/3/2024 (Maandag) t/m 26/3/2024 (Dinsdag))

"Very well structured! I found the course very useful and the instructor explained everything very well"
AN. (19/3/2024 (Dinsdag) t/m 21/3/2024 (Donderdag))

"I loved the pace and involvement of the coach. the course is very intensive but worth the price. the infrastructure and venue is fantastic aswell."
Andreas Vandenberghe, Allianz Technology SE. (18/3/2024 (Maandag) t/m 24/3/2024 (Zondag))

Cursusdata

Start datum

Eind datum

Status

Locatie

Nu boeken

19/2/2024 (Maandag)

21/2/2024 (Woensdag)

Beëindigde cursus - Geef feedback

-

 

24/6/2024 (Maandag)

26/6/2024 (Woensdag)

Wachtlijst

Landelijk

 

5/8/2024 (Maandag)

7/8/2024 (Woensdag)

Beperkte beschikbaarheid

Landelijk

 

16/9/2024 (Maandag)

18/9/2024 (Woensdag)

Open

Landelijk

 

28/10/2024 (Maandag)

30/10/2024 (Woensdag)

Open

Landelijk

 

9/12/2024 (Maandag)

11/12/2024 (Woensdag)

Open

Landelijk

 

Nieuwste beoordelingen van onze studenten