Cloudera - CCA Data Analyst

Varaktighet

Varaktighet:

Bara 3 dagar

Metod

Metod:

Klassrum / Uppkopplad / Hybrid

Nästa datum

Nästa datum:

26/9/2022 (Måndag)

Overview

On this accelerated 3-day Cloudera CCA Data Analyst course, you'll get the skills you need to apply traditional data analytics and business intelligence skills to big data.

Your expert instructor will introduce you to the tools and techniques you need to access, manipulate, transform, and analyse complex data sets using SQL and familiar scripting languages.

You'll learn topics such as:

  • The features that Pig, Hive, and Impala offer for data acquisition, storage, and analysis
  • The fundamentals of Apache Hadoop and data ETL (extract, transform, load), ingestion, and processing with Hadoop
  • How Pig, Hive, and Impala improve productivity for typical analysis tasks
  • Joining diverse datasets to gain valuable business insight
  • Performing real-time, complex queries on datasets

Access to 24/7 labs means that you can test your hands-on skills in navigating the Hadoop ecosystem whenever you like. Through our unique Lecture | Lab | Review technique, you'll gain Apache Hadoop skills faster.

On this course, you'll prepare for and sit the CCA Data Analyst exam, covered by your Certification Gurantee.

If you're a data analyst, business intelligence specialist, developer, system architect or database administrator, this course is ideal for you.

Här är 8 skäl varför du ska genomföra din CCA Data Analyst hos Firebrand Training:

  1. Du blir utbildad och certifierad på bara 3 dagar. Hos oss får du din utbildning och certifiering på rekordtid, en certifering du också genomför här på plats som en integrerad del av den intensiva, accelererade utbildningen.
  2. Allt är inkluderat. Ett engångsbelopp täcker alla kursmaterial, examen, boende och mat och erbjuder det mest kostnadseffektiva sättet att erhålla din CCA Data Analyst kurs och certifiering på. Och detta utan några oannonserade ytterligare kostnader.
  3. Du klarar CCA Data Analyst certifieringen första gången eller kan gå om kursen kostnadsfritt. Det är vår garanti. Vi är säkra på att du kommer klara din certifiering första gången. Men skulle du mot förmodan inte göra det kan du inom ett år komma tillbaks, delta i hela kursen igen, och bara betala för eventuella övernattningar och din examen. Allt annat är gratis.
  4. Du lär dig mer.Traditionella utbildningsdagar pågår kl. 09.00-16.00 med långa lunch- och fikapauser. Hos Firebrand Training får du minst 12 timmars effektiv och fokuserad kvalitetsutbildning varje dag tillsammans med din instruktör, utan vare sig privata eller arbetsrelaterade störande moment.
  5. Du lär dig CCA Data Analyst snabbare. Vi kombinerar de tre inlärningsmetoderna (Presentation|Övning|Diskussion) så att vi därigenom genomför kursen på ett sätt som säkerställer att du lär dig snabbare och lättare.
  6. Du är i säkra händer.Vi har utbildat och certifierat 124.229 personer, vi är auktoriserad partner med alla de stora namnen i branschen och har dessutom vunnit åtskilliga utmärkelser med bland annat ”Årets Learning Partner 2010, 2011, 2012, 2013 och 2015” från Microsoft Danmark och Gazelle priset 2013 - 1. plats för region Själland i Danmark med en tillväxt om 1.430% sedan 2009.
  7. Du lär dig inte bara teorin. Vi har vidareutvecklat CCA Data Analystkursen med fler praktiska övningar som ger dig det extra du behöver för att kunna lösa praktiska problemställningar och klara din certifiering.
  8. Du lär dig från de bästa. Våra instruktörer är de bästa i branschen och erbjuder en helt unik blandning av kunskap, praktisk erfarenhet och passion för att lära ut.

Curriculum

Introduction Apache Hadoop Fundamentals

  • The Motivation for Hadoop
  • Hadoop Overview
  • Data Storage: HDFS
  • Distributed Data Processing: YARN, MapReduce, and Spark
  • Data Processing and Analysis: Pig, Hive, and Impala
  • Database Integration: Sqoop
  • Other Hadoop Data Tools
  • Exercise Scenarios

Introduction to Apache Pig

  • What is Pig?
  • Pig's Features
  • Pig Use Cases
  • Interacting with Pig

Basic Data Analysis with Apache Pig

  • Pig Latin Syntax
  • Loading Data
  • Simple Data Types
  • Field Definitions
  • Data Output
  • Viewing the Schema
  • Filtering and Sorting Data
  • Commonly Used Functions

Processing Complex Data with Apache Pig

  • Storage Formats
  • Complex/Nested Data Types
  • Grouping
  • Built-In Functions for Complex Data
  • Iterating Grouped Data

Multi-Dataset Operations with Apache Pig

  • Techniques for Combining Datasets
  • Joining Datasets in Pig
  • Set Operations
  • Splitting Datasets

Apache Pig Troubleshooting and Optimisation

  • Troubleshooting Pig
  • Logging
  • Using Hadoop's Web UI
  • Data Sampling and Debugging
  • Performance Overview
  • Understanding the Execution Plan
  • Tips for Improving the Performance of Pig Jobs

Introduction to Apache Hive and Impala

  • What is Hive?
  • What is Impala?
  • Why Use Hive and Impala?
  • Schema and Data Storage
  • Comparing Hive and Impala to Traditional Databases
  • Use Cases

Querying with Apache Hive and Impala

  • Databases and Tables
  • Basic Hive and Impala Query Language Syntax
  • Data Types
  • Using Hue to Execute Queries
  • Using Beeline (Hive's Shell)
  • Using the Impala Shell

Apache Hive and Impala Data Management

  • Data Storage
  • Creating Databases and Tables
  • Loading Data
  • Altering Databases and Tables
  • Simplifying Queries with Views
  • Storing Query Results

Data Storage and Performance

  • Partitioning Tables
  • Loading Data into Partitioned Tables
  • When to Use Partitioning
  • Choosing a File Format
  • Using Avro and Parquet File Formats

Relational Data Analysis with Apache Hive and Impala

  • Joining Datasets
  • Common Built-In Functions
  • Aggregation and Windowing

Complex Data with Apache Hive and Impala

  • Complex Data with Hive
  • Complex Data with Impala

Analysing Text with Apache Hive and Impala

  • Using Regular Expressions with
  • Hive and Impala
  • Processing Text Data with SerDes in Hive
  • Sentiment Analysis and n-grams in Hive

Apache Hive Optimisation

  • Understanding Query Performance
  • Bucketing
  • Indexing Data
  • Hive on Spark

Apache Impala Optimisation

  • How Impala Executes Queries
  • Improving Impala Performance

Extending Apache Hive and Impala

  • Custom SerDes and File Formats in Hive
  • Data Transformation with
    • Custom Scripts in Hive
    • User-Defined Functions
    • Parameterised Queries

Choosing the Best Tool for the Job

  • Comparing Pig, Hive, Impala, and Relational Databases

Exam Track

On this course, you'll prepare for and take the following exam at the Firebrand Training centre, covered by your Certification Guarantee.

CCA Data Analyst Exam (CCA159)

  • Number of questions: 8-12
  • Format: performance-based
  • Duration: 120 minutes
  • Passing Score: 70%

What's Included

On this course, you'll receive:

  • Official Cloudera Data Analyst courseware

Prerequisites

Before attending this course, you should have knowledge of:

  • SQL
  • Linux command line
  • At least one scripting language (e.g., Bash scripting, Perl, Python, Ruby).

You don't need to have experience in Apache Hadoop.

Är du redo för din Firebrand kurs?

Vi intervjuar alla potentiella deltagare om deras bakgrund, utbildning, certifiering och personliga inställning. Om du kommer igenom denna process så har du riktigt goda möjligheter att klara din certifiering.

Firebrand Training erbjuder en ambitiös utbildningsmiljö som förutsätter att du verkligen dedikerar dig till kursen. Ovanstående förkunskaper är endast vägledande, många deltagare med mindre erfarenhet men med en annan bakgrund eller kunskap har framgångsrikt genomfört sin utbildning hos Firebrand Training.

Om du funderar på huruvida du uppfyller rekommenderade förkunskaper vänligen ring oss på (0)8 52 50 01 66 och prata med en av våra utbildningsrådgivare som kan hjälpa dig.

Kundreferenser

Vi har utbildat 124.229 kursdeltagare under 12 år. Vi har bett alla göra en utvärdering av vår accelererade utbildning. För närvarande har 96,62% sagt att Firebrand överträffat deras förväntningar:

"Knowledgeable instructor with lots of experience, using real world examples to make it relatable and focused."
Caroline Yardley. (26/4/2022 (Tisdag) till 29/4/2022 (Fredag))

"Intense, clear and lots of fun. Highly recommend."
Anonymous. (26/4/2022 (Tisdag) till 29/4/2022 (Fredag))

"Intense, clear and lots of fun, highly recommend."
Anonymous. (26/4/2022 (Tisdag) till 29/4/2022 (Fredag))

"The instructor did a good work in delivering the material. Very helpful and willing to go the extra mile to support the students."
KB. (25/4/2022 (Måndag) till 30/4/2022 (Lördag))

"It is was proper challenge, but the instructor provided the content with a flamboyant and upbeat style and despite the sometimes try nature of the material, the instructor was able to keep us all well engaged. Probably the best trainer I have had."
Michael Ross, NHS England. (25/4/2022 (Måndag) till 30/4/2022 (Lördag))

Kursdatum

Startar

Slutar

Tillgänglighet

Plats

Registrera

23/5/2022 (Måndag)

25/5/2022 (Onsdag)

Avslutad - Lämna feedback

-

 

26/9/2022 (Måndag)

28/9/2022 (Onsdag)

Väntelista

Rikstäckande

 

7/11/2022 (Måndag)

9/11/2022 (Onsdag)

Begränsat antal platser

Rikstäckande

 

19/12/2022 (Måndag)

21/12/2022 (Onsdag)

Platser tillgängliga

Rikstäckande

 

30/1/2023 (Måndag)

1/2/2023 (Onsdag)

Platser tillgängliga

Rikstäckande

 

13/3/2023 (Måndag)

15/3/2023 (Onsdag)

Platser tillgängliga

Rikstäckande

 

Senaste recensioner från våra studenter