Cloudera - CCA Data Analyst

Varighet

Varighet:

Bare 3 dager

Metode

Metode:

klasserommet / på nett / Hybrid

Neste dato

Neste dato:

26/9/2022 (Mandag)

Overview

On this accelerated 3-day Cloudera CCA Data Analyst course, you'll get the skills you need to apply traditional data analytics and business intelligence skills to big data.

Your expert instructor will introduce you to the tools and techniques you need to access, manipulate, transform, and analyse complex data sets using SQL and familiar scripting languages.

You'll learn topics such as:

  • The features that Pig, Hive, and Impala offer for data acquisition, storage, and analysis
  • The fundamentals of Apache Hadoop and data ETL (extract, transform, load), ingestion, and processing with Hadoop
  • How Pig, Hive, and Impala improve productivity for typical analysis tasks
  • Joining diverse datasets to gain valuable business insight
  • Performing real-time, complex queries on datasets

Access to 24/7 labs means that you can test your hands-on skills in navigating the Hadoop ecosystem whenever you like. Through our unique Lecture | Lab | Review technique, you'll gain Apache Hadoop skills faster.

On this course, you'll prepare for and sit the CCA Data Analyst exam, covered by your Certification Gurantee.

If you're a data analyst, business intelligence specialist, developer, system architect or database administrator, this course is ideal for you.

Her er 8 grunner til hvorfor du skal gjennomføre ditt CCA Data Analyst hos Firebrand Training:

  1. Du blir utdannet og sertifisert på bare 3 dager. Hos oss får du din utdanning og sertifisering på rekordtid, en sertifisering du også gjennomfører der og da som en integrert del av den intensive, akselererte utdanningen.
  2. Alt er inkludert. Et engangsbeløp dekker alt kursmaterial, eksamen, kost og losji og tilbyr den mest kostnadseffektive måten å gjennomføre ditt CCA Data Analyst kurs og sertifisering på. Og dette uten noen uannonserte ytterligere kostnader.
  3. Du klarer sertifiseringen første gangen eller kan gå kurset om igjen kostnadsfritt. Det er vår garanti. Vi er sikre på at du vil klare din CCA Data Analyst sertifisering første gangen. Men skulle du mot formodning ikke gjøre det kan du innen et år komme tilbake og kun betale for eventuelle overnattinger og din eksamen. Alt annet er gratis.
  4. Du lærer deg mer.Tradisjonelle utdanningsdager varer fra kl. 09.00 til 16.00 med lange lunsj- og kaffepauser. Hos Firebrand Training får du minst 12 timers effektiv og fokusert kvalitetsutdanning hver dag sammen med din instruktør, uten private eller arbeidsrelaterte, forstyrrende momenter.
  5. Du lærer deg CCA Data Analyst raskere. Vi kombinerer de tre innlæringsmetodene (Presentasjon |Øving| Diskusjon) slik at vi gjennomfører kurset på en måte som sikrer at du lærer deg raskere og lettere.
  6. Du er i sikre hender.Vi har utdannet og sertifisert 125.505 personer, vi er partner med alle de store navn i bransjen og vi har vunnet atskillige utmerkelser, bla. a. "Årets Learning Partner 2010, 2011, 2012, 2013 og 2015” fra Microsoft Danmark og med en vekst på 1430 % siden 2009 er vi årets Gazelle prisvinner på Sjælland, Danmark.
  7. Du lærer deg ikke bare teorien. Vi har videreutviklet CCA Data Analyst kursen og tilbyr flere praktiske øvelser og sikrer på den måten, at du kan bruke dine ferdigheter for å løse daglige praktiske problemstillinger.
  8. Du lærer av de beste. Våre instruktører på CCA Data Analyst er de beste i bransjen og tilbyr en helt unik blanding av kunnskap, praktisk erfaring og pasjon for å lære bort.

Curriculum

Introduction Apache Hadoop Fundamentals

  • The Motivation for Hadoop
  • Hadoop Overview
  • Data Storage: HDFS
  • Distributed Data Processing: YARN, MapReduce, and Spark
  • Data Processing and Analysis: Pig, Hive, and Impala
  • Database Integration: Sqoop
  • Other Hadoop Data Tools
  • Exercise Scenarios

Introduction to Apache Pig

  • What is Pig?
  • Pig's Features
  • Pig Use Cases
  • Interacting with Pig

Basic Data Analysis with Apache Pig

  • Pig Latin Syntax
  • Loading Data
  • Simple Data Types
  • Field Definitions
  • Data Output
  • Viewing the Schema
  • Filtering and Sorting Data
  • Commonly Used Functions

Processing Complex Data with Apache Pig

  • Storage Formats
  • Complex/Nested Data Types
  • Grouping
  • Built-In Functions for Complex Data
  • Iterating Grouped Data

Multi-Dataset Operations with Apache Pig

  • Techniques for Combining Datasets
  • Joining Datasets in Pig
  • Set Operations
  • Splitting Datasets

Apache Pig Troubleshooting and Optimisation

  • Troubleshooting Pig
  • Logging
  • Using Hadoop's Web UI
  • Data Sampling and Debugging
  • Performance Overview
  • Understanding the Execution Plan
  • Tips for Improving the Performance of Pig Jobs

Introduction to Apache Hive and Impala

  • What is Hive?
  • What is Impala?
  • Why Use Hive and Impala?
  • Schema and Data Storage
  • Comparing Hive and Impala to Traditional Databases
  • Use Cases

Querying with Apache Hive and Impala

  • Databases and Tables
  • Basic Hive and Impala Query Language Syntax
  • Data Types
  • Using Hue to Execute Queries
  • Using Beeline (Hive's Shell)
  • Using the Impala Shell

Apache Hive and Impala Data Management

  • Data Storage
  • Creating Databases and Tables
  • Loading Data
  • Altering Databases and Tables
  • Simplifying Queries with Views
  • Storing Query Results

Data Storage and Performance

  • Partitioning Tables
  • Loading Data into Partitioned Tables
  • When to Use Partitioning
  • Choosing a File Format
  • Using Avro and Parquet File Formats

Relational Data Analysis with Apache Hive and Impala

  • Joining Datasets
  • Common Built-In Functions
  • Aggregation and Windowing

Complex Data with Apache Hive and Impala

  • Complex Data with Hive
  • Complex Data with Impala

Analysing Text with Apache Hive and Impala

  • Using Regular Expressions with
  • Hive and Impala
  • Processing Text Data with SerDes in Hive
  • Sentiment Analysis and n-grams in Hive

Apache Hive Optimisation

  • Understanding Query Performance
  • Bucketing
  • Indexing Data
  • Hive on Spark

Apache Impala Optimisation

  • How Impala Executes Queries
  • Improving Impala Performance

Extending Apache Hive and Impala

  • Custom SerDes and File Formats in Hive
  • Data Transformation with
    • Custom Scripts in Hive
    • User-Defined Functions
    • Parameterised Queries

Choosing the Best Tool for the Job

  • Comparing Pig, Hive, Impala, and Relational Databases

Exam Track

On this course, you'll prepare for and take the following exam at the Firebrand Training centre, covered by your Certification Guarantee.

CCA Data Analyst Exam (CCA159)

  • Number of questions: 8-12
  • Format: performance-based
  • Duration: 120 minutes
  • Passing Score: 70%

What's Included

On this course, you'll receive:

  • Official Cloudera Data Analyst courseware

Prerequisites

Before attending this course, you should have knowledge of:

  • SQL
  • Linux command line
  • At least one scripting language (e.g., Bash scripting, Perl, Python, Ruby).

You don't need to have experience in Apache Hadoop.

Anmeldelser

Vi har lært opp 125.505 personer på 12 år. Vi ba dem om å anmelde vår akselererte opplæring. Akkurat nå har 96,60% angitt at Firebrand overgikk forventningene:

"Great training at a convenient location."
Kenneth Brann, DOD. (25/7/2022 (Mandag) til 26/7/2022 (Tirsdag))

"Pretty good and enjoyable course"
James McRobbie, Lexis Nexis. (26/7/2022 (Tirsdag) til 27/7/2022 (Onsdag))

"The instructor was a great teacher and has gone through everything in great detail. He has been great to have"
Joseph Bulpin, LexisNexis. (26/7/2022 (Tirsdag) til 27/7/2022 (Onsdag))

"The instructor was a wonderful and adaptable trainer that took into account the needs of the group and the differing paces of learning. He also put up with a lot of rambunctiousness very gracefully! Thank you for helping coach us in Scrum."
Saara Laspa. (26/7/2022 (Tirsdag) til 27/7/2022 (Onsdag))

"Firebrand\'s approach to training just makes sense."
Darren Edmondson. (25/7/2022 (Mandag) til 26/7/2022 (Tirsdag))

Kursdatoer

Start

Slutt

Kapasitet

Plass

Registrer deg

23/5/2022 (Mandag)

25/5/2022 (Onsdag)

Ferdig - Gi tilbakemelding

-

 

26/9/2022 (Mandag)

28/9/2022 (Onsdag)

Venteliste

Landsdekkende

 

7/11/2022 (Mandag)

9/11/2022 (Onsdag)

Begrenset kapasitet

Landsdekkende

 

19/12/2022 (Mandag)

21/12/2022 (Onsdag)

Ledige plasser

Landsdekkende

 

30/1/2023 (Mandag)

1/2/2023 (Onsdag)

Ledige plasser

Landsdekkende

 

13/3/2023 (Mandag)

15/3/2023 (Onsdag)

Ledige plasser

Landsdekkende

 

Siste anmeldelser fra studenten vår