OSDA-15 - BIG DATA ARCHITECT

INFORMAZIONI SUL CORSO

durata

Durata:

4 GIORNI
categoria

Categoria:

Data & Big Data
qualifica

Qualifica istruttore:

Docente Senior (min. 5 anni)
dedicato a

Dedicato a:

Analista
produttore

Produttore:

PCSNET

SCEGLI LA SEDE PER QUESTO CORSO

CORSO A CALENDARIO

Per vedere le informazioni relative al calendario del corso scegli prima una sede
sede
Sede: PCSNET Roma
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €
sede
Sede: PCSNET Milano
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €
sede
Sede: PCSNET Nord Est
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €
sede
Sede: PCSNET Torino
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €
sede
Sede: PCSNET Emilia Romagna
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €
sede
Sede: PCSNET Toscana
prezzo
Prezzo: 1.640 € + IVA
Questo corso attualmente non ha date a Calendario, può essere attivato su richiesta o può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Marche
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €
sede
Sede: PCSNET Napoli
prezzo
Prezzo: 1.640 € + IVA
Questo corso attualmente non ha date a Calendario, può essere attivato su richiesta o può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Puglia
prezzo
Prezzo: 1.640 € + IVA
Questo corso attualmente non ha date a Calendario, può essere attivato su richiesta o può essere erogato in forma dedicata.
Usa il box qui accanto per richiederne uno apposta per te!
sede
Sede: PCSNET Sicilia
prezzo
Prezzo: 1.640 € + IVA
Inizio
Fine
Prezzo
 
01 lug 24
04 lug 24
1.640 €
28 ott 24
31 ott 24
1.640 €

CORSO DEDICATO

Per avere informazioni sul corso dedicato compila il form e ti contatteremo

CORSO DEDICATO

Grazie per la tua richiesta, ti contatteremo al più presto.

OBIETTIVI

Al termine del corso gli allievi dovranno aver acquisito tutti gli elementi necessari all'implementazione di piattaforme Big Data per l’analisi ed il processamento dei dati.

Nel corso sono trattati i seguenti macro-argomenti:

  • Introduzione a Big Data e Big Data Analytics 
  • Il ruolo del Data Scientist
  • Database NoSQL 
  • Introduzione alla piattaforma Apache Hadoop 
  • Introduzione a Spark 
  • Costruire un data lake 

PREREQUISITI

  • Buona conoscenza della programmazione strutturata derivata dall’uso di un qualsiasi linguaggio di programmazione.
  • Buona conoscenza dei database e del SQL.
  • Buona conoscenza del sistema operativo Linux.

CONTENUTI

Introduzione a Big Data e Big Data Analytics

  • Cosa sono i Big Data
  • I concetti chiave dei Big Data e della Data Science
  • Il ciclo di vita del data analisys
    • Descriptive Analytics
    • Predictive Analytics
    • Prescriptive Analytics
    • Automated Analytics
  • Il ruolo del Data Scientist

 

Database NoSQL

  • Classificazione
  • Caratteristiche principali
  • Differenze con i DB relazionali
  • Limiti dei DB relazionali
  • Modellazione dei dati
  • Panoramica dei principali db NoSQL

 

Hadoop

  • Introduzione ed Ecosistema
  • Introduzione ad Apache Hadoop
  • Panoramica Ecosistema Hadoop
  • Problematiche nei sistemi di grandi dati
  • Perchè Hadoop e i suoi vantaggi
  • Architettura Hadoop e HDFS
  • Introduzione ad Hadoop Distribuited File Sistem
  • Distrubuzione dei processi in un cluster
  • Storage:conservazione dati nell’architettura HDFS
  • Utilizzo e applicazioni con HDFS
  • Resource Management: Architettura YARN e utilizzi

 

Costruire un data lake con Apache Hadoop

  • Struttura di un data-lake
  • Principi di base e approccio
  • Affinità con i data-warehouse
  • Criticità
  • Utilizzare Apache Hadoop per i data-lake

 

Hive

  • Introduzione
  • Panoramica Data Storage
  • Vantaggi e motivi del loro utilizzo
  • Creazione database e tabelle
  • Caricamento dati nelle tabelle
  • Utilizzo di Sqoop in Hive

 

Apache Spark

  • Introduzione
  • Utilizzo Spark Shell
  • RDDs (Resilient Distributed Datasets)
  • Programmazione funzionale in Spark
  • Applicazioni RDDs con Spark
  • Key-Value Pair RDDs
  • MapReduce
  • Operazioni RDD
  • Accenni di Scal in Spark
  • SQL Spark
  • Panoramica Spark SQL e SQL Context
  • Trasformazione e Interrogazione DataFrames
  • Salvataggio DataFrames

INFO

  • Materiale didattico: Materiale didattico e relativo prezzo da concordare
  • Costo materiale didattico: NON incluso nel prezzo del corso
  • Natura del corso: Operativo (previsti lab su PC)

PARTNERSHIP