Réservez les formations disponibles partout en France !

location-dot
location-dot
location-dot
À partir de
location-dot
image OF
  1. Data Engineering avec Kafka, Cassandra et Spark

Data Engineering avec Kafka, Cassandra et Spark

Qualiopi
En centre
Non éligible CPF
Sélectionnez une session :

Choisissez une date pour pouvoir réserver !

Objectifs
Programme

A l'issue de cette formation, vous serez capable de :

  • Gérer les outils Spark, Cassandra et Kafka
  • Intégrer ses outils dans un même environnement
  • Développer une solution de Data Engineering de bout en bout avec Spark, Cassandra et Kafka
  • Identifier les points critiques et les leviers d'amélioration de la performance.

Jour 1

Introduction à Kafka

  • Kafka : une plateforme de données de flux
  • Un aperçu de Kafka et de son efficacité
  • Producers
  • Brokers
  • Consumers

Installation et architecture

  • Installation et options avancées
  • Fichiers journaux de Kafka
  • Réplication et fiabilité
  • Chemins d'écriture et de lecture de Kafka
  • Partitions, consumer groups et scalability

Développement et mise en oeuvre

  • Cas d'utilisation de Kafka Streams
  • Kafka Streams
  • Etude d'une application et usage de Kafka Streams

Jour 2

Introduction à Cassandra

  • Introduction au NoSQL
  • Prérequis de Cassandra
  • Installation
  • Fichier de configuration : conf/cassandra.yaml
  • L'architecture
  • Les réplications

Exemples de travaux pratiques (à titre indicatif)

  • Commandes de base
    • Connexion au système de base de données
    • Création de colonnes
    • Insertion
    • Modification recherche
  • Définition des colonnes et des types de données
  • Définition d'une clé primaire
  • Reconnaître une clé de partition
  • Le CQL : Cassandra Query Language
  • Exécution de scripts
  • Data Modeling
  • Créer une application
  • Ajout des noeuds

Jour 3

Apache Spark

  • Introduction à Spark
  • Vue d'ensemble de Spark
  • Ecosystème Spark
  • Spark vs Hadoop
  • Installation et configuration

Exemples de travaux pratiques (à titre indicatif)

  • Remise à niveau Python / Scala
  • Spark :
    • RDD (Resilient Distributed Dataset)
    • DataFrame
    • SQL
    • Streaming
    • MLlib
    • GraphX
  • Création d'applications Spark

Jour 4

  • Projet avec la mise en oeuvre d'une solution bout en bout (ingestion, stockage et calcul) via :
    • Kafka
    • Cassandra
    • Spark
Public visé

Développeurs, architectes Data, Data Analysts et/ou Data Engineers.

Prérequis

Avoir des connaissances sur Shell et Python.

Choisissez une date pour pouvoir réserver !

Autres formations disponibles :
Prochaines sessions disponibles :10 oct.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :13 oct.15 déc.19 févr.09 avr.
Qualiopi
En centre
Non éligible CPF
formation
Mérignac (33700)
Splunk - Niveau avancé
Prochaines sessions disponibles :13 oct.01 avr.31 août14 oct.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :13 oct.19 mars04 juin09 nov.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :13 oct.08 déc.28 janv.18 mars
Qualiopi
En centre
Non éligible CPF
logo ouformer
Réalisation :Definima
Utilisation des cookies

Nous utilisons des cookies pour vous fournir l'ensemble de nos services, notamment la recherche et les alertes. En acceptant, vous consentez à notre utilisation de ces cookies.

Tout refuser
Tout accepter