Réservez les formations disponibles partout en France !

location-dot
location-dot
location-dot
À partir de
location-dot
de68692b-5cda-450d-b3dd-a55ca116013c
image OF
  1. Accueil
  2. Numérique
  3. Informatique
  4. AWS
  5. Big Data on AWS
Big Data on AWS

Big Data on AWS

Qualiopi
En centre
Non éligible CPF
Sélectionnez une session :

Choisissez une date pour pouvoir réserver !

Objectifs
Programme
  • Utiliser Apache Hadoop avec Amazon EMR
  • Lancer et configurer un cluster Amazon EMR
  • Utilisez des frameworks de programmation communs pour Amazon EMR, notamment Hive, Pig et Streaming
  • Utilisez Hue pour améliorer la facilité d’utilisation d’Amazon EMR
  • Utilisez les analyses en mémoire avec Spark sur Amazon EMR
  • Comprendre comment des services comme AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena et Amazon QuickSight peuvent être utilisés avec des charges de travail Big Data

Jour 1

Module 1 : Présentation du Big Data

  • Qu’est-ce que le big data
  • Le pipeline big data
  • Principes architecturaux du Big Data

Module 2 : Ingestion et transfert Big Data

  • Présentation : Ingestion de données
  • Transfert de données

Module 3 : Streaming Big Data et Amazon Kinesis

  • Traitement de flux de données volumineuses
  • Amazon Kinesis
  • Amazon Kinesis Data Firehose
  • Flux vidéo Amazon Kinesis
  • Analyse de données Amazon Kinesis
  • Atelier pratique 1 : Diffusion et traitement des logs du serveur Apache à l’aide d’Amazon Kinesis

Module 4 : Solutions de stockage de Big Data

  • Options de stockage de données AWS
  • Concepts de solutions de stockage
  • Facteurs dans le choix d’un magasin de données

Module 5 : Traitement et analyse Big Data

  • Traitement et analyse de données volumineuses
  • Amazon Athena
  • Atelier pratique 2 : Utilisation d’Amazon Athena pour analyser les données de journal

Jour 2

Module 6 : Apache Hadoop et Amazon EMR

  • Introduction à Amazon EMR et Apache Hadoop
  • Bonnes pratiques pour l’ingestion de données
  • Amazon EMR
  • Architecture Amazon EMR
  • Atelier pratique 3 : Stockage et interrogation de données sur Amazon DynamoDB

Module 7 : Utilisation d’Amazon EMR

  • Développer et exécuter votre application
  • Lancement de votre cluster
  • Gestion de la sortie de vos travaux terminés

Module 8 : Frameworks de programmation Hadoop

  • Frameworks Hadoop
  • Autres frameworks à utiliser sur Amazon EMR
  • Atelier pratique 4 : Traitement des journaux de serveur avec Hive sur Amazon EMR

Module 9 : Interfaces Web sur Amazon EMR

  • Hue sur Amazon EMR
  • Surveillance de votre cluster
  • Atelier pratique 5 : Exécution de scripts Pig dans Hue sur Amazon EMR

Module 10 : Apache Spark sur Amazon EMR

  • Apache Spark
  • Utilisation de Spark
  • Atelier pratique 6 : Traiter les données de NY Taxi à l’aide d’Apache Spark

Jour 3

Module 11 : Utilisation d’AWS Glue pour automatiser les charges de travail ETL

  • Qu’est-ce qu’AWS Glue ?
  • AWS Glue : Orchestration des tâches

Module 12 : Amazon Redshift et les mégadonnées

  • Entrepôts de données vs bases de données traditionnelles
  • Amazon Redshift
  • Architecture Amazon Redshift

Module 13 : Sécuriser vos déploiements Amazon

  • Sécuriser vos déploiements Amazon
  • Présentation de la sécurité Amazon EMR
  • Présentation d’AWS Identity and Access Management (IAM)
  • Sécurisation des données
  • Présentation de la sécurité Amazon Kinesis
  • Présentation de la sécurité d’Amazon DynamoDB
  • Présentation de la sécurité Amazon Redshift

Module 14 : Gérer les coûts du Big Data

  • Considérations relatives au coût total pour Amazon EMR
  • Modèles de tarification Amazon EC2
  • Modèles de tarification Amazon Kinesis
  • Considérations de coût pour Amazon DynamoDB
  • Considérations sur les coûts et modèles de tarification pour Amazon Redshift
  • Optimisation des coûts avec AWS

Module 15 : Visualiser et orchestrer le Big Data

  • Visualisation du big data
  • Amazon QuickSight
  • Orchestrer un workflow big data
  • Atelier pratique 7 : Utiliser TIBCO Spotfire pour visualiser les données

Module 16 : Modèles de conception Big Data

  • Architectures communes

Module 17 : Conclusion du cours

  • Et après?
Public visé
  • Les personnes responsables de la conception et de la mise en œuvre de solutions Big Data, à savoir les architectes de solutions et les administrateurs SysOps
  • Data Scientists et Data Analysts intéressés à en savoir plus sur les solutions Big Data sur AWS
Prérequis
  • Connaissance de base des technologies Big Data, notamment Apache Hadoop, HDFS et les requêtes SQL/NoSQL
  • Formation numérique gratuite Data Analytics Fundamentals ou expérience équivalente
  • Connaissance pratique des services AWS de base et de la mise en œuvre du cloud public
  • Avoir suivi la formation en classe AWS Technical Essentials ou posséder une expérience équivalente
  • Compréhension de base de l’entreposage de données, des systèmes de bases de données relationnelles et de la conception de bases de données

Choisissez une date pour pouvoir réserver !

Autres formations disponibles :
Prochaines sessions disponibles :03 juin08 juil.12 août23 sept.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :04 juin09 juil.13 août24 sept.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :05 juin10 juil.21 août25 sept.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :10 juin15 juil.19 août23 sept.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :12 juin17 juil.21 août18 sept.
Qualiopi
En centre
Non éligible CPF
logo ouformer
Réalisation :Definima
Utilisation des cookies

Nous utilisons des cookies pour vous fournir l'ensemble de nos services, notamment la recherche et les alertes. En acceptant, vous consentez à notre utilisation de ces cookies.

Refuser
Accepter