Vous trouverez ci-dessous le programme détaillé de la formation « Ecosystème du Big Data ». Cette formation d’une journée vous prépare à la compréhension et application générale du Big Data.
Objectifs pédagogiques
- Appréhender les enjeux et les objectifs du Big Data ainsi que la place centrale des données dans le SI
- Comprendre les défis technologiques inhérents aux traitements Big Data
- Connaître les outils, les principaux acteurs et quelques use cases actuel de l’écosystème
Programme détaillé
Enjeux et objectifs
- Origines et besoins
- Définition du Big Data
- Paradigmes de la donnée
- Use Cases
- Atelier : Exemples réels
Objectif opérationnel : Appréhender les enjeux et les objectifs du BigData
Moyen d’évaluation : QCM
LifeCycle Management
- Acquisition
- Complex Event Processing
- Indexation
- Notation et qualité
- Traitement : ML, transactionnel
- Visualisation
Objectif opérationnel : Connaître les étapes du cycle de vie de la data
Moyen d’évaluation : QCM
Défis technologiques
- Le stockage
- Le traitement massivement parallèle
- Les format des données
- Les langages : R, Python, Scala, Java
Objectif opérationnel : Comprendre les défis technologiques inhérents aux traitements Big Data
Moyen d’évaluation : QCM
Outils
- Apache Hadoop : MapReduce, Yarn, HDFS, HBase
- Streaming : Spark, Storm
- Apprentissage / ML : Apache Mahout, SparkML
- Base de données NoSQL : MongoDB, Cassandra
- Intégration : Kafka, Flume, Sqoop
- Interrogation : Impala, Hive, Pig
- Ordonnancement : Oozie
- Crawlers
Objectif opérationnel : Connaître les outils utilisés dans le Big Data
Moyen d’évaluation : QCM
Acteurs
- Les historiques
- Les géants
- La BI
- Les intégrateurs
- Le conseil spécialisé
- Les spécialistes IT
Objectif opérationnel : Connaître les principaux acteurs du Big Data
Moyen d’évaluation : QCM