– Découvrir les principaux concepts du Big Data
– Évaluer les avantages et les inconvénients du Big Data
– Comprendre les principaux problèmes et les solutions potentielles
– Identifier les principales méthodes et champs d’application du Big Data
– Présenter les différents outils de stockage et traitement du Big Data
– Découvrir le monde de la visualisation du Big Data
– Les origines du Big Data : un monde de données numériques.
– Qu’est-ce que le Big Data ? Définitions, historique et enjeux
– Les dimensions « en V » du Big Data
– Concepts fondamentaux et caractéristiques clés du Big Data
– Différences et apports par rapport aux technologies traditionnelles
– Exemples d’application et usages des technologies B
– L’avènement de la donnée en tant que ressource stratégique
– Progrès et innovations de rupture (capacités de stockage, vitesses de
traitement)
– L’impact et les opportunités induites par le Big Data : nouveaux
leviers de performance
– BI et Big Data : concepts de Data Lake, Data Warehouse
– Création de valeur
– Les métiers de la data (Data Scientist, Data Analyst, Chief Data
officer…)
– Discussions sur les usages potentiels des solutions Big Data selon
les secteurs d’activité.
– Sources de données publiques, privées, la philosophie Open Data
– Classifier les données selon leur structure
– Vue d’ensemble des modes et architectures de stockage
– Présentation de l’écosystème Hadoop
– Principes de fonctionnement du modèle MapReduce
– Des SGBDR aux bases de données NoSQL : MongoDB, Cassandra, Neo4j…
– Considérations matérielles, les solutions Big Data dans le Cloud
-Retour historique : de l’analyse statistique au Data Mining
– Qu’est-ce que le Data Mining ? Relations avec la Business Intelligence
– Sélectionner les bons outils suivant la structure de données
– Analyse de données avec Pig et Hive, Apache Storm, Apache Spark
– Recherche et indexation des données avec ElasticSearch
– Big Data et intelligence artificielle, une convergence révolutionnaire
– Machine Learning : vue d’ensemble des technologies et algorithmes d’apprentissage automatique
– Introduction aux réseaux neuronaux (deep learning)
-Principes fondamentaux et objectifs de la visualisation des données
– Limites des outils et méthodes traditionnels (Excel, BusinessObjects, etc)
– Panorama des solutions de la visualisation des données : Tableau, Qlik, Microstrategy, Microsoft Power BI…
– Quels types de visualisation pour quels usages ?
– La visualisation interactive pour représenter les données complexes
– Retour sur les données personnelles et impact du Big Data sur la vie privée
– Gouvernance et cycle de vie de la donnée dans une architecture Big Data
– Obligations légales des organisations
– Fondamentaux et usages de la cryptographie
– Les meilleures pratiques concernant la sécurité
(pseudonymisation, anonymisation…)
Référence : BIG002
Type de Stage : Pratique
Durée : 2 jours
Direction informatique et
fonctionnelle. Responsables
informatique, chefs de projet,
architectes, développeurs.
Connaissances de base des
architectures techniques.