Objectifs

 – Découvrir les principaux concepts du Big Data

– Évaluer les avantages et les inconvénients du Big Data

– Comprendre les principaux problèmes et les solutions potentielles

– Identifier les principales méthodes et champs d’application du Big Data

– Présenter les différents outils de stockage et traitement du Big Data

– Découvrir le monde de la visualisation du Big Data

Programme

– Les origines du Big Data : un monde de données numériques.

– Qu’est-ce que le Big Data ? Définitions, historique et enjeux

– Les dimensions « en V » du Big Data

– Concepts fondamentaux et caractéristiques clés du Big Data

– Différences et apports par rapport aux technologies traditionnelles

– Exemples d’application et usages des technologies B

– L’avènement de la donnée en tant que ressource stratégique

– Progrès et innovations de rupture (capacités de stockage, vitesses de
traitement)

– L’impact et les opportunités induites par le Big Data : nouveaux
leviers de performance

– BI et Big Data : concepts de Data Lake, Data Warehouse

– Création de valeur

– Les métiers de la data (Data Scientist, Data Analyst, Chief Data
officer…)

– Discussions sur les usages potentiels des solutions Big Data selon
les secteurs d’activité.

– Sources de données publiques, privées, la philosophie Open Data

– Classifier les données selon leur structure

– Vue d’ensemble des modes et architectures de stockage

– Présentation de l’écosystème Hadoop

– Principes de fonctionnement du modèle MapReduce

– Des SGBDR aux bases de données NoSQL : MongoDB, Cassandra, Neo4j…

– Considérations matérielles, les solutions Big Data dans le Cloud

-Retour historique : de l’analyse statistique au Data Mining

– Qu’est-ce que le Data Mining ? Relations avec la Business Intelligence
– Sélectionner les bons outils suivant la structure de données

– Analyse de données avec Pig et Hive, Apache Storm, Apache Spark

– Recherche et indexation des données avec ElasticSearch

– Big Data et intelligence artificielle, une convergence révolutionnaire

– Machine Learning : vue d’ensemble des technologies et algorithmes d’apprentissage automatique

– Introduction aux réseaux neuronaux (deep learning)

-Principes fondamentaux et objectifs de la visualisation des données

– Limites des outils et méthodes traditionnels (Excel, BusinessObjects, etc)

– Panorama des solutions de la visualisation des données : Tableau, Qlik, Microstrategy, Microsoft Power BI…

– Quels types de visualisation pour quels usages ?

– La visualisation interactive pour représenter les données complexes

– Retour sur les données personnelles et impact du Big Data sur la vie privée

– Gouvernance et cycle de vie de la donnée dans une architecture Big Data

– Obligations légales des organisations

– Fondamentaux et usages de la cryptographie

– Les meilleures pratiques concernant la sécurité
(pseudonymisation, anonymisation…)

Référence :  BIG002

Type de Stage : Pratique

Durée : 2 jours

Public concerné:

Direction informatique et
fonctionnelle. Responsables
informatique, chefs de projet,
architectes, développeurs.

Prérequis:

Connaissances de base des
architectures techniques.