Objectifs

 -Comprendre les spécificités d’une base NoSQL par rapport à un SGBDR
-Présenter les différentes architectures, les modèles de données et
les implémentations techniques
-Analyser les principales solutions du monde NoSQL pour chaque modèle de données
-Apprendre à modéliser les données dans une base NoSQL
-Manipuler des bases NoSQL avec HBase
-Développer un modèle d’indexation avec ElasticSearch
-Apprendre à installer MongoDB et utiliser les outils du développeur

Programme

– Rappels synthétiques sur la philosophie des SGBDR : leurs forces et leurs limites.

– Exemples de nouvelles sources de données (logs, IoT, sites Web,…)

– Évolutions technologiques et avènement du NoSQL

– Les grands acteurs à l’origine du mouvement NoSQL et du big data analytique.

– Le NoSQL, le big data et les architectures cloud : principes d’architecture communs et divergents.

– Les bases de données clé/valeur

– Les bases de données orientées document

– Exemples de traitements sur des formats JSON ou XML

– Les bases orientées colonne distribuées pour le Big Data
opérationnel : Hadoop, HBase, Cassandra…

– Les bases de données orientées graphe (Facebook, Twitter, etc.)

– L’écosystème Hadoop (différences avec les bases de données
relationnelles, liens avec le NoSQL)
Travaux pratiques
Manipulation des données dans un contexte Big Data avec l’outil
HBase de Hadoop.

Liens entre Elasticsearch et les bases NoSQL

– Intégration des données dans Elasticsearch

– Configuration d‘index

– Analyse et extraction de texte

– Différents modes de recherche (structurée, full-texte, de
proximité, etc.)
Travaux pratiques
Création d’index et l’utilisation de l’API de recherche

– Présentation de MongoDB, son positionnement, ses
avantages

– Exemples d’utilisation de MongoDB

– Installation de MongoDB

– Création de documents et manipulations (shell)

– Importation de données des SGBDR au format JSON

– Réplication et Partitionnement des données

– Fonctionnement du moteur de stockage des données

– Administration des données
Travaux pratiques
Modélisation d’un cas pratique et manipulation de données via
le shell. Mise en œuvre de la réplication du partitionnement de
données.

Référence :  BIG001

Type de Stage : Pratique

Durée : 3 jours

Public concerné:

Direction informatique et
fonctionnelle. Responsables
informatique, chefs de projet,
architectes, développeurs.

Prérequis:

 – Bonnes connaissances en
bases de données

– Connaissances de base en
gestion des systèmes
d’information.