– Terminologie : NameNode, DataNode, ResourceManager
– Rôle et interactions des différents composants
– Présentation des outils d’infrastructure (ambari, avro, zookeeper),
de gestion des données (pig, oozie, falcon, pentaho, sqoop, flume),
d’interfaçage avec les applications GIS et de restitution et requêtage :
Webhdfs, Hive, Hawq, Impala, Drill, Stinger, Tajo, Mahout, Lucene,
ElasticSearch, Kibana
– Les architectures connexes : Spark, Cassandra