Webinaire CASD DATA TECH : Spark en mode cluster et mode local

 

Le prochain webinaire portera sur Spark en mode local et en mode cluster et aura lieu le 30 avril de 11h00 à 12h30.

Spark est un outil qui permet de traiter des volumes de données importants de façon performante en tirant profit de la parallèlisation.

Durant ce webinaire, seront notamment abordés les points suivants :
• La logique « spark » d’appel depuis les autres langages (API)
• Les modalités de distribution des traitements spark (workers) en fonction de la localisation des données, du mode local ou cluster
• Les types de transformations en Spark
• Des exemples d’actions Spark (show, count, collect…)
• Le principe de la « Lazy evaluation »
• La gestion des ressources par Spark

Pour vous inscrire (et recevoir le lien de connexion) : cliquez ici