Qu'est-ce que la diffusion par étincelle ?
Qu'est-ce que la diffusion par étincelle ?

Vidéo: Qu'est-ce que la diffusion par étincelle ?

Vidéo: Qu'est-ce que la diffusion par étincelle ?
Vidéo: Tiakola - Soza (Paroles) 2024, Avril
Anonim

Diffuser variables dans Apache Étincelle est un mécanisme de partage de variables entre les exécuteurs qui sont censés être en lecture seule. Sans diffuser variables ces variables seraient envoyées à chaque exécuteur pour chaque transformation et action, ce qui peut entraîner une surcharge du réseau.

De même, les gens demandent, quand dois-je diffuser Spark ?

Diffuser Les variables sont principalement utilisées lorsque les tâches à travers plusieurs étapes nécessitent les mêmes données ou lorsque la mise en cache des données sous forme désérialisée est requise. Diffuser les variables sont créées à l'aide d'une variable v en appelant SparkContext.

De plus, que sont les accumulateurs et les variables de diffusion dans Spark ? Étincelle prend en charge deux types de partage variables : variables de diffusion , qui peut être utilisé pour mettre en cache une valeur en mémoire sur tous les nœuds, et accumulateurs , qui sont variables qui ne sont que « ajoutés », tels que les compteurs et les sommes.

Compte tenu de cela, qu'est-ce qu'un accumulateur d'étincelles ?

Accumulateurs sont des variables qui ne sont « ajoutées » que par une opération associative et peuvent donc être efficacement supportées en parallèle. Ils peuvent être utilisés pour implémenter des compteurs (comme dans MapReduce) ou des sommes. Étincelle prend en charge nativement accumulateurs de types numériques, et les programmeurs peuvent ajouter la prise en charge de nouveaux types.

Comment mettre à jour ma variable de diffusion dans Spark ?

  1. Déplacez la recherche de données de référence dans une forEachPartition ou forEachRdd afin qu'elle réside entièrement sur les travailleurs.
  2. Redémarrez le contexte Spark chaque fois que les données de référence changent, avec une nouvelle variable de diffusion.

Conseillé: