Est-ce que le show est une action dans Spark ?
Est-ce que le show est une action dans Spark ?

Vidéo: Est-ce que le show est une action dans Spark ?

Vidéo: Est-ce que le show est une action dans Spark ?
Vidéo: Big Data: Spark Actions 2024, Avril
Anonim

2 réponses. spectacle est en effet un action , mais il est suffisamment intelligent pour savoir quand il n'a pas à tout exécuter. Si vous aviez un orderBy, cela prendrait également beaucoup de temps, mais dans ce cas, toutes vos opérations sont des opérations de carte et il n'est donc pas nécessaire de calculer l'ensemble de la table finale.

Justement, le compte est-il une action dans l'étincelle ?

compter () à compter le nombre de rangées. Comme il lance l'exécution du DAG et renvoie les données au pilote, c'est un action pour RDD. Cas 2: si vous appelez compter sur Dataframe, il lance l'exécution du DAG et renvoie les données au pilote, c'est un action pour Dataframe.

De même, qu'est-ce que l'action et la transformation dans l'étincelle ? Étincelle Opérations RDD. Deux types d'Apache Étincelle Les opérations RDD sont- Transformations et Actions . UNE Transformation est une fonction qui produit un nouveau RDD à partir des RDD existants, mais lorsque nous voulons travailler avec l'ensemble de données réel, à ce stade action est effectuée.

Corrélativement, qu'est-ce qu'une action dans Spark ?

Actions sont l'opération de RDD, cette valeur revient aux programmes du pilote spar, qui lancent un travail à exécuter sur un cluster. La sortie de la transformation est une entrée de Actions . réduire, collecter, takeSample, take, first, saveAsTextfile, saveAsSequenceFile, countByKey, foreach sont courants Actions dans Apache étincelle.

Que fait collect () dans Spark?

collecter (fun) collecter renvoie les éléments de l'ensemble de données sous forme de tableau au programme pilote. collecter est souvent utilisé dans les exemples fournis précédemment tels que Étincelle Exemples de transformation afin de montrer les valeurs du retour. Le REPL, par exemple, imprimera les valeurs du tableau sur la console.

Conseillé: