Quel est le moteur de traitement des données derrière Amazon Elastic MapReduce ?
Quel est le moteur de traitement des données derrière Amazon Elastic MapReduce ?

Vidéo: Quel est le moteur de traitement des données derrière Amazon Elastic MapReduce ?

Vidéo: Quel est le moteur de traitement des données derrière Amazon Elastic MapReduce ?
Vidéo: Hadoop sur Amazon EMR en démos 2024, Avril
Anonim

Amazon DME utilise Apache Hadoop comme son moteur de traitement de données . Hadoop est un framework logiciel Java open source qui prend en charge Les données -applications distribuées intensives s'exécutant sur de grands clusters de matériel de base.

De plus, qu'est-ce qu'Amazon Elastic MapReduce ?

Amazon Elastic MapReduce ( DME ) est un Services Web Amazon ( AWS ) outil de traitement et d'analyse des mégadonnées. Amazon DME traite le Big Data sur un cluster Hadoop de serveurs virtuels sur Amazon Élastique Cloud de calcul ( EC2 ) et Amazone Service de stockage simple ( S3 ).

De plus, Amazon EMR est-il entièrement géré ? C'est un entièrement géré service de lac de données qui peut dissocier le stockage de données des ressources de calcul et rend les clusters de calcul évolutifs, disponibles pour être utilisés à la demande, et inclut la possibilité pour plusieurs clusters d'accéder aux mêmes ensembles de données à la fois.

On peut également se demander comment fonctionne AWS EMR ?

En règle générale, lorsque vous traitez des données dans Amazon DME , l'entrée est constituée de données stockées sous forme de fichiers dans le système de fichiers sous-jacent de votre choix, telles que Amazone S3 ou HDFS. Ces données passent d'une étape à la suivante dans la séquence de traitement. L'étape finale écrit les données de sortie dans un emplacement spécifié, tel qu'un Amazone Seau S3.

Quelle est la différence entre ec2 et EMR ?

contrairement à DME , EC2 ne classe pas les nœuds esclaves en nœuds principaux et de tâche. Cela augmente le risque de perdre des données HDFS en cas de suppression/perte d'un nœud. EC2 utilise les bibliothèques Apache (s3a) pour accéder aux données sur s3. D'autre part, DME utilise le code propriétaire AWS pour avoir un accès plus rapide à s3.

Conseillé: