Qu'est-ce qu'AWS MapReduce ?
Qu'est-ce qu'AWS MapReduce ?

Vidéo: Qu'est-ce qu'AWS MapReduce ?

Vidéo: Qu'est-ce qu'AWS MapReduce ?
Vidéo: Что такое Amazon EMR и как его использовать для обработки данных? 2024, Novembre
Anonim

Amazon Élastique CarteRéduire (EMR) est un Amazon Web Services ( AWS ) outil de traitement et d'analyse des mégadonnées. Amazon EMR traite le Big Data sur un cluster Hadoop de serveurs virtuels sur Amazon Elastic Compute Cloud (EC2) et Amazon Simple Storage Service (S3).

De cette manière, comment fonctionne AWS EMR ?

Le service démarre un nombre d'instances Amazon EC2 spécifié par le client, composé d'un maître et de plusieurs autres nœuds. Amazone DME exécute le logiciel Hadoop sur ces instances. Le nœud maître divise les données d'entrée en blocs et distribue le traitement des blocs aux autres nœuds.

À côté de ci-dessus, quelle est la différence entre ec2 et EMR ? contrairement à DME , EC2 ne classe pas les nœuds esclaves en nœuds principaux et de tâche. Cela augmente le risque de perdre des données HDFS en cas de suppression/perte d'un nœud. EC2 utilise les bibliothèques Apache (s3a) pour accéder aux données sur s3. D'autre part, DME utilise le code propriétaire AWS pour avoir un accès plus rapide à s3.

De plus, AWS EMR est-il entièrement géré ?

Amazone Elastic MapReduce ( DME ) est un entièrement géré Plateforme Hadoop et Spark de Amazone Service Web ( AWS ). Avec DME , AWS les clients peuvent rapidement créer des clusters Hadoop multi-nœuds pour traiter les charges de travail de Big Data.

AWS utilise-t-il Hadoop ?

Amazone Services Web les usages l'open source Apache Hadoop technologie informatique distribuée pour faciliter l'accès à de grandes quantités de puissance de calcul pour exécuter des tâches gourmandes en données. Hadoop , la version open source de MapReduce de Google, est déjà utilisée par des sociétés telles que Yahoo et Facebook.

Conseillé: