Presto a-t-il besoin d'une ruche ?
Presto a-t-il besoin d'une ruche ?

Vidéo: Presto a-t-il besoin d'une ruche ?

Vidéo: Presto a-t-il besoin d'une ruche ?
Vidéo: Скандальная Альбина_Рассказ_Слушать 2024, Novembre
Anonim

Les formats de fichiers suivants sont pris en charge: Text, SequenceFile, RCFile, ORC et Parquet. De plus, une télécommande Ruche le métastore est obligatoire . Le mode local ou intégré n'est pas pris en charge. Presto fait n'utilise pas MapReduce et ne nécessite donc que HDFS.

De cette façon, qu'est-ce que Presto et Hive ?

Apache Ruche : Logiciel d'entrepôt de données pour la lecture, l'écriture et la gestion de grands ensembles de données. Presto est un moteur de requête SQL distribué open source permettant d'exécuter des requêtes analytiques interactives sur des sources de données de toutes tailles allant du gigaoctet au pétaoctet. Apache Ruche et Presto peuvent être classés dans la catégorie des outils « Big Data ».

De même, est-ce que presto utilise MapReduce ? Presto est un moteur d'exécution SQL parallèle open source. Contrairement à Hive, Presto ne fait pas utilisation les réduire la carte cadre de son exécution. Au lieu, Presto accède directement aux données via un moteur de requête distribué spécialisé qui est très similaire à ceux trouvés dans les SGBDR parallèles commerciaux.

En tenant compte de cela, Athena est-elle basée sur Presto ?

La technologie est basé sur le Facebook open source Presto ou le logiciel PrestoDB. Compte tenu de cette lignée, Athéna offre aux équipes un moteur de requête SQL frontal sans serveur pour un processus ETL ou ELT vers un lac de données AWS S3.

Presto est-il en mémoire ?

Presto (ou PrestoDB) est un moteur de requêtes SQL distribué open source, conçu dès le départ pour des requêtes analytiques rapides sur des données de toute taille. L'exécution des requêtes s'exécute en parallèle sur un pur Mémoire -architecture basée, avec la plupart des résultats renvoyés en quelques secondes.

Conseillé: