Qu'est-ce qu'un lac de données dans Hadoop ?
Qu'est-ce qu'un lac de données dans Hadoop ?

Vidéo: Qu'est-ce qu'un lac de données dans Hadoop ?

Vidéo: Qu'est-ce qu'un lac de données dans Hadoop ?
Vidéo: Data Lake, c'est quoi ?? 2024, Novembre
Anonim

UNE Lac de données Hadoop est un Les données plate-forme de gestion comprenant un ou plusieurs Hadoop groupes. Il est principalement utilisé pour traiter et stocker des données non relationnelles Les données , tels que les fichiers journaux, les enregistrements de parcours de navigation Internet, les capteurs Les données , objets JSON, images et publications sur les réseaux sociaux.

À cet égard, quelle est la différence entre un entrepôt de données et un lac de données ?

Lacs de données et Les données les entrepôts sont à la fois largement utilisés pour stocker de gros Les données , mais ce ne sont pas des termes interchangeables. UNE lac de données est un vaste bassin de matières premières Les données , dont la finalité n'est pas encore définie. UNE entrepôt de données est un référentiel pour structuré, filtré Les données qui a déjà été traité dans un but précis.

De plus, qu'est-ce qu'une architecture de lac de données ? UNE Lac de données est un référentiel de stockage qui peut stocker une grande quantité de documents structurés, semi-structurés et non structurés Les données . Contrairement à une maison Dataware hiérarchique où Les données est stocké dans Fichiers et Dossier, Lac de données a un appartement architecture.

À cet égard, qu'entend-on par lac de données ?

UNE lac de données est un référentiel de stockage qui contient une grande quantité de matières premières Les données dans son format natif jusqu'à ce qu'il soit nécessaire. Alors qu'une hiérarchie Les données magasins-entrepôts Les données dans des fichiers ou des dossiers, un lac de données utilise une architecture plate pour stocker Les données . Le terme lac de données est souvent associé au stockage d'objets orienté Hadoop.

Elasticsearch est-il un lac de données ?

UNE lac de données est simplement un endroit pour garer votre Les données jusqu'à ce que vous en ayez besoin, et cela peut englober HDFS (le plus courant), le stockage d'objets, les boîtiers NAS ou toute autre chose. Fondamentalement, Recherche élastique est un outil d'indexation Les données , pas pour le stockage de Les données lui-même.

Conseillé: