Quel type de clustering pourrait gérer le Big Data ?
Quel type de clustering pourrait gérer le Big Data ?

Vidéo: Quel type de clustering pourrait gérer le Big Data ?

Vidéo: Quel type de clustering pourrait gérer le Big Data ?
Vidéo: Comprendre le clustering (et le load balancing) en 6 minutes 2024, Décembre
Anonim

Hiérarchique regroupement ne peut pas gérer les données volumineuses bien mais K signifie regroupement pouvez. En effet, la complexité temporelle de K Means est linéaire, c'est-à-dire O(n) tandis que celle de la hiérarchie regroupement est quadratique, c'est-à-dire O(n2).

À ce sujet, qu'est-ce que le clustering dans le big data ?

Regroupement est une technique d'apprentissage automatique qui consiste à regrouper des Les données points. Étant donné un ensemble de Les données points, nous pouvons utiliser un regroupement algorithme pour classer chaque Les données point dans un groupe spécifique.

De même, qu'est-ce que le clustering et ses types ? Regroupement des méthodes sont utilisées pour identifier des groupes d'objets similaires dans un ensemble de données multivariées collectées dans des domaines tels que le marketing, le biomédical et le géospatial. Ils sont différents les types de regroupement méthodes, y compris: Méthodes de partitionnement. Hiérarchique regroupement . Basé sur un modèle regroupement.

A savoir également, quel type d'algorithme de clustering est le meilleur pour les très grands ensembles de données ?

K-Means qui est l'un des plus utilisés regroupement méthodes et K-Means basé sur MapReduce est considéré comme une solution avancée pour clustering d'ensembles de données très volumineux . Cependant, le temps d'exécution reste un obstacle en raison du nombre croissant d'itérations lorsqu'il y a une augmentation de base de données taille et nombre de groupes.

A quoi sert le clustering ?

Regroupement est une méthode d'apprentissage non supervisé et est une technique courante pour l'analyse de données statistiques utilisé dans de nombreux domaines. En Data Science, nous pouvons utiliser regroupement analyse pour obtenir des informations précieuses sur nos données en voyant dans quels groupes les points de données appartiennent lorsque nous appliquons un regroupement algorithme.

Conseillé: