Qu'est-ce que la proximité dans le data mining ?
Qu'est-ce que la proximité dans le data mining ?

Vidéo: Qu'est-ce que la proximité dans le data mining ?

Vidéo: Qu'est-ce que la proximité dans le data mining ?
Vidéo: Part 1- Introduction of Proximity Measure | Data Mining | 2024, Peut
Anonim

Proximité les mesures renvoient aux mesures de similarité et de dissemblance. La similarité et la dissemblance sont importantes car elles sont utilisées par un certain nombre de exploration de données techniques, telles que le clustering, la classification du plus proche voisin et la détection d'anomalies.

À cet égard, qu'est-ce qu'une mesure de proximité?

Mesures de proximité caractériser la similitude ou la dissemblance qui existe entre les objets, les éléments, les stimuli ou les personnes qui sous-tendent une étude empirique.

A côté de ci-dessus, comment trouvez-vous la proximité d'une matrice ? Matrice de distance

  1. La proximité entre les objets peut être mesurée sous forme de matrice de distance.
  2. Par exemple, la distance entre l'objet A = (1, 1) et B = (1,5, 1,5) est calculée comme.
  3. Un autre exemple de distance entre l'objet D = (3, 4) et F = (3, 3,5) est calculé comme.

Justement, qu'est-ce que la similitude et la dissemblance dans l'exploration de données ?

Similitude et dissemblance sont les prochains exploration de données concepts que nous allons discuter. Similarité est une mesure numérique de la ressemblance de deux Les données les objets sont, et dissemblance est une mesure numérique de la différence entre deux Les données les objets sont.

Qu'est-ce que la matrice de dissimilarité ?

Les Matrice de dissemblance est un matrice qui exprime la similarité paire à paire entre deux ensembles. C'est carré et symétrique. Les membres diagonaux sont définis comme zéro, ce qui signifie que zéro est la mesure de dissemblance entre un élément et lui-même.

Conseillé: