Table des matières:

Que sont les valeurs aberrantes dans l'analyse des données ?
Que sont les valeurs aberrantes dans l'analyse des données ?

Vidéo: Que sont les valeurs aberrantes dans l'analyse des données ?

Vidéo: Que sont les valeurs aberrantes dans l'analyse des données ?
Vidéo: Feature Engineering: Comment Détecter les Valeurs Aberrantes (Outliers)? 2024, Novembre
Anonim

En statistique, un valeur aberrante est un Les données point qui diffère sensiblement des autres observations. Un valeur aberrante peut être dû à la variabilité de la mesure ou indiquer une erreur expérimentale; ces derniers sont parfois exclus du Les données ensemble. Un valeur aberrante peut causer de graves problèmes dans analyses statistiques.

Compte tenu de cela, comment trouvez-vous les valeurs aberrantes dans les données ?

Un point qui sort du Les données les clôtures de l'ensemble sont classées comme mineures valeur aberrante , tandis que celui qui tombe à l'extérieur des clôtures extérieures est classé parmi les principaux valeur aberrante . Pour trouver les clôtures intérieures pour votre Les données définir, d'abord, multiplier l'intervalle interquartile par 1,5. Ensuite, ajoutez le résultat à Q3 et soustrayez-le de Q1.

À côté de ci-dessus, dois-je supprimer les valeurs aberrantes de mes données ? Pour les la plupart, si vos données est affecté par ces cas extrêmes, vous pouvez bondir les contribution à un représentant historique de vos données qui exclut valeurs aberrantes . Déterminer au cas par cas ce les effet de les valeurs aberrantes était. Et à partir de là, décidez si vous voulez supprimer , modifier ou conserver la valeur aberrante valeurs.

À cet égard, comment l'analyse des données traite-t-elle les valeurs aberrantes ?

Voici quatre approches:

  1. Supprimez les enregistrements aberrants. Dans le cas de Bill Gates, ou d'une autre valeur aberrante, il est parfois préférable de supprimer complètement cet enregistrement de votre ensemble de données pour empêcher cette personne ou cet événement de fausser votre analyse.
  2. Limitez vos données aberrantes.
  3. Attribuez une nouvelle valeur.
  4. Essayez une transformation.

Quel est un exemple de valeur aberrante ?

Valeur aberrante . more Une valeur qui "se situe à l'extérieur" (est beaucoup plus petite ou plus grande que) la plupart des autres valeurs d'un ensemble de données. Pour Exemple dans les scores 25, 29, 3, 32, 85, 33, 27, 28 les deux3 et 85 sont " valeurs aberrantes ".

Conseillé: