Qu'est-ce que l'erreur de généralisation en apprentissage automatique ?
Qu'est-ce que l'erreur de généralisation en apprentissage automatique ?

Vidéo: Qu'est-ce que l'erreur de généralisation en apprentissage automatique ?

Vidéo: Qu'est-ce que l'erreur de généralisation en apprentissage automatique ?
Vidéo: Intelligence Artificielle [12.14] : Apprentissage automatique - généralisation 2024, Novembre
Anonim

En supervisé apprentissage candidatures dans apprentissage automatique et statistiques apprentissage théorie, erreur de généralisation (également connu sous le nom de hors échantillon Erreur ) est une mesure de la précision avec laquelle un algorithme est capable de prédire les valeurs de résultat pour des données inédites.

Par conséquent, quels sont les types d'erreurs courants en apprentissage automatique ?

Pour les problèmes de classification binaire, il existe deux principaux types d'erreurs . Taper 1 les erreurs (faux positifs) et Taper 2 les erreurs (faux négatifs). Il est souvent possible, grâce à la sélection et au réglage du modèle, d'augmenter l'un tout en diminuant l'autre, et il faut souvent choisir lequel type d'erreur est plus acceptable.

Sachez également qu'est-ce que le surapprentissage dans l'apprentissage automatique ? Surapprentissage dans le Machine Learning fait référence à un modèle qui modélise trop bien les données d'entraînement. Surapprentissage se produit lorsqu'un modèle apprend les détails et le bruit dans les données d'apprentissage dans la mesure où cela a un impact négatif sur les performances du modèle sur de nouvelles données.

Également demandé, qu'est-ce que la performance de généralisation ?

Les performances de généralisation d'un algorithme d'apprentissage fait référence à la performance sur les données hors échantillon des modèles appris par l'algorithme.

Qu'est-ce qu'une erreur de classement ?

Erreur de classification . Les erreur de classement Eje d'un programme individuel i dépend du nombre d'échantillons mal classés (faux positifs et faux négatifs) et est évalué par la formule: où f est le nombre d'échantillons mal classés et n est le nombre total d'échantillons.

Conseillé: