Comment Normaliser les Données Entre 0 et 100
Pour normaliser les valeurs d’un ensemble de données entre 0 et 100, vous pouvez utiliser la formule suivante:
zi =(xi-min(x)) /(max(x) – min(x)) * 100
où:
- zi : Lath valeur normalisée dans l’ensemble de données
- xi : Lath valeur dans l’ensemble de données
- min(x) : La valeur minimale dans l’ensemble de données
- max(x) : La valeur maximale dans l’ensemble de données
Par exemple, supposons que nous ayons l’ensemble de données suivant:
La valeur minimale dans l’ensemble de données est 12 et la valeur maximale est 68.
Pour normaliser la première valeur de 12, nous appliquerions la formule partagée précédemment:
- zi = (xi-min(x)) /(max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Pour normaliser la deuxième valeur de 19, nous utiliserions la même formule:
- zi = (xi-min(x)) /(max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
Pour normaliser la troisième valeur de 21, nous utiliserions la même formule:
- zi =(xi-min(x)) /(max(x)-min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
Nous pouvons utiliser exactement la même formule pour normaliser chaque valeur de l’ensemble de données d’origine entre 0 et 100:
Comment normaliser les données Entre n’importe quelle plage
Nous pouvons réellement utiliser cette formule pour normaliser un ensemble de données entre 0 et n’importe quel nombre:
zi =(xi–min(x)) /(max(x)–min(x)) * Q
où Q est le nombre maximum que vous souhaitez pour vos valeurs de données normalisées.
Dans l’exemple précédent, nous avons choisi Q pour être égal à 100, mais nous pourrions facilement normaliser une plage de valeurs de données entre 0 et 1 000 en choisissant Q pour être 1 000:
Pour normaliser la première valeur de 12, nous appliquerions la formule:
- zi = (xi-min(x)) /(max(x) – min(x)) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0
Pour normaliser la deuxième valeur de 19, nous utiliserions la même formule:
- zi =(xi-min(x)) /(max(x)-min(x)) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125
Pour normaliser la troisième valeur de 21, nous utiliserions la même formule:
- zi = (xi-min(x)) /(max(x) – min(x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
Nous pouvons utiliser exactement la même formule pour normaliser chaque valeur de l’ensemble de données d’origine entre 0 et 1 000:
Quand normaliser les données
Parfois, nous normalisons des variables lors de l’exécution d’un type d’analyse dans lequel nous avons plusieurs variables qui sont mesurées sur des échelles différentes et nous voulons que chacune des variables ait la même plage.
Cela empêche une variable d’être trop influente, surtout si elle est mesurée en unités différentes (c’est-à-dire si une variable est mesurée en pouces et une autre en verges).
Il convient également de noter que nous avons utilisé une méthode connue sous le nom de normalisation min-max dans ce tutoriel pour normaliser les valeurs des données.
Les deux méthodes de normalisation les plus courantes sont les suivantes:
1. Normalisation Min-Max
- Objectif: Convertit chaque valeur de données en une valeur comprise entre 0 et 100.
- Formule: Nouvelle valeur =(valeur-min) /(max-min) * 100
2. Normalisation moyenne
- Objectif : Met à l’échelle les valeurs de telle sorte que la moyenne de toutes les valeurs soit 0 et std. dev. est 1.
- Formule: Nouvelle valeur = (valeur – moyenne) / (écart type)