So normalisieren Sie Daten zwischen 0 und 100
Um die Werte in einem Dataset auf 0 und 100 zu normalisieren, können Sie die folgende Formel verwenden:
zi = (xi – min(x)) / (max–x) – min(x)) * 100
wo:
- zi: Der i-te normalisierte Wert im Datensatz
- xi: Der i-te Wert im Datensatz
- min(x): Der Minimalwert im Datensatz
- max(x): Der Maximalwert im Datensatz
Angenommen, wir haben beispielsweise den folgenden Datensatz:
Der Mindestwert im Datensatz ist 12 und der Maximalwert ist 68.
Um den ersten Wert von 12 zu normalisieren, würden wir die zuvor geteilte Formel anwenden:
- zi = (xi – min (x)) / (max (x) – min (x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Um den zweiten Wert von 19 zu normalisieren, würden wir dieselbe Formel verwenden:
- zi = (xi – min (x)) / (max (x) – min (x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
Um den dritten Wert von 21 zu normalisieren, würden wir dieselbe Formel verwenden:
- zi = (xi – min (x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
Wir können genau dieselbe Formel verwenden, um jeden Wert im ursprünglichen Datensatz auf einen Wert zwischen 0 und 100:
So normalisieren Sie Daten zwischen einem beliebigen Bereich
Wir können diese Formel tatsächlich verwenden, um einen Datensatz zwischen 0 und einer beliebigen Zahl zu normalisieren:
zi = (xi – min(x)) / (max(x) – min(x)) * Q
wobei Q die maximale Anzahl ist, die Sie für Ihre normalisierten Datenwerte wünschen.
Im vorherigen Beispiel haben wir Q als 100 gewählt, aber wir könnten einen Bereich von Datenwerten zwischen 0 und 1.000 leicht normalisieren, indem wir Q als 1.000 wählen:
Um den ersten Wert von 12 zu normalisieren, würden wir die Formel anwenden:
- zi = (xi – min (x)) / (max (x) – min (x)) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0
Um den zweiten Wert von 19 zu normalisieren, würden wir dieselbe Formel verwenden:
- zi = (xi – min (x)) / (max(x) – min(x)) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125
Um den dritten Wert von 21 zu normalisieren, würden wir dieselbe Formel verwenden:
- zi = (xi – min (x)) / (max (x) – min (x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
Wir können genau dieselbe Formel verwenden, um jeden Wert im ursprünglichen Datensatz auf 0 bis 1.000 zu normalisieren:
Normalisieren von Daten
Gelegentlich normalisieren wir Variablen, wenn wir eine Art von Analyse durchführen, bei der wir mehrere Variablen haben, die auf verschiedenen Skalen gemessen werden, und wir möchten, dass jede der Variablen den gleichen Bereich hat.
Dies verhindert, dass eine Variable übermäßig einflussreich ist, insbesondere wenn sie in verschiedenen Einheiten gemessen wird (dh wenn eine Variable in Zoll und eine andere in Yards gemessen wird).
Es ist auch erwähnenswert, dass wir in diesem Lernprogramm eine Methode namens Min-Max-Normalisierung verwendet haben, um die Datenwerte zu normalisieren.
Die beiden gebräuchlichsten Normalisierungsmethoden lauten wie folgt:
1. Min-Max-Normalisierung
- Ziel: Konvertiert jeden Datenwert in einen Wert zwischen 0 und 100.
- Formel: Neuer Wert = (Wert – min) / (max – min) * 100
2. Mittelwertnormalisierung
- Ziel: Skaliert Werte so, dass der Mittelwert aller Werte 0 und std ist. dev. ist 1.
- Formel: Neuer Wert = (Wert – Mittelwert) / (Standardabweichung)