jak znormalizować dane między 0 a 100
aby znormalizować wartości w zbiorze danych między 0 a 100, możesz użyć następującego wzoru:
zi = (xi – min(x)) / (max(X) – min(x)) * 100
gdzie:
- zi: i-ta znormalizowana wartość w zbiorze danych
- xi: i-ta wartość w zbiorze danych
- min(x): minimalna wartość w zbiorze danych
- max(X): maksymalna wartość w zbiorze danych
na przykład załóżmy, że mamy następujący zbiór danych:
minimalna wartość w zbiorze danych wynosi 12, a maksymalna 68.
aby znormalizować pierwszą wartość 12, zastosowalibyśmy wcześniej wspólną formułę:
- zi = (xi – min(x)) / (max(x) – min (x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
aby znormalizować drugą wartość 19, użyjemy tego samego wzoru:
- zi = (xi – min(x)) / (max(x) – min (x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
aby znormalizować trzecią wartość z 21, użyjemy tego samego wzoru:
- zi = (xi-min(x)) / (max(x) – min (x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
możemy użyć tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych na poziomie od 0 do 100:
jak znormalizować dane z dowolnego zakresu
możemy użyć tej formuły do normalizacji zbioru danych między 0 A dowolną liczbą:
zi = (xi – min(x)) / (max(x) – min(x)) * Q
gdzie Q jest maksymalną liczbą, którą chcesz dla znormalizowanych wartości danych.
w poprzednim przykładzie wybraliśmy Q równe 100, ale możemy łatwo znormalizować zakres wartości danych między 0 a 1000, wybierając Q równe 1000:
aby znormalizować pierwszą wartość 12, zastosowalibyśmy wzór:
- zi = (xi – min(x)) / (max(x) – min (x)) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0
aby znormalizować drugą wartość 19, użyjemy tego samego wzoru:
- zi = (xi-min(x)) / (max(x) – min (x)) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125
aby znormalizować trzecią wartość z 21, użyjemy tego samego wzoru:
- zi = (xi – min(x)) / (max(x) – min (x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
możemy użyć tego samego wzoru, aby znormalizować każdą wartość w oryginalnym zbiorze danych na poziomie od 0 do 1000:
kiedy normalizować dane
czasami normalizujemy zmienne podczas wykonywania pewnego rodzaju analizy, w której mamy wiele zmiennych, które są mierzone w różnych skalach i chcemy, aby każda ze zmiennych miała ten sam zakres.
zapobiega to nadmiernemu wpływowi jednej zmiennej, zwłaszcza jeśli jest mierzona w różnych jednostkach (tj. jeśli jedna zmienna jest mierzona w calach, a druga w jardach).
warto również zauważyć, że w tym samouczku użyliśmy metody znanej jako normalizacja min-max, aby znormalizować wartości danych.
dwie najczęstsze metody normalizacji są następujące:
1. Normalizacja Min-Max
- cel: konwertuje każdą wartość danych na wartość od 0 do 100.
- formuła: Nowa wartość = (wartość-min) / (max-min) * 100
2. Średnia normalizacja
- cel: skaluje wartości tak, że średnia wszystkich wartości wynosi 0 i std. dev. 1.
- wzór: Nowa wartość = (wartość-średnia) / (odchylenie standardowe)