sådan normaliseres Data mellem 0 og 100
for at normalisere værdierne i et datasæt til at være mellem 0 og 100 kan du bruge følgende formel:
)) * 100
hvor:
- værdi i datasættet
- hi: værdien i datasættet
- min(h): minimumsværdien i datasættet
- maks(h): den maksimale værdi i datasættet
Antag f. eks., at vi har følgende datasæt:
minimumsværdien i datasættet er 12, og maksimumsværdien er 68.
for at normalisere den første værdi af 12, ville vi anvende den formel, der blev delt tidligere:
- i = (i-min(i)) / (maks (i) – min (i))) * 100 = (12 – 12) / (68 – 12) * 100 = 0
for at normalisere den anden værdi på 19 bruger vi den samme formel:
- i = (i-min(i)) / (maks (i) – min (i))) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
for at normalisere den tredje værdi af 21 ville vi bruge den samme formel:
- å = (å – min(å)) / (maks(å) – min(å))) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
vi kan bruge denne nøjagtige samme formel til at normalisere hver værdi i det originale datasæt til at være mellem 0 og 100:
sådan normaliseres Data mellem et hvilket som helst område
vi kan faktisk bruge denne formel til at normalisere et datasæt mellem 0 og et hvilket som helst tal:
ti = (ti – min(h)) / (Maks(h) – min(H)) * K
hvor K er det maksimale antal, du ønsker for dine normaliserede dataværdier.
i det foregående eksempel valgte vi at være lig med 100, men vi kunne let normalisere en række dataværdier mellem 0 og 1.000 ved at vælge at være 1.000:
for at normalisere den første værdi på 12 anvender vi formlen:
- i = (i-min(i)) / (maks (i) – min (i))) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0
for at normalisere den anden værdi på 19 bruger vi den samme formel:
- å = (å – min(å)) / (maks(å) – min(å))) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125
for at normalisere den tredje værdi af 21 ville vi bruge den samme formel:
- i = (i-min(i)) / (maks (i) – min (i))) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
vi kan bruge denne nøjagtige samme formel til at normalisere hver værdi i det originale datasæt til at være mellem 0 og 1.000:
Hvornår skal vi normalisere Data
lejlighedsvis normaliserer vi variabler, når vi udfører en type analyse, hvor vi har flere variabler, der måles på forskellige skalaer, og vi ønsker, at hver af variablerne skal have det samme interval.
dette forhindrer en variabel i at være alt for indflydelsesrig, især hvis den måles i forskellige enheder (dvs.hvis en variabel måles i tommer og en anden måles i værfter).
det er også værd at bemærke, at vi brugte en metode kendt som min-maks normalisering i denne vejledning til at normalisere dataværdierne.
de to mest almindelige normaliseringsmetoder er som følger:
1. Min-Maks normalisering
- formål: konverterer hver dataværdi til en værdi mellem 0 og 100.
- formel: ny værdi = (værdi – min) / (maks-min) * 100
2. Gennemsnitlig normalisering
- mål: skalerer værdier således, at gennemsnittet af alle værdier er 0 og std. dev. er 1.
- formel: Ny værdi = (værdi-gennemsnit) / (standardafvigelse)