hur man normaliserar Data mellan 0 och 100

för att normalisera värdena i en dataset för att vara mellan 0 och 100 kan du använda följande formel:

zi = (xi-min (x)) / (max (x – – min (x)) * 100

där:

  • zi: det ith-normaliserade värdet i datauppsättningen
  • xi: det ith-värdet i datauppsättningen
  • min (x): det minsta värdet i datauppsättningen
  • max (x): det maximala värdet i datauppsättningen

Antag till exempel att vi har följande datauppsättning:

minimivärdet i datauppsättningen är 12 och maximivärdet är 68.

för att normalisera det första värdet på 12, skulle vi tillämpa formeln delad tidigare:

  • zi = (xi-min (x)) / (max (x – – min (x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

för att normalisera det andra värdet på 19 skulle vi använda samma formel:

  • zi = (xi-min (x)) / (max (x – – min (x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5

för att normalisera det tredje värdet på 21 skulle vi använda samma formel:

  • zi = (xi – min(x)) / (max (x – – min (x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07

vi kan använda exakt samma formel för att normalisera varje värde i den ursprungliga datauppsättningen för att vara mellan 0 och 100:

normalisera data mellan 0 och 100

hur man normaliserar Data mellan alla intervall

vi kan faktiskt använda denna formel för att normalisera en dataset mellan 0 och valfritt antal:

zi = (xi – min(x)) / (max(x) – min(x)) * Q

där Q är det maximala antalet du vill ha för dina normaliserade datavärden.

i föregående exempel valde vi Q för att vara lika med 100, men vi kunde enkelt normalisera ett intervall av datavärden mellan 0 och 1000 genom att välja Q för att vara 1000:

för att normalisera det första värdet på 12 skulle vi tillämpa formeln:

  • zi = (xi-min (x)) / (max (x – – min (x)) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0

för att normalisera det andra värdet på 19 skulle vi använda samma formel:

  • zi = (xi – min(x)) / (max (x – – min (x)) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125

för att normalisera det tredje värdet på 21 skulle vi använda samma formel:

  • zi = (xi-min (x)) / (max (x – – min (x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7

vi kan använda exakt samma formel för att normalisera varje värde i den ursprungliga datauppsättningen för att vara mellan 0 och 1000:

normalisera data mellan två siffror

När ska man normalisera Data

ibland normaliserar vi variabler när vi utför någon typ av analys där vi har flera variabler som mäts på olika skalor och vi vill att var och en av variablerna ska ha samma intervall.

detta förhindrar att en variabel blir alltför inflytelserik, särskilt om den mäts i olika enheter (dvs. om en variabel mäts i tum och en annan mäts i varv).

det är också värt att notera att vi använde en metod som kallas min-max normalisering i denna handledning för att normalisera datavärdena.

de två vanligaste normaliseringsmetoderna är följande:

1. Min-Max normalisering

  • mål: konverterar varje datavärde till ett värde mellan 0 och 100.
  • formel: Nytt värde = (värde-min) / (max-min) * 100

2. Genomsnittlig normalisering

  • mål: skalar värden så att medelvärdet av alla värden är 0 och std. dev. är 1.
  • formel: Nytt värde = (värde-medelvärde) / (standardavvikelse)

Leave a Reply

Din e-postadress kommer inte publiceras.