0 에서 100 사이의 데이터를 정규화하는 방법
데이터 집합의 값을 0 에서 100 사이로 정규화하려면 다음 공식을 사용할 수 있습니다.)) * 100
어디:
- 데이터 집합의 최대값
예를 들어 다음과 같은 데이터 집합이 있다고 가정합니다:
데이터 집합의 최소값은 12 이고 최대값은 68 입니다.
첫 번째 값 12 를 정규화하려면 앞에서 공유한 수식을 적용합니다:
- 최소값은 최소값입니다.)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
두 번째 값인 19 를 정규화하려면 동일한 공식을 사용합니다:
- 최소값은 최소값입니다.)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
21 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다:
- 닫음=(사이-최소(엑스))/(최대(엑스)-최소(엑스))) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
이 동일한 수식을 사용하여 원래 데이터 세트의 각 값을 0 과 0 사이로 정규화 할 수 있습니다 100:
어떤 범위 사이의 데이터를 정규화하는 방법
우리는 실제로이 수식을 사용하여 0 과 임의의 숫자 사이의 데이터 세트를 정규화 할 수 있습니다:
닫음=(사이–최소(엑스))/(최대(엑스)–최소(엑스))*큐
여기서 큐는 정규화 된 데이터 값에 대해 원하는 최대 수입니다.
이전 예제에서는 큐를 100 으로 선택했지만 큐를 1,000 으로 선택하여 0 에서 1,000 사이의 데이터 값 범위를 쉽게 정규화할 수 있습니다.
:
- 최소값은 최소값입니다.)) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0
두 번째 값인 19 를 정규화하려면 동일한 공식을 사용합니다:
- 닫음=(사이-최소(엑스))/(최대(엑스)-최소(엑스))) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125
21 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다:
- 최소값은 최소값입니다.)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
이 동일한 공식을 사용하여 원래 데이터 세트의 각 값을 0 에서 1,000 사이로 정규화 할 수 있습니다:
데이터 정규화시기
때때로 우리는 서로 다른 척도로 측정되는 여러 변수가 있고 각 변수가 동일한 범위를 갖기를 원하는 분석 유형을 수행 할 때 변수를 정규화합니다.
이것은 하나의 변수가 특히 다른 단위로 측정되는 경우(즉,하나의 변수가 인치로 측정되고 다른 변수가 야드로 측정되는 경우)지나치게 영향을 미치지 않도록합니다.
데이터 값을 정규화하기 위해 이 자습서에서 최소-최대 정규화라는 방법을 사용했다는 점도 주목할 가치가 있습니다.
가장 일반적인 두 가지 정규화 방법은
1 입니다. 최소-최대 정규화
- 목표:각 데이터 값을 0 에서 100 사이의 값으로 변환합니다.
- 수식:새 값=(값-분)/(최대-분) * 100
2. 평균 정규화
- 목표:모든 값의 평균이 0 이고 표준이되도록 값을 조정합니다. 데브. 이다 1.
- 공식: 새 값=(값-평균)/(표준 편차)