0と100の間のデータを正規化する方法
データセット内の値を0と100の間に正規化するには、次の式を使用できます。
zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x))/(max(x)-min(x))/(max(x)-min(x))/(max(x)-min(x))/(max(x)-min(x)/(max(x)-min(x))/)) * 100
どこで:
- zi:データセットのi番目の正規化値
- xi:データセットのi番目の値
- min(x):データセットの最小値
- max(x):データセットの最大値
たとえば、次のデータセット:
データセットの最小値は12で、最大値は68です。
12の最初の値を正規化するには、以前に共有された式を適用します:
- zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
2番目の値19を正規化するには、同じ式を使用します:
- zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
21の3番目の値を正規化するには、同じ式を使用します:
- zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x))/(max(x)-min(x)))) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
このまったく同じ式を使用して、元のデータセットの各値を0と0の間に正規化できます。100:
任意の範囲のデータを正規化する方法
実際には、この式を使用して、0と任意の数の間のデータセットを正規化できます。
zi=(xi–min(x))/(max(x)–min(x))*Q
Qは、正規化されたデータ値に必要な最大数です。
前の例では、Qを100に等しくすることを選択しましたが、Qを1,000に選択することで、0から1,000の間のデータ値の範囲を簡単に正規化できます。
12の最初の値を正規化するには、次の式を適用します。:
- zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x)) * 1,000 = (12 – 12) / (68 – 12) * 100 = 0
2番目の値19を正規化するには、同じ式を使用します:
- zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x))/(max(x)-min(x)))) * 1,000 = (19 – 12) / (68 – 12) * 100 = 125
21の3番目の値を正規化するには、同じ式を使用します:
- zi=(xi–min(x))/(max(x)–min(x))/(max(x)-min(x))/(max(x)-min(x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
このまったく同じ式を使用して、元のデータセットの各値を0から1,000の間に正規化することができます:
データを正規化するとき
異なるスケールで測定される複数の変数があり、それぞれの変数が同じ範囲を持つような分析を行うときに変数を正規化することがあります。
これは、特に異なる単位で測定されている場合(つまり、ある変数がインチで測定され、別の変数がヤードで測定されている場合)、ある変数が過度に影響
また、このチュートリアルではmin-max正規化と呼ばれる方法を使用してデータ値を正規化したことにも注意してください。
2つの最も一般的な正規化方法は次のとおりです。
1. 最小-最大正規化
- 目的:各データ値を0~100の値に変換します。
- 式:新しい値=(値-最小–/(最大-最小)) * 100
2. 平均正規化
- 目的:すべての値の平均が0およびstdになるように値をスケーリングします。 デヴ は1
- : 新しい値=(値–平均)/(標準偏差)