データに一定数を加えた時の平均値や標準偏差への影響

前回の標準偏差を用いて、データの特殊性を評価するでは、標準偏差からデータがどれくらいレアなのかを判断しました。今回はデータを加工した時に与える影響を見てみます。

データに一定数を加えた場合の標準偏差

CBTや国家試験の模試などで、問題が不適切な場合は没問となり、全員に加点などで対応になるかと思います。私も学生の時に、「没問やったぜー！！ラッキー！！」と喜んでいたような気がします(笑)では没問などが発生した場合、データにどのような影響を与えるか見てみましょう。今回はシンプルに考えられるように、以下のような例でみてみます。A～Eでテストを受けた結果以下のような点数でした。

A(前)；1
B(前)；2
C(前)；3
D(前)；4
E(前)；5

この時に没問が1問あり、全員に1点加点となり、加点前を(前)とし、加点後を(後)と表記します。加点後のA～Eは以下のようなデータになります。

A(後)；2
B(後)；3
C(後)；4
D(後)；5
E(後)；6

では加点前と加点後の標準偏差を出してみます。標準偏差を出すにあたって、平均、偏差、分散なども出す必要があるのでついでに比較していきます。

平均

加工前の平均値は3です。加工後の平均値は4です。つまり加工前に対して加工後は1大きくなっています。これは全てのデータが1増えているのでご理解いただけると思います。

偏差

次に偏差です。先ほどの求めた平均をもとに偏差を出すと以下のようになります。

A(前)；－2
B(前)；－1
C(前)；0
D(前)；1
E(前)；2

A(後)；－2
B(後)；－1
C(後)；0
D(後)；1
E(後)；2

偏差は加工前も加工後も変化がないことがわかります。

分散

次に分散です。先ほど求めた偏差をもとに分散を出すと、加工前の分散は2、加工後の分散は2となります。つまり加工後も分散は同じとなります。これは偏差が一緒だから当たり前ですね。

標準偏差

最後に標準偏差です。先ほど求めた分散をもとに標準偏差を出すと、加工前の標準偏差は1.4、加工後の標準偏差は1.4となります。分散が一緒なので標準偏差も加工後で同じとなります。

この例からわかるように、データに一定数を加えて加工すると、平均値のみ一定数加えたものとなり、標準偏差には影響を与えません。冷静に考えると、ヒストグラムが横にスライドするだけと考えれば納得いただけると思います。

まとめ

データに一定数を加えて加工すると平均値のみ変化して標準偏差には影響を与えない。

就職や転職でお悩みの方はコチラ！私はここで年収120万円上がりました

データに一定数を加えた時の平均値や標準偏差への影響