データに一定数を加えた時の平均値や標準偏差への影響

Sponsored Link

データに一定数を加えた時の平均値や標準偏差への影響

前回の標準偏差を用いて、データの特殊性を評価するでは、標準偏差からデータがどれくらいレアなのかを判断しました。今回はデータを加工した時に与える影響を見てみます。

 

 

データに一定数を加えた場合の標準偏差

CBTや国家試験の模試などで、問題が不適切な場合は没問となり、全員に加点などで対応になるかと思います。私も学生の時に、「没問やったぜー!!ラッキー!!」と喜んでいたような気がします(笑)では没問などが発生した場合、データにどのような影響を与えるか見てみましょう。今回はシンプルに考えられるように、以下のような例でみてみます。A〜Eでテストを受けた結果以下のような点数でした。

 

  • A(前);1
  • B(前);2
  • C(前);3
  • D(前);4
  • E(前);5

 

この時に没問が1問あり、全員に1点加点となり、加点前を(前)とし、加点後を(後)と表記します。加点後のA〜Eは以下のようなデータになります。

 

  • A(後);2
  • B(後);3
  • C(後);4
  • D(後);5
  • E(後);6

 

では加点前と加点後の標準偏差を出してみます。標準偏差を出すにあたって、平均、偏差、分散なども出す必要があるのでついでに比較していきます。

 

Sponsored Link

Sponsored Link


 

平均

加工前の平均値は3です。加工後の平均値は4です。つまり加工前に対して加工後は1大きくなっています。これは全てのデータが1増えているのでご理解いただけると思います。

 

偏差

次に偏差です。先ほどの求めた平均をもとに偏差を出すと以下のようになります。

 

  • A(前);−2
  • B(前);−1
  • C(前);0
  • D(前);1
  • E(前);2

 

  • A(後);−2
  • B(後);−1
  • C(後);0
  • D(後);1
  • E(後);2

 

偏差は加工前も加工後も変化がないことがわかります。

 

分散

次に分散です。先ほど求めた偏差をもとに分散を出すと、加工前の分散は2、加工後の分散は2となります。つまり加工後も分散は同じとなります。これは偏差が一緒だから当たり前ですね。

 

標準偏差

最後に標準偏差です。先ほど求めた分散をもとに標準偏差を出すと、加工前の標準偏差は1.4、加工後の標準偏差は1.4となります。分散が一緒なので標準偏差も加工後で同じとなります。

 

この例からわかるように、データに一定数を加えて加工すると、平均値のみ一定数加えたものとなり、標準偏差には影響を与えません。冷静に考えると、ヒストグラムが横にスライドするだけと考えれば納得いただけると思います。

 

まとめ

  • データに一定数を加えて加工すると平均値のみ変化して標準偏差には影響を与えない。

就職や転職でお悩みの方はコチラ!私はここで年収120万円上がりました

Sponsored Link

データに一定数を加えた時の平均値や標準偏差への影響 関連ページ

母集団と標本
統計学とは、簡単に言うと標本の情報から母集団の状況を推測する学問です。母集団とは本来調査するべき全員を指し、その一部を標本ということができます。
数量データとカテゴリーデータ
統計学では、目盛が等間隔で測れるデータを数量データと言います。目盛が等間隔ではなく測れないものをカテゴリーデータと言います。
カテゴリーデータと単純集計表
カテゴリーデータをまとめたものは単純集計表と呼ばれることがあります。単純集計表の作り方は、カテゴリーデータの各項目を数えて、割合を出すことで作られます。
度数分布表の作り方、基礎編
データから度数分布表の作り方は、最大値と最小値を把握する、階級を決める、階級値を決める、度数を数える、相対度数を出すというように行います。
ヒストグラムの作り方、基礎編
ヒストグラムとはいわゆる棒グラフのことで、横軸は階級値、縦軸は度数(相対度数)などにより描かれます。度数分布表やヒストグラムを作ることで、より直感的にデータの特徴を感じることができます
度数分布表とヒストグラム、例題編
今まで見てきた度数分布表とヒストグラムの作り方をもとに、例題を交えてさらに理解できるようにします。度数分布表とヒストグラムを慣れるまで繰り返しましょう。
平均値と中央値の違い
平均値とはデータの合計値を全データで割ったもので、中央値はデータを小さい順から並べたときに真ん中にくるものです。そのため平均値と中央値は違います。
分散とは?
平均値のみではデータの散らばりの判断がつかないので、分散を知る必要があります。分散は偏差の二乗の合計値を全データで割って求めることができます。
標準偏差、基礎編
分散の欠点を解消するために√をとったものが標準偏差であり統計学ではかなり重要です。標準偏差は0であればデータが全く散らばっていなく、大きくなるほど散らばっていることを示しています。
標準偏差、例題編
標準偏差の求め方は、平均値を出す、偏差を出す、分散を出す、標準偏差を出すという手順で出すことができます。薬学部において標準偏差を出すことができればかなりの進歩です。
統計学で偏差値を考える
CBTや国家試験の模試を行うと、偏差値が出てきます。統計学の平均値や標準偏差の知識を用いることで、テストの偏差値や1点の重みがわかります。
基準値と偏差値
偏差値は基準値×10+50で出すことができます。偏差値は基準値をもとにして出されるので、満点の点数が違うものや、単位が違うものも比較できます。
標準偏差を用いて、データの特殊性を評価する
標準偏差1個以内にあるものは全体の70%を占め、月並みなデータですが、2個以上離れているデータは正規分布する場合前回の5%しか存在せず、かなり特殊なデータと言える。

 
HOME プロフィール お問い合わせ