Sponsored Link
データに一定数をかけた時の平均値や標準偏差への影響
前回のデータに一定数を加えた時の平均値や標準偏差への影響では、データに一定数を加えた場合平均値のみに影響を与えることがわかりました。今回はデータに一定数をかけた時の平均値や標準偏差への影響を見ていきましょう。
データに一定数をかけた時の標準偏差
前回は没問を例にデータに一定数を「加えた」場合でしたが、今回は定期試験などで気まぐれな先生が「よーし没問作ってしまった代わりに、全員得点を二倍にしちゃう」といった場合どのような影響がでるかを見てみましょう。前回同様にA〜Eでテストを受けた結果以下のような点数でした。
- A(前);1
- B(前);2
- C(前);3
- D(前);4
- E(前);5
前回同様に加点前を(前)とし、加点で二倍になった後を(後)と表記します。では加点後を見てみると
- A(後);2
- B(後);4
- C(後);6
- D(後);8
- E(後);10
これに対して、今回も標準偏差を出してみます。そして平均、偏差、分散なども出す必要があるのでついでに比較していきます。
Sponsored Link
Sponsored Link
平均
加工前の平均値は3、加工後の平均値は6となります。得点が二倍になっているので、平均値も一緒に二倍になります。つまり、データに一定数をかけた場合は平均値もそのかけた数だけ増えます。
偏差
次に偏差です。先ほどの求めた平均をもとに偏差を出すと以下のようになります。
- A(前);−2
- B(前);−1
- C(前);0
- D(前);1
- E(前);2
- A(後);−4
- B(後);−2
- C(後);0
- D(後);2
- E(後);4
前回の「加えた」場合では前後で変化がありませんでしたが、「かけた」場合の偏差は加工前に対して、加工後は二倍となっています。
分散
次に分散です。先ほど求めた偏差をもとに分散を出すと、加工前の分散は2、加工後の分散は8となります。
前回の「加えた」場合では前後で変化がありませんでしたが、「かけた」場合の偏差は加工前に対して、加工後は4倍となっています。ほかのデータでやってもらえればわかりますが、データに一定数をかけて加工した場合、分散はかけた数の二乗倍となります。
標準偏差
最後に標準偏差です。先ほど求めた分散をもとに標準偏差を出すと、加工前の標準偏差は1.4、加工後の標準偏差は2.8となります。
前回の「加えた」場合では前後で変化がありませんでしたが、「かけた」場合の偏差は加工前に対して、加工後は2倍となっています。標準偏差も他のデータでやってもらえればわかりますが、データに一定数をかけて加工した場合、標準偏差はかけた数だけ増えます。
以上のことからわかるように、今回の気まぐれな先生が没問で点数二倍にすると一見みんな平等に得点が増えていそうな気がして喜んでしまいそうですが、平均値のみならず標準偏差にも影響を与えてしまうため、やってはならないことがわかります。万が一やっている先生がいたならば、統計学の知識をもってしっかりとツッコんであげてください(笑)
まとめ
- データに一定数をかけた場合、平均値も標準偏差もかけた数だけ増える
データに一定数をかけた時の平均値や標準偏差への影響 関連ページ
- 母集団と標本
- 統計学とは、簡単に言うと標本の情報から母集団の状況を推測する学問です。母集団とは本来調査するべき全員を指し、その一部を標本ということができます。
- 数量データとカテゴリーデータ
- 統計学では、目盛が等間隔で測れるデータを数量データと言います。目盛が等間隔ではなく測れないものをカテゴリーデータと言います。
- カテゴリーデータと単純集計表
- カテゴリーデータをまとめたものは単純集計表と呼ばれることがあります。単純集計表の作り方は、カテゴリーデータの各項目を数えて、割合を出すことで作られます。
- 度数分布表の作り方、基礎編
- データから度数分布表の作り方は、最大値と最小値を把握する、階級を決める、階級値を決める、度数を数える、相対度数を出すというように行います。
- ヒストグラムの作り方、基礎編
- ヒストグラムとはいわゆる棒グラフのことで、横軸は階級値、縦軸は度数(相対度数)などにより描かれます。度数分布表やヒストグラムを作ることで、より直感的にデータの特徴を感じることができます
- 度数分布表とヒストグラム、例題編
- 今まで見てきた度数分布表とヒストグラムの作り方をもとに、例題を交えてさらに理解できるようにします。度数分布表とヒストグラムを慣れるまで繰り返しましょう。
- 平均値と中央値の違い
- 平均値とはデータの合計値を全データで割ったもので、中央値はデータを小さい順から並べたときに真ん中にくるものです。そのため平均値と中央値は違います。
- 分散とは?
- 平均値のみではデータの散らばりの判断がつかないので、分散を知る必要があります。分散は偏差の二乗の合計値を全データで割って求めることができます。
- 標準偏差、基礎編
- 分散の欠点を解消するために√をとったものが標準偏差であり統計学ではかなり重要です。標準偏差は0であればデータが全く散らばっていなく、大きくなるほど散らばっていることを示しています。
- 標準偏差、例題編
- 標準偏差の求め方は、平均値を出す、偏差を出す、分散を出す、標準偏差を出すという手順で出すことができます。薬学部において標準偏差を出すことができればかなりの進歩です。
- 統計学で偏差値を考える
- CBTや国家試験の模試を行うと、偏差値が出てきます。統計学の平均値や標準偏差の知識を用いることで、テストの偏差値や1点の重みがわかります。
- 基準値と偏差値
- 偏差値は基準値×10+50で出すことができます。偏差値は基準値をもとにして出されるので、満点の点数が違うものや、単位が違うものも比較できます。
- 標準偏差を用いて、データの特殊性を評価する
- 標準偏差1個以内にあるものは全体の70%を占め、月並みなデータですが、2個以上離れているデータは正規分布する場合前回の5%しか存在せず、かなり特殊なデータと言える。
- データに一定数を加えた時の平均値や標準偏差への影響
- データに一定数を加えて加工すると平均値のみ変化して標準偏差には影響を与えません。これはヒストグラムがただ横にスライドするだけと考えるとわかりやすいでしょう。
- 正規分布の式とグラフ
- ヒストグラムの階級を限りなく狭めていくと曲線になっていき、その曲線の式を確率密度関数といいます。正規分布は確率密度関数の1つで左右対称の山のようなグラフとなります。