![正規分布している母集団からの標本平均における95%予言的中区間](../img/header.jpg)
Sponsored Link
前回の標本平均とはでは、nが大きいほど標本平均は母平均に近い数値をとる可能性が高くなることをお話ししました。今回はさらに深掘りして正規母集団からの標本平均の95%予言的中区間についてみていきたいと思います。
前回の四次元ポケットからのくじ引きでは、母集団ではどの数値の相対度数も同じでした。しかし、2個のデータから作る標本平均のヒストグラムは山のようになっていて、母集団と同じ分布ではなくなっていました。このように標本平均のヒストグラムの形が変わっていくので95%予言的中区間などで的中させることはなかなか簡単ではありません。
しかし、このような難しい予想も問題なく行えるのが正規分布です。ここでは詳細は割愛しますが、母集団が正規分布している場合は、そこから標本平均を作った場合も正規分布します。そして、正規分布の母集団に対して標本平均を作ると、山の形はよりそそり立つような形をなります。つまり、平均値の近くのデータがより高い確率で見られて平均値から遠いデータは見られなくなります。
以上のことを定義的に言うと、標本平均の分布は母平均のままですが、標準偏差は母標準偏差に比べて1/√nに凝縮されます。
Sponsored Link
Sponsored Link
正規分布している95%予言的中区間はμ−1.96σ〜μ+1.96σでした。このことを利用して、さらに先ほどの話を応用すると正規分布している母集団からの標本平均における95%予言的中区間は次のようになります。
標準偏差が1/√nに凝縮されるだけの話です。この95%予言的中区間の式からもわかるように、観測データが多いほどより精度の高い予言ができることがわかります。例えば、母集団が正規分布していて母平均が100、母標準偏差が20だとわかっている場合、そこから1個だけデータを観測した場合は95%予言的中区間は以下のようになります。
100−1.96×20/1〜100+1.96×20/1=60.8〜139.2
では、観測データが4個の場合の95%予言的中区間はどうなるでしょうか?
100−1.96×20/4〜100+1.96×20/4=80.4〜119.6
1個の時よりも4個の時の方が、95%予言的中区間が狭まったのがわかるかと思います。このようにして観測データが増えるほどよりピンポイントでの予想が可能となります。