![標準正規分布の95%予言的中区間](../img/header.jpg)
Sponsored Link
前回の標準正規分布と性質では標準正規分布についてみました。もし推測したい不確実な現象が正規分布とみなせるならば、そこから推測ができるのではという考えが生まれてきます。これは一番初めの母集団と標本で統計学は標本から推測する学問という話にいよいよつながってきます。今回は標準正規分布による推測についてみていきたいと思います。
自然や社会において観測されるデータは正規分布にしたがうものがあるという話をしました。ここで推測したい不確実現象が標準正規分布だとわかっているとして、次に出てくるデータを予言したいとします。
まず次の標準正規分布のヒストグラムがあったとします。
前回解説していなかったので、一応ことわっておきますが、標準正規分布の横軸は±∞です。図をわかりやすくする関係上とても無限の幅には見えませんが、無限という膨大な可能性の中から、次に出てくるデータを予言するわけですから、当てたら地味にすごいわけです。
地味にすごい予言を当てるには、出てくる可能性が最も大きい数字を言う必要があります。ヒストグラムにおいて一番出てくる可能性の高い数字というのは、山のてっぺんとなります。山のてっぺんというのは、横軸が0の近くとなるため、0の近くを予言することで当てやすくなります。
ただ0の近くだけ予言したとしても、当たる可能性は極めて低いです。範囲が有限ではありますが、これはカジノのルーレットなどを考えてみればわかるかと思います。1つの数字にかけるよりも、かける数字が多いほど当たる確率が増えていきます。ただ全部にかけて、「はい当たりました」ではもはや予言でもなんでもなくなってしまうので、ある程度範囲を絞って予言していく必要があります。ではどれくらいの範囲にしていけばよいでしょうか?
Sponsored Link
Sponsored Link
範囲を設定するうえで思い出して欲しいのが、以下の標準正規分布の性質です。
つまり、−1〜+1を選べば約70%の可能性で予言が当たり、−2〜+2を選べば約95%の可能性で予言が当たることがわかります。
これはもはや個人によって考え方が違いますが、皆さんはなんとなく「−1〜+1の当たる可能性70%では、逆に30%外れる可能性がある」と思いませんか?そして、「−2〜+2の95%ではほぼ当たる」と勝利を確信できるのではないでしょうか?
この直感的な思いと同じく、統計学でも95%的中の予言区域をとることが主になっています。そして、さらに0.9544(約95%)ではなく0.95とするために、範囲を少し絞ります。そのため、−2〜+2ではなく、−1.96〜+1.96という範囲がよく用いられます。
つまり標準正規分布では、−1.96〜+1.96という範囲を選ぶことで95%的中させることができます。