Sponsored Link
前回の標本分散の性質では、標本分散は必ずプラスになるという話をしました。今回はそれに関連してカイ二乗分布のヒストグラムについてみていきたいと思います。
母集団が標準正規分布しているものからデータをとり、そのデータを二乗して足した統計量を考えます。いまいちイメージがわかないと思うので、例を見てみます。
母集団が標準正規分布しているものから、4個データをとったとします。そしてそれぞれの値が+1、+3、−2、−4だったとします。この時の統計量は
統計量=(+1)^2+(+3)^2+(−2)^2+(−4)^2=30となります。
今回は30となりましたが、それぞれの標本は観測するたびに変化します。この統計量の分布をヒストグラムにすると以下のような形になります。
この分布を自由度4のカイ二乗分布と言います。自由度とはざっくりと言ってしまうと、観測するデータの数です。今回は4個のデータなので、自由度4のカイ二乗分布となります。つまり、標本が2であれば自由度2のカイ二乗分布、標本が10であれば自由度10のカイ二乗分布と標本数nに応じて、自由度nのカイ二乗分布と呼ばれます。自由度がよくわからない方は直線のグラフy=ax+bにおける傾きaみたいなものと考えてもらえばよいです。
そして自由度に応じてヒストグラムも上の図のように変化していきます。ではカイ二乗分布のヒストグラムはどのような性質を持つのでしょうか?
Sponsored Link
Sponsored Link
前回標本分散は必ずプラスになるという話をしました。先ほどの計算式からも明らかではありますが、標本分散はカイ二乗分布になるので、カイ二乗分布も必ずプラスとなります。その他にも次の2つの性質を持ちます。
まず1つ目が0の近くのデータの相対度数が大きくなるということです。
なぜそうなるのか?標準正規分布のヒストグラムを思い出してください。0を中心に左右に山のようなグラフが広がっています。つまり標準正規分布は0の近くの相対度数が大きくなります。カイ二乗分布は標準正規分布している母集団からの標本を集めたものですから、同じように0の近くのデータの相対度数が大きくなりジェットコースターのような形となります。
そして2つ目が自由度が大きくなるにつれて、山の頂点が低くなりながら右側へとシフトしていきます。
これは自由度が大きくなるほど0から離れたデータが出てくる可能性が高まっていることを示しているため、ジェットコースターは緩やかな形となるのです。