Sponsored Link
前回の標準偏差を用いて、データの特殊性を評価するで、チラッと正規分布という話をしました。その時は左右対称の山のようなグラフとざっくり説明しましたが、今回は正規分布をしっかりとみていきたいと思います。
一番初めの度数分布表の例に使った身長のアンケートなど、自然や社会で観測されるデータにおいて不確実でまちまちに分布しているものがたくさんあります。これらのデータをたくさん集めてくると、ある特徴をもって分布していることがわかりました。
Sponsored Link
Sponsored Link
では、このヒストグラムの階級の幅を5→3→1→・・・・・・とどんどん狭めていったらどうなるでしょうか?
ヒストグラムはどんどん曲線に近づいていきます。ヒストグラムの階級の幅を極限まで狭めた曲線の式を確率密度関数と言います。確率密度関数のグラフには、平均を中心に左右対称であったり、平均と標準偏差の影響を受けるといった特徴があります。
そして、確率密度関数の1つに正規分布があります。そのため、正規分布も同じような特徴をとり、前回の左右対称の山のようなグラフになるのです。
正規分布は、確率密度関数の1つであることを先ほどお話ししました。
さらっと流しましたが、「関数」です。
察しのいい方は気づいたと思いますが、関数なので正規分布は数式で表すことができます。それを表すと以下のような数式になります。
・・・・・この式で統計アレルギーを発症した人いるのではないでしょうか(笑)1つずつ式を見ていきます。
まずeは数Vをやった人であれば問題ないかと思います。ただ薬学部では数Uどまりの人もいるかもしれないので一応解説しておくとeは自然対数の底のことを指し、数字にすると2.7182・・・・となります。よくわからない人はπ(パイ)=3.14みたいなものと思っておけばいいです(笑)
では改めてこの式を見ると、残りは標準偏差と平均という文字のみです。これはすでに学習済みで、そのデータにおける標準偏差と平均を入れるのみです。例えば、この前行った衛生の例では平均値が37.6で標準偏差が20でした。これを入れるだけです。
この場合、xは平均が37.6で標準偏差が20の正規分布に従うと統計学では言います。
どうしても式が出てきてしまうと、統計学アレルギーが出てきてしまいますが、ここのあたりも壁になってくるので何回も見直して理解してください。