Sponsored Link
標準正規分布と性質
前回の正規分布の式とグラフでは、正規分布についてみました。今回は標準正規分布についてみていきたいと思います。今回は特にいままでの知識が必要になってくるので、わからない方は復習をしつつ読んでください。
標準正規分布
前回の復習をすると、正規分布の式は以下のようにあらわされました。
この式のうち平均が0で標準偏差が1の時、「xは平均が0で標準偏差が1の正規分布に従う」と統計学では表現するという話を前回しました。
しかし平均が0で標準偏差が1の時は、「xは標準正規分布に従う」と統計学では言います。そして、代入すればわかると思いますが標準正規分布の式は以下のように少しシンプルになります。
ところで、そんな都合よく平均が0で標準偏差が1の時なんてあるのかと思う方もいるかもしれませんが、それがあるんです。
ヒントというか、ほぼ正解ですが基準値がまさにそうです。これも復習になりますが基準値は以下のような特徴を持つのでした。
- 満点が何点であっても、その基準値の平均は0、標準偏差は1となる。
- どのような単位であっても、その基準値の平均は0、標準偏差は1となる。
まさに、平均が0で標準偏差が1ですね。つまり基準値に直した衛生のテストは標準正規分布に従うことになります。
Sponsored Link
Sponsored Link
標準正規分布の性質
標準正規分布は平均が0と標準偏差が1以外にも次の大事な性質を持ちます。
- 平均から標準偏差1個以内のデータの相対度数は0.6826(約70%がこの中に入る)
- 平均から標準偏差2個以内のデータの相対度数は0.9544(約95%がこの中に入る)
すでに標準偏差を用いて、データの特殊性を評価するでも解説済みですが、標準偏差2個以内にほぼすべてのデータが入ってしまうというのはデータを判断するうえでとても大事な性質となります。
正規分布の性質
では次に正規分布の性質も見てみましょう。標準正規分布では平均が0で標準偏差が1でしたが、これを正規分布に変換するには標準正規分布のデータを加工する必要があります。
つまり、標準正規分布の全てのデータに一定数をかけて、そのあと一定数を加えることで加工することができます。データを加工すると平均値や標準偏差には以下のような影響がありました。
- 全データに一定数をかけて新しいデータを作ると、平均値と標準偏差はかけた数字だけ増える。
- 全データに一定数を加えて新しいデータを作ると、平均値は加えた数字だけ増え、標準偏差には影響を与えない
これも別ページ、データに一定数を加えた時の平均値や標準偏差への影響やデータに一定数をかけた時の平均値や標準偏差への影響で解説済みなので、必要であれば復習してください。
具体的な例をあげると、標準正規分布のデータに、6をかけて、5加えたとします。この時の平均値や標準偏差は先ほどのデータ加工の影響をもとに以下のように変化します。
- 6をかける;平均値は0×6=0、標準偏差は±1×6=±6
- 5を加える;平均値は0+5=5、標準偏差は±6+5=−1、+11
つまり、ヒストグラムは左右に6倍だけ広がって、右に5進んだヒストグラムに加工されたことがわかります。さらに、これをもとに先ほどの標準正規分布の特性を考えると、以下のようになります。
- 平均から標準偏差1個以内のデータの相対度数は0.6826(約70%がこの中に入る)→−1〜+11までにデータの約70%が入る。
以上のことから、平均値μ(ミュー)、標準偏差σ(シグマ)における正規分布の特性を以下のように言うことができます。
- μ±σの範囲のデータの相対度数は0.6826(約70%がこの中に入る)
- μ±2σの範囲のデータの相対度数は0.9544(約95%がこの中に入る)
今までの知識がだいぶ積み重なってきたのが実感できる内容だったかと思います。
まとめ
- 平均が0で標準偏差が1の時は、xは標準正規分布に従う
- 正規分布の特性としてμ±σの範囲のデータの相対度数は0.6826(約70%がこの中に入る)、μ±2σの範囲のデータの相対度数は0.9544(約95%がこの中に入る)
標準正規分布と性質 関連ページ
- 母集団と標本
- 統計学とは、簡単に言うと標本の情報から母集団の状況を推測する学問です。母集団とは本来調査するべき全員を指し、その一部を標本ということができます。
- 数量データとカテゴリーデータ
- 統計学では、目盛が等間隔で測れるデータを数量データと言います。目盛が等間隔ではなく測れないものをカテゴリーデータと言います。
- カテゴリーデータと単純集計表
- カテゴリーデータをまとめたものは単純集計表と呼ばれることがあります。単純集計表の作り方は、カテゴリーデータの各項目を数えて、割合を出すことで作られます。
- 度数分布表の作り方、基礎編
- データから度数分布表の作り方は、最大値と最小値を把握する、階級を決める、階級値を決める、度数を数える、相対度数を出すというように行います。
- ヒストグラムの作り方、基礎編
- ヒストグラムとはいわゆる棒グラフのことで、横軸は階級値、縦軸は度数(相対度数)などにより描かれます。度数分布表やヒストグラムを作ることで、より直感的にデータの特徴を感じることができます
- 度数分布表とヒストグラム、例題編
- 今まで見てきた度数分布表とヒストグラムの作り方をもとに、例題を交えてさらに理解できるようにします。度数分布表とヒストグラムを慣れるまで繰り返しましょう。
- 平均値と中央値の違い
- 平均値とはデータの合計値を全データで割ったもので、中央値はデータを小さい順から並べたときに真ん中にくるものです。そのため平均値と中央値は違います。
- 分散とは?
- 平均値のみではデータの散らばりの判断がつかないので、分散を知る必要があります。分散は偏差の二乗の合計値を全データで割って求めることができます。
- 標準偏差、基礎編
- 分散の欠点を解消するために√をとったものが標準偏差であり統計学ではかなり重要です。標準偏差は0であればデータが全く散らばっていなく、大きくなるほど散らばっていることを示しています。
- 標準偏差、例題編
- 標準偏差の求め方は、平均値を出す、偏差を出す、分散を出す、標準偏差を出すという手順で出すことができます。薬学部において標準偏差を出すことができればかなりの進歩です。
- 統計学で偏差値を考える
- CBTや国家試験の模試を行うと、偏差値が出てきます。統計学の平均値や標準偏差の知識を用いることで、テストの偏差値や1点の重みがわかります。
- 基準値と偏差値
- 偏差値は基準値×10+50で出すことができます。偏差値は基準値をもとにして出されるので、満点の点数が違うものや、単位が違うものも比較できます。
- 標準偏差を用いて、データの特殊性を評価する
- 標準偏差1個以内にあるものは全体の70%を占め、月並みなデータですが、2個以上離れているデータは正規分布する場合前回の5%しか存在せず、かなり特殊なデータと言える。
- データに一定数を加えた時の平均値や標準偏差への影響
- データに一定数を加えて加工すると平均値のみ変化して標準偏差には影響を与えません。これはヒストグラムがただ横にスライドするだけと考えるとわかりやすいでしょう。
- データに一定数をかけた時の平均値や標準偏差への影響
- データに一定数をかけた場合、平均値も標準偏差もかけた数だけ増えます。つまり没問が出た場合、標準偏差にも影響が出てしまうため得点を二倍にしてはいけません。
- 正規分布の式とグラフ
- ヒストグラムの階級を限りなく狭めていくと曲線になっていき、その曲線の式を確率密度関数といいます。正規分布は確率密度関数の1つで左右対称の山のようなグラフとなります。