統計学のまとめ記事一覧
母集団と標本
このカテゴリーでは統計学についてまとめていきます。統計学は当サイトでまとめて欲しいと要望があった最上位の科目です。統計学はCBTや国家試験で大幅な出題数増加などの変更がない限りはコスパが悪いので苦手な人は捨てるべき科目ではありますが、大学の定期試験ではそうもいきません。そんなご要望にお応えして、どう...
数量データとカテゴリーデータ
前回の母集団と標本では、統計学はどういう学問なのかを母集団と標本という単語を交えて話しました。今回は統計学に使われるデータについて見ていきたいと思います。測れるデータと測れないデータ統計学はどうしても数字のイメージが強いですが、その他にも様々なデータが使われます。その様々なデータには測れるものと測れ...
カテゴリーデータと単純集計表
前回の数量データとカテゴリーデータでは、統計学に使われるデータの種類について見ました。今回は統計学の手始めとして、カテゴリーデータについて深掘りしたいと思います。単純集計表まずカテゴリーデータの復習です。カテゴリーデータは、測ることのできないデータを言うのでした。前回の例でいうなら、当サイトのわかり...
度数分布表の作り方、基礎編
前回のカテゴリーデータと単純集計表では、カテゴリーデータについて見ました。今回は数量データについてもう少し深掘りし、度数分布表について見ていきたいと思います。度数分布表前回では、当サイトについてアンケートをとった例についてお話ししました。そのアンケートの項目に私が皆様に「身長はどれくらいですか?」と...
ヒストグラムの作り方、基礎編
前回の度数分布表の作り方、基礎編では度数分布表を見ました。今回はヒストグラムについて見ていきたいと思います。ヒストグラムとは度数分布表を作るそもそもの目的は、まったく意味不明な数字データから特徴がわかりやすくなるようなグラフを作るというものでした。ヒストグラムと聞くと聞いたことがなくて身構えてしまい...
度数分布表とヒストグラム、例題編
前回のヒストグラムの作り方、基礎編では、度数分布表からヒストグラムの作り方についてみました。今回は度数分布表とヒストグラムの例題編となります。もし前回までで十分理解できてるよという方でしたら、今回のページもほぼ同じなので読み飛ばしていただいて構わないです。では早速例題です。例題当サイトにおけるアンケ...
平均値と中央値の違い
前回の度数分布表とヒストグラム、例題編までで、度数分布表やヒストグラムを極めました。度数分布表やヒストグラムはデータの特徴をわかりやすくするのに役立ちますが、少し欠点もあります。それは度数分布表やヒストグラムを見て、データの特徴のとらえ方が人によって違うということです。前回の例題で私は26〜30にデ...
分散とは?
前回の平均値と中央値の違いでは、平均値などを見ました。今回は分散について見ていきたいと思います。平均値の欠点平均値は広がって存在しているデータの中から1点代表する値であり、平均値の近くにデータは存在しているということを説明しました。改めて前回にやった3つのチームの平均値を見てみましょう。Aチーム;(...
標準偏差、基礎編
前回の分散とは?では分散についてみました。分散はデータのバラつき具合がわかるという話をしましたが、少し欠点もあります。それを補うのが標準偏差です。標準偏差と言えば、統計学を代表するワードであり、統計学アレルギーの方でも何度も聞いたワードでしょう。今回は標準偏差について見ていきたいと思います。分散の欠...
標準偏差、例題編
前回の標準偏差、基礎編では標準偏差についてみました。今回は標準偏差の例題編でさらに理解を深めていきたいと思います。この前のヒストグラムの例題編と同様に標準偏差余裕な方は読み飛ばしてもらって構わないと思います。それでは早速例題です。例題Bチームの標準偏差を求めよまず標準偏差の出し方の手順の復習です。平...
統計学で偏差値を考える
前回までの標準偏差、例題編で標準偏差までを極めました。今回は標準偏差を少し応用した偏差値についてみていきたいと思います。点数の価値皆さんがCBTや国家試験で模試を受けたときに嫌でも偏差値という項目に目が行くと思います。偏差値は高ければいいというのはわかっているとは思いますが、実際のところ偏差値とは何...
基準値と偏差値
前回の統計学で偏差値を考えるでは、点数の価値について統計学的に見てきました。今回はいよいよ偏差値についてみていきます。基準値前回の例で見ていただいたように、テストの点数を比較して価値をつけたり、優劣をつけるのはなかなか難しいのがわかったかと思います。そこで、点数の価値を比較しやすくするデータを基準値...
標準偏差を用いて、データの特殊性を評価する
前回の基準値と偏差値では偏差値を見ました。今回は偏差値に関連して標準偏差をさらに深掘りしていきたいと思います。偏差値62.7の意味前回あなたの衛生の点数は63点で、偏差値が62.7ということが求まりました。平均点37.6点を上回っているので、明らかに喜んでいい点数なわけですが、どれくらい喜べばよいで...
データに一定数を加えた時の平均値や標準偏差への影響
前回の標準偏差を用いて、データの特殊性を評価するでは、標準偏差からデータがどれくらいレアなのかを判断しました。今回はデータを加工した時に与える影響を見てみます。データに一定数を加えた場合の標準偏差CBTや国家試験の模試などで、問題が不適切な場合は没問となり、全員に加点などで対応になるかと思います。私...
データに一定数をかけた時の平均値や標準偏差への影響
前回のデータに一定数を加えた時の平均値や標準偏差への影響では、データに一定数を加えた場合平均値のみに影響を与えることがわかりました。今回はデータに一定数をかけた時の平均値や標準偏差への影響を見ていきましょう。データに一定数をかけた時の標準偏差前回は没問を例にデータに一定数を「加えた」場合でしたが、今...
正規分布の式とグラフ
前回の標準偏差を用いて、データの特殊性を評価するで、チラッと正規分布という話をしました。その時は左右対称の山のようなグラフとざっくり説明しましたが、今回は正規分布をしっかりとみていきたいと思います。正規分布一番初めの度数分布表の例に使った身長のアンケートなど、自然や社会で観測されるデータにおいて不確...
標準正規分布と性質
前回の正規分布の式とグラフでは、正規分布についてみました。今回は標準正規分布についてみていきたいと思います。今回は特にいままでの知識が必要になってくるので、わからない方は復習をしつつ読んでください。標準正規分布前回の復習をすると、正規分布の式は以下のようにあらわされました。この式のうち平均が0で標準...
標準正規分布の95%予言的中区間
前回の標準正規分布と性質では標準正規分布についてみました。もし推測したい不確実な現象が正規分布とみなせるならば、そこから推測ができるのではという考えが生まれてきます。これは一番初めの母集団と標本で統計学は標本から推測する学問という話にいよいよつながってきます。今回は標準正規分布による推測についてみて...
正規分布の95%予言的中区間と例題
前回の標準正規分布の95%予言的中区間では、標準正規分布における95%予言的中区間が−1.96〜+1.96である話をしました。今回は一般的な正規分布における95%予言的中区間についてみていきたいと思います。正規分布の95%予言的中区間標準正規分布と性質のページで解説したように、標準正規分布のデータを...
標準正規分布表、面積と確率
前回の正規分布の95%予言的中区間と例題までで、95%予言的中区間についてみました。今回はこれをさらに深掘りした標準正規分布表についてみていきたいと思います。確率密度関数の面積標準正規分布において95%予言的中区間は、−1.96〜+1.96という話をしました。この範囲にデータの95%が存在していると...
データから母集団を推定する方法
標準正規分布表、面積と確率では標準正規分布表の読み方などを見ました。今回はデータから母集団を推定する方法についてみてみたいと思います。選挙の出口調査母集団と標本でもお話ししたように、選挙の結果発表をする時に全員開票される前にあっという間に結果が出てきます。これはまさに今回のデータから母集団を推定する...
95%信頼区間とは
前回のデータから母集団を推定する方法では、仮説のもとでの母集団から出てくるデータから母集団を推定して妥当かどうかを調べました。今回は95%信頼区間についてみていきたいと思います。95%信頼区間とは前回の選挙の立候補者の〇×の例では母数として16人は妥当ではあるけれども、36人では妥当ではないという結...
無作為抽出の仮定と母平均
前回の95%信頼区間とはでは95%信頼区間をみました。今回は母平均についてみていきたいと思います。無作為抽出無限にある母集団から出てきた一部のデータから母集団を推定することをやってきておりますが、今回は以下の例をまず見てください。ドラえも〇の四次元ポケットがあったとする。四次元ポケットの中に、「1」...
母標準偏差の出し方
前回の無作為抽出の仮定と母平均では、母平均についてみました。母平均があるということは、そこから母標準偏差を求めることができます。今回は母標準偏差についてみていきたいと思います。母標準偏差とはすでに説明をするまでもないですが、母集団の標準偏差を母標準偏差と言います。求め方についても、すでに学んだ標準偏...
標本平均とは
前回の母標準偏差の出し方では、母標準偏差についてみました。今までは母集団からデータを一個抽出した場合を見ましたが、これが複数個ある場合はどうなるでしょうか?今回は標本平均についてみてみます。標本平均母平均を推定するにあたって、一個のデータ(標本)から推定するよりは、複数個データがあった方がいいという...
正規分布している母集団からの標本平均における95%予言的中区間
前回の標本平均とはでは、nが大きいほど標本平均は母平均に近い数値をとる可能性が高くなることをお話ししました。今回はさらに深掘りして正規母集団からの標本平均の95%予言的中区間についてみていきたいと思います。正規分布している母集団からの標本平均前回の四次元ポケットからのくじ引きでは、母集団ではどの数値...
標本平均から母集団の母平均を推定する
前回の正規分布している母集団からの標本平均における95%予言的中区間まででは、母集団からデータを取り出し推測する方法を見ました。今回は標本平均から母集団の母平均を推定する方法を見てみます。イメージがわきにくいと思うので、今回は例題から見てみます。例題打錠機を作成した。この機械はほぼ指示通りの重さに錠...
標本分散の性質
正規分布の式とグラフのページで、確率密度関数の1つに正規分布があるといった話をしましたが、ほかにももちろんあります。その1つがカイ二乗分布です。今回はカイ二乗分布の導入前の作業として標本分散についてみていきたいと思います。標本分散母平均を推定するにあたって、標本平均の求め方などを勉強してきました。た...
カイ二乗分布とは?自由度とヒストグラム
前回の標本分散の性質では、標本分散は必ずプラスになるという話をしました。今回はそれに関連してカイ二乗分布のヒストグラムについてみていきたいと思います。カイ二乗分布とは母集団が標準正規分布しているものからデータをとり、そのデータを二乗して足した統計量を考えます。いまいちイメージがわかないと思うので、例...
カイ二乗分布表の読み方と例題
前回のカイ二乗分布とは?自由度とヒストグラムでは、カイ二乗分布のヒストグラムを見ました。今回はカイ二乗分布表の読み方についてみていきたいと思います。カイ二乗分布表標準正規分布には標準正規分布表があるように、カイ二乗分布にも同じような専用のカイ二乗分布表があります。標準正規分布表は、横軸の値からどれく...
母分散をカイ二乗分布で推定する方法
前回のカイ二乗分布表の読み方と例題では、カイ二乗分布表の見方について学びました。今回は母分散をカイ二乗分布で推定する方法についてみていきたいと思います。カイ二乗分布の95%予言的中区間の作り方カイ二乗分布の分布が得られると、95%予言的中区間が得られます。その作り方は前回の例題と同じイメージになりま...
(標本−標本平均)/母標準偏差の二乗の和はカイ二乗分布する
前回の母分散をカイ二乗分布で推定する方法では、母分散の95%信頼区間をやりました。今回は前回出てきた(標本−母平均)/母標準偏差の二乗の和という式のうち、「母平均」を「標本平均」に変えたらどうなるのかというのをみていきたいと思います。(標本−標本平均)/母標準偏差の二乗の和(標本−標本平均)/母標準...
(標本−標本平均)/母標準偏差の二乗の和の自由度が1下がる理由
前回の(標本−標本平均)/母標準偏差の二乗の和はカイ二乗分布するでは自由度が1下がるという話をしました。そして、その自由度が1下がる理由を簡単ではありますが、みてみたいと思います。なお私のようになるべく理詰めしたい方向けなので、自由度が1下がるんだと割り切れる方は読み飛ばしてください(笑)(標本−標...
母平均が未知の正規母集団の区間推定の例題
(標本−標本平均)/母標準偏差の二乗の和はカイ二乗分布するをやっていて、一部の人は「なぜ母平均ではなく、標本平均で引いた新たな統計量Wをやるのだろう」と思ったかもしれません。思い出してください、統計学の目標を。統計学はデータから母集団を推定する学問です。そのため母平均をすでに知っているのは若干不自然...
t分布と統計量Tとは?
前回の母平均が未知の正規母集団の区間推定の例題までで母分散(母標準偏差)の推定を見ました。かなり初めの方に話したと思いますが、データをとらえるうえで大事なのが平均と標準偏差でした。では、母分散のみだけでなく母平均も推定することができるでしょうか?結論としては母平均を推定することができ、それを可能にす...
t分布のヒストグラムと統計量Tの計算例題
前回のt分布と統計量Tとは?では統計量Tについてみました。母平均を推定するためには、あとヒストグラムが必要です。そのため今回はt分布のヒストグラムについてみていきたいと思います。t分布のヒストグラム統計量TはT=(標本平均−母平均)×√(n−1)/標本標準偏差で表されました。複雑そうな数式なので、t...
t分布表の読み方
前回のt分布のヒストグラムと統計量Tの計算例題では、t分布を見ました。今回はt分布表の見方についてみていきたいと思います。t分布表前回でt分布は正規分布に似ているという話をしました。そして区間推定を行うにあたって以下のt分布表を利用します。今までの標準正規分布表やカイ二乗分布表とはまた見方が異なりま...
t分布を利用した未知の母平均の区間推定、例題
前回のt分布表の読み方では、t分布表についてみました。今回は、t分布を利用した未知の母平均の区間推定を例題を用いて確認していきます。では、早速例題です。例題正規母集団の錠剤の重さの母平均を推定するために、データをランダムに8個とったところ、3、4、5、5、6、4、5、8となった。この時の母平均を区間...
相関分析、単相関係数と例題
今まで学んできた統計分析の方法は、1つの変数が単独で分布していました。しかし、世の中の自然現象や社会現象には2つの変数(現象)が関連して変化することがあります。例えば、「揚げ物を毎日たくさん食べる人は、脂質異常症になりやすい」だとか、「タバコを毎日吸う人は、肺がんになりやすい」など様々な現象がありま...