Sponsored Link
カテゴリーデータと単純集計表
前回の数量データとカテゴリーデータでは、統計学に使われるデータの種類について見ました。今回は統計学の手始めとして、カテゴリーデータについて深掘りしたいと思います。
単純集計表
まずカテゴリーデータの復習です。カテゴリーデータは、測ることのできないデータを言うのでした。前回の例でいうなら、当サイトのわかりやすさのアンケートがカテゴリーデータです。では架空のデータですが、その当サイトのわかりやすさのアンケート結果が以下のようになったとします。
このままでは、各項目どれくらいの人数いるのかわかりにくいので数えます。数え方は間違えなければなんでもいいですが、シンプルに最初の1番の人から、集中して正の字で数えていくのが良いと思います。
Sponsored Link
Sponsored Link
順調に数えられたら以下のようになっていると思います
- とてもわかりやすい;5人
- ややわかりやすい;3人
- どちらともいえない;5人
- ややわかりにくい;4人
- とてもわかりにくい;3人
一応間違え確認のために、集計が終わった後に各項目を足して全データ数になっているか確認した方がテストなどでは安心です。今回の場合すべて合わせて20人なので、各データの合計が20人で一致しているのであっていますね。
さらに各項目の人数を全データ数で割ると、その項目が何%占めているかがわかります。例えば、とてもわかりやすいの場合は5人なので、5÷20=0.25。つまり25%占めていることがわかります。これを各項目やっていくと、以下のようになるかと思います。
とてもわかりやすい;5人。割合25%
ややわかりやすい;3人。割合15%
どちらともいえない;5人。割合25%
ややわかりにくい;4人。割合20%
とてもわかりにくい;3人。割合15%
これを少しわかりやすく表にまとめると、次のようになります。
この表を単純集計表と呼ぶこともあります。ではこの単純集計表をもとにわかりやすくするためにグラフにしてみます。
グラフ化することで、アンケート結果が一目瞭然ですね。
では例題で練習してみましょう
例題
当サイトのアンケートを行った人の血液型のデータは以下のようになった。このデータにおける単純集計表を作れ
先ほどと同様に各血液型の人数を数えましょう
A;7
B;5
O;5
AB;3
そして、次に割合を求めます。
A;7。割合35%
B;5。割合25%
O;5。割合25%
AB;3。割合15%
よって単純集計表は以下のようになります。
まとめ
- カテゴリーデータをまとめたものは単純集計表と呼ばれることがある。
カテゴリーデータと単純集計表 関連ページ
- 母集団と標本
- 統計学とは、簡単に言うと標本の情報から母集団の状況を推測する学問です。母集団とは本来調査するべき全員を指し、その一部を標本ということができます。
- 数量データとカテゴリーデータ
- 統計学では、目盛が等間隔で測れるデータを数量データと言います。目盛が等間隔ではなく測れないものをカテゴリーデータと言います。
- 度数分布表の作り方、基礎編
- データから度数分布表の作り方は、最大値と最小値を把握する、階級を決める、階級値を決める、度数を数える、相対度数を出すというように行います。
- ヒストグラムの作り方、基礎編
- ヒストグラムとはいわゆる棒グラフのことで、横軸は階級値、縦軸は度数(相対度数)などにより描かれます。度数分布表やヒストグラムを作ることで、より直感的にデータの特徴を感じることができます
- 度数分布表とヒストグラム、例題編
- 今まで見てきた度数分布表とヒストグラムの作り方をもとに、例題を交えてさらに理解できるようにします。度数分布表とヒストグラムを慣れるまで繰り返しましょう。
- 平均値と中央値の違い
- 平均値とはデータの合計値を全データで割ったもので、中央値はデータを小さい順から並べたときに真ん中にくるものです。そのため平均値と中央値は違います。
- 分散とは?
- 平均値のみではデータの散らばりの判断がつかないので、分散を知る必要があります。分散は偏差の二乗の合計値を全データで割って求めることができます。
- 標準偏差、基礎編
- 分散の欠点を解消するために√をとったものが標準偏差であり統計学ではかなり重要です。標準偏差は0であればデータが全く散らばっていなく、大きくなるほど散らばっていることを示しています。
- 標準偏差、例題編
- 標準偏差の求め方は、平均値を出す、偏差を出す、分散を出す、標準偏差を出すという手順で出すことができます。薬学部において標準偏差を出すことができればかなりの進歩です。