ここから本文です。

ゼミナール編(2) 〜調査実施と分析

3時限目 集計と分析

3-2 カテゴリデータの集計

1度数分布とグラフ

ここでいうカテゴリデータとは、名義尺度あるいは順序尺度で測定された変数の値からなるデータをさすものとします。そのようなときは、どのように集計するとよいのでしょうか。

度数分布表

カテゴリデータの集計は、「それぞれのカテゴリに該当する人数をカウントする」のが基本方針となります。
もっとも基本的な集計の方法は、度数分布表です。度数分布表とは、選択されたカテゴリの人数を数えて整理する表のことです。例をみてみましょう。

度数分布表の例
カテゴリ 度数 相対度数 累積度数 累積相対度数
満足 576 0.480 576 0.480
どちらともいえない 410 0.342 986 0.822
不満 214 0.178 1,200 1.000
合計 1,200 1.000 1,200 1.000

この例をみると、生活に満足していると回答している人は576人、どちらともいえない人が410人、不満と答えたのは214人であったことがわかります。このように、回答した人数のことを度数といいます。どこに(どの選択肢に)、どれだけ(何人が)回答したのか、全体的な分布の状況がひと目でわかるようになっています。

どのカテゴリの回答が多数派なのかを示すのには、相対度数を用います。相対度数とは、各カテゴリの度数を総度数(合計の人数)で除した値です。相対度数を100倍すれば、百分率(パーセント)になります。相対度数を出す際の注意事項としては、小数点以下の桁数をあまり多くし過ぎないこと、があります。意識調査のデータは誤差を含むので、あまりにも小さい桁の数については正確であると保証しきれないからです。

順序尺度の変数のときには、累積度数や累積相対度数を計算することもできます。
累積度数とは、値の小さいカテゴリから順々に度数を足しあげた度数のことをいいます。上の例では、「満足」と「どちらともいえない」までの回答者数を足しあげると986人として、累積度数が求められています。最後のカテゴリまでいくと、累積度数は全体の度数と一致します。 なお、名義尺度の変数については、カテゴリの順序にしたがって回答者数を足しあげることができないので、累積度数を求めてはいけません。

グラフによる視覚化

度数分布表をもとに、グラフ化をすると、データの分布を視覚的に把握できるようになります。もし、回答した人数の情報を活かしてグラフ化したいのであれば、度数を棒グラフにすることをおすすめします。そうではなく、回答した割合をみたいのであれば、相対度数を円グラフまたは帯グラフにすることをおすすめします。帯グラフのことを、100%積み上げ棒グラフと呼ぶこともあります。

棒グラフの例
棒グラフの例。度数が縦軸になっており、満足している人が多いのがわかりやすい。
円グラフの例
円グラフの例。満足している人の割合が48%、どちらともいえないの割合が34%、不満の割合が18%だとわかる。
帯グラフの例
帯グラフの例。満足している人の割合が48%、どちらともいえないの割合が34%、不満の割合が18%だとわかる。
  • 次に、2種類のカテゴリデータを利用した詳細な検討方法を学びます。
    「3-2-2 クロス集計」で、詳しくみていきましょう。

執筆・監修:東京大学社会科学研究所 教授 三輪 哲

サイトマップ
ページ上部へ アンカーのアイコン画像