3.データの収集

 統計調査などで集められた調査票は、整理した上、内容検査、符号付けなどを行うことが必要になります。

調査票の整理

 「調査票の整理」は、調査票が全て集められているかなどを検査し、この後の集計作業を行いやすくするための整理をします。

内容の検査

 集められた調査票の記入内容について、記入漏れ、記入誤り、他の関連する質問との間の矛盾の有無などを検査する作業です。記入漏れ等があった場合、調査票記入者に再度質問するなどして、必要があれば補筆します。また、合計値などを計算する調査項目がある場合は計算値をチェックし、誤りは修正します。ただし、内容検査においては、回答内容の無理な訂正などは行わないように注意しましょう。

符号付け

 収集したデータが質的データの場合、調査票の各項目に符号付けを行うことで、データの入力や、統計表の作成をより迅速・正確に行うことができます。例えば、調査票に男か女かのどちらかに"○"を記入させる項目があった場合、男に○が記入されていれば"1"、女に○が記入されていれば"2"のように符号を付けます。

個票データの作成

 調査票の整理・内容検査や符号付けを行ったら、データの集まった調査票を一覧表にまとめ、集計の元となるデータ(個票データ)を作成しましょう。個票データを作成することでその後の集計が行いやすくなります。
 個票データは縦に回答者、横に調査項目に対する回答内容を並べて作成します。この時、一人分あるいは一件分の回答内容をレコードと言います。

個票データの作成例

統計表の作成

 一般的に用いられる統計表の各部の名称は以下のとおりです。

統計表の各部名称
A 表題 統計表の内容を示します。一目で統計表の内容が分かるように表現しましょう。
B 頭注、脚注 統計表や統計表中の個々の値に対する補足説明を記載します。表の上部(表題と表頭の間)に記載するものを「頭注」、表の下部に記載するものを「脚注」といいます。
C 表側頭 表側の事項が何であるかを示す部分です。表側頭を斜線で二分し、左下半分に表側の分類名称を、右上半分に表頭の分類名称を記載する場合もあります。
D 表頭、表側 統計表に表示されている数値が何について集計されたものかを表します。
E 表体、セル 表体は、表頭、表側に対応する値を記入する部分で、「本欄」ともいいます。個々の値が記載される部分を「こま(セル)」といいます。
F 資料出所 統計表の根拠となった調査名や報告書名、作成者(機関)を記載し、統計データの出所を明確にします。

 統計表には大きく分けて2種類あります。一つ目は単純集計表で、一つの標識(図では学年)に関して度数(図では生徒数)を記載したものです。二つ目はクロス集計表で、二つ以上の標識(図では部活動の種類と学年)に関して度数を記載したものです。
 どのような統計表を作成するかは、調査の目的、質問の内容などによって異なります。

単純集計とクロス集計

 クロス集計表にも上の図のように二次元(部活動の種類と学年)のもの、下の図のように三次元(部活動の種類、学年と性別)のもの、目的によってはもっと複雑な統計表も作成します。しかし、統計表を作成する場合、それが三次元以上のクロス表であっても、紙や表計算ソフトのシートなどの二次元上に作成することになるため、あまり複雑にならないようにするなど、見やすくする工夫が必要です。

単純集計とクロス集計

 なお、該当する値がないセルについて、空白で表示すると、それが記入漏れであるのか、数字がないのかなど、統計表の利用者が判断に迷うことになりますので、例えば以下のような符号を記載して区別する場合が多くあります。

0(又は0.0)など 調査、集計した結果、値は存在するが、表章単位未満の場合
調査、集計した結果、値が存在しない場合、あるいは値が存在し得ない場合
調査あるいは集計していない場合

文章やプレゼンテーションで統計表を使用する場合

 文章やプレゼンテーションで統計表を使用する場合は、読み手や聞き手が理解しやすいように、必要な項目だけを選びましょう。また数字を理解しやすいように、データの大小やその他の序列に沿ってデータを並び替えたり、最大値や最小値、外れ値を示したりしましょう。

 集めたデータを公表する場合は、その統計表から誰が何を回答したかという情報の機密性を確保しなければなりません。特に調査対象者が特定されては困る質問項目については、統計表の該当項目をふせる処理が必要となる場合があります。