Q1
次の記述(ア)〜(ウ)は、データの種類に関するものである。
- (ア)アンケート調査で血液型を調査し、「A型」を1、「B型」を2、「O型」を3、「AB型」を4としてデータを入力した。この数値データの平均値を計算したところ2.25であったが、この平均値には意味がない。
- (イ)アンケート調査で、ある質問に対して、「はい」を1、「いいえ」を0としてデータを入力した。この数値データの平均値を計算したところ0.65であったが、この平均値には意味がない。
- (ウ)各2点の小問50問からなる100点満点の試験の得点は、離散型変数であるので、連続型変数として分析を進めることには意味がない。
記述(ア)〜(ウ)に関して、次の(1)〜(5)のうちから最も適切なものを一つ選べ。
A1
解説:
- (ア):
- 正しい。血液型は名義尺度の変数であり、番号(数値)を用いて血液型を表現することはあるが、番号(数値)の付け方で平均値は変わり、平均値が2.25であるという情報は、血液型を説明する要約となっていないため、この平均値には意味がない。
- (イ):
- 誤り。2値データの場合、数値を当てはめて平均値を求めることで、各項目の割合が把握できる。特に、0と1でコーディングした場合、平均値は1を割り振った項目の割合を示す。平均値が0.65であることは「はい」と答えた割合が0.65であることを意味している。
- (ウ):
- 誤り。各問2点、50問の試験の点数は、満点が100点の離散型変数であるが、取り得る値の種類が多い数値データであり、間隔尺度の性質をもつので、連続型変数としての分析を進めることができる。
以上から、正しい記述は(1)のみなので、正解は(ア)である。