データセットの種類

 どのようなデータを集めるかによって、分析できる内容が変わってきます。分析の目的に沿ったデータセットを選択しましょう。
 なお、ここで言うデータには、公的機関が公表している統計に代表される様な、個々のデータを合算するなどによって集計したデータだけでなく、個人の身長の推移などの個別のデータも含みます。

時系列データ

 一つの項目について時間に沿って集めたデータを時系列データといい、時間に沿った変化を分析することができます。時系列データを分析する際は季節変動などに注意する必要があります。

  

例1:A県の平成21年〜25年の人口のデータ(図1の*1)

  

例2:千早数さんの過去3年間の身長のデータ

時系列データの説明

横断面データ(クロスセクション・データ)

 ある時点における場所・グループ別などに記録した複数の項目を集めたデータのことです。同一時点での複数項目間の分析ができます。

  

例1:平成22年1月時点のA県の世帯数、人口、事業所数(図1の*2)

  

例2:河田計さんの英語、数学、国語の期末試験の点数

コーホートデータ

 生まれた年ごとに記録し、経過時間に沿って集計したデータをコーホートデータといいます。このデータでは、人口や就業率の推移を世代ごとに比較分析することができます。

パネルデータ

 一般的にパネルデータとは、同一の標本について、複数の項目を継続的に調べて記録したデータとされており、項目間の関係を時系列に沿って分析することができます。
 通常の継続的に行われる調査では、調査時点ごとに調査される標本が異なることがありますが、パネルデータの場合は、標本を入れ替えること無く、同一の標本に対して継続的に調査されたデータを使用することに特徴があります。

例:A企業の平成21年〜25年の従業員数、売上金額、仕入額など(図2)

パネルデータの説明
▲ ページのトップへ

Copyright © 2013 総務省 統計局 All rights reserved.

〒162-8668 東京都新宿区若松町19-1 TEL 03-5273-2020(代)