ここから本文です。
統計研究彙報 第72号 No.3
概要
タイトル
統計実務におけるレンジチェックのための外れ値検出方法
著者
野呂 竜夫、和田 かず美
刊行年月
2015年3月
要旨
統計調査における調査データは、調査対象から得た情報が調査票等に記入される。その後、調査実施者が集計を行うが、集計前に調査票等の記入内容に誤りがないかなどの様々な審査が行われる。例えば数量項目の場合、記入内容の数値が調査単位ごとに大きすぎ(小さすぎ)ないかを確認する。政府が実施する統計調査はデータ量が多いので、確認すべきデータの基準(レンジ:人手による審査をしない正常値とみなす値の範囲)は、前もって定めておく必要がある。通常、レンジは実際の調査データから算出するが、調査データには外れ値が含まれるので、その影響を受けやすい平均値や標準偏差をもとにレンジを算出すると正常値とみなされる範囲が広がり検出漏れを起こす可能性がある。
本稿では、単峰で変換などによりある程度の対称性が確保されるようなデータについてのレンジを用いた外れ値検出の適切な方法を解説するとともに、サービス産業動向調査のデータを用いてレンジチェックのレンジの設定を行った事例を紹介する。
キーワード: 中央値、四分位値、頑健、四分位範囲、レンジチェック
全文
【問合せ先】
- 総務省統計研究研修所研究開発課