ここから本文です。
統計研究彙報 第67号 No.4
概要
タイトル
多変量外れ値の検出 〜MSD法とその改良手法について〜
著者
和田かず美
刊行年月
2010年3月
要旨
外れ値とは、データの大部分の傾向と異なるもので、必ずしも誤りとは限らないが、データ集計や分析の際にその存在が結果を歪ゆがめてしまう可能性がある。 外れ値の存在は標本平均や標本標準偏差の算出に影響を与えるため、これらの値を用いた外れ値検出は検出漏れを起こす危険性が高い。
外れ値の影響を受けにくいロバストな単変量の外れ値検出法の代表が、順序統計量である四分位数を用いる箱ひげ図だが、単変量の手法は対象となる変数が他の変数と関係がある場合の外れ値検出には適さない。多変量データには、MSD(Modified Stahel-Donoho)法のような多変量でロバストな外れ値検出法が必要となる。
本稿は、統計調査の製表業務における多変量外れ値検出法の適用を目的として、1993年からカナダの年次卸売・小売業調査(AWRTS)で実務に適用されたMSD法と、 2001〜2003年にEurostatが中心となってデータエディティング及び補定のための新手法の開発・評価を行ったEUREDITプロジェクトにおいて提案されたMSD法の改良版について比較評価し、実用化に向けた考察を行うものである。
キーワード:多変量外れ値検出、射影追跡法、MSD、Stahel-Donoho法(SDE)
全文
【問合せ先】
- 総務省統計研究研修所研究開発課