ここから本文です。
統計研究彙報 第71号 No.3

様々な多重代入法アルゴリズムの比較 〜大規模経済系データを用いた分析〜

高橋 将宜、伊藤 孝之

2014年3月

欠測データの対処法としてRubin(1978、1987)によって提唱された多重代入法(Multiple Imputation)は、ベイズ統計学の枠組みで構築され、マルコフ連鎖モンテカルロ法(MCMC: Markov chain Monte Carlo)に基づいていた。しかし、事後分布からの無作為抽出の実装は難しく、計算アルゴリズムに関しては議論の余地があり、近年、MCMCの代替法として2つのアルゴリズムが提唱されている。完全条件付指定(FCS: Fully Conditional Specification)とEMB(Expectation-Maximization with Bootstrapping)アルゴリズムである。現時点において、いずれのアルゴリズムがどのような状況において優れているのかは不明である。本稿では、様々な多重代入法アルゴリズムのメカニズムを示し、経済センサス‐活動調査の速報データとシミュレーションデータを用い、公的経済統計における欠測値補定に関して、いずれのアルゴリズムが優れているかを検証する。
キーワード: 経済調査、経理項目、欠測値(欠損値)、補定、多重代入法(Multiple Imputation)、R、EMB、FCS、MCMC、Amelia、MICE、NORM、SAS、SOLAS、SPSS

【問合せ先】
- 総務省統計研究研修所研究開発課