現在の位置 :

アメリカ大統領選挙の番狂わせ(前編)〜 標本調査における偏り@

統計調査や世論調査においては、調べようとする対象(母集団)を漏れなく調査すること(全数調査・悉皆調査)はコストや時間などの制約から難しいことが少なくありません。このため、母集団の一部を標本(サンプル)として選び出して調査を行い、その結果から母集団全体の傾向を推察する標本調査(サンプル調査)によって行われることが一般的になっています。

Franklin D. Roosevelt

このような標本調査では、母集団の姿をできるだけ正確に反映する標本を抽出すること、つまり標本の「偏り」をできるだけ少なくすることがカギになります。今日までに何通りもの標本抽出の方法が考案され、実際に統計調査や世論調査で使われていますが、ここでは標本抽出の方法で明暗が分かれた1936年のアメリカ大統領選挙予測の例をご紹介します。

1936年のアメリカ大統領選挙は、「暗黒の木曜日」(1929年10月24日)に端を発した世界大恐慌、ヨーロッパ、アジアなどにおける世界的な政情不安の中、再選を目指す民主党のフランクリン・ルーズベルト候補と、共和党のアルフレッド・ランドン候補によって争われました。

Alfred Landon

ルーズベルト候補は、現職大統領とはいえ、保守的色彩が強く、大恐慌を食い止めるには力不足との評判から、再選の見込みはないと目されていました。実際、世論調査において当時最も信頼に足ると思われていた「リテラリー・ダイジェスト」(The Literary Digest)という総合週刊誌は、200万人以上を対象から回収した調査結果を基に共和党のランドン候補が57%の得票を得て当選することを予想していました。
これに対して、前年に世論調査の業界に参入したばかりのジョージ・ギャラップが率いる「アメリカ世論研究所」(the American Institute of Public Opinion)は、わずか3000という少ない対象者からの回答を基にルーズベルト候補が54%の得票を得て当選することを予想したのです。

リテラリー・ダイジェスト

リテラリー・ダイジェストはこれに先立つ5回の大統領選挙において予測を外したことがないという実績がある上に、回答を得た標本の数もギャラップ側とは文字どおりケタ違いです。11月の大統領選挙に先立って9月に行われたメーン州の選挙において共和党は勝利していました。過去の大統領選挙の結果からメーン州の結果は全米の結果を先取りするというジンクスがあり、それもリテラリー・ダイジェストの予測が正しいことを示しているようでした。人々は、小さなオフィスしか持たないギャラップの研究所が行った調査を笑いました。

しかし、最後に笑ったのはギャラップだったのです。実際の結果では、ルーズベルト候補が60%の得票を得て全米48州中46州を手にするという地滑り的に圧勝しました。リテラリー・ダイジェストが勝利を予想したランドン候補は、地元カンザス州でも敗れ、わずか2州(メーン州とバーモント州)で勝利したのみに終わりました。

なぜこのような大番狂わせが起こったのでしょうか。そのカギは両者の調査方法、特に標本抽出の方法にありました。

リテラリー・ダイジェストは、まず自誌の購読者−大恐慌の最中になお雑誌購読を続けられる裕福な人たち−を対象に、それから自動車保有者と電話利用者の名簿を使って1千万人もの対象者に郵便を送り、返送された2百万以上の回答をただ積み上げたのです。現代のアメリカなら事情は違うでしょうが、1930年代当時、自動車を保有したり、電話を利用できるのは平均的な収入を相当程度上回る人々に限られていました。
過去5回の大統領選挙では、豊かな人々と貧しい人々が同じような投票傾向だったため、リテラリー・ダイジェストの調査手法でも予想が外れることはありませんでした。しかし、大恐慌の収まらない不安定な時代に誰を大統領に選ぶのかという厳しい選択を迫られた1936年の選挙では事情が異なりました。比較的豊かな人々は共和党が推すランドン候補を、それほど豊かでない人々は民主党が推すルーズベルト候補をそれぞれ支持する傾向に分かれたのです。リテラリー・ダイジェストは、この標本の偏りに何の手も打ちませんでした。

これに対して、市場調査の経験を経て世論調査の世界に参入したギャラップは、市場調査の分野で時間をかけてテストが繰り返されてきた、標本の偏りをより少なくする科学的な抽出方法を用いたのです。その方法は、母集団全体(この場合は大統領選挙の投票権を持つ人の全体)を「収入中間層・都市居住者・女性」「収入下位層・農村部居住者・男性」のように互いに重ならないグループに分け、それぞれのグループに対して決まった割合で対象を抽出するというものです。このような方法(この方法を「割り当て法」といいます)をとることで、抽出された標本の姿は母集団により近いものとなり、結果としてギャラップ側はリテラリー・ダイジェストの1%にも満たない小さい標本から正しい結果を予測することができたのです。しかも、ギャラップは大統領選挙の4か月も前に、リテラリー・ダイジェストがランドン候補の勝利を予測するであろうこと、その予測は外れるであろうことを新聞で予言していました。

リテラリー・ダイジェストの標本抽出方法とギャラップの標本抽出方法

選挙予測を外したリテラリー・ダイジェストの評判は地に落ち、間もなくして経営が危うくなり他の雑誌社に吸収されてしまいました。一方で、ギャラップの世論調査は一躍にして政治のシーンで重きを置かれるようになり、1945年のイギリス総選挙においても、ほとんどの識者が現職首長ウィンストン・チャーチルが率いる保守党の勝利を予測する中、労働党の勝利を正しく的中させてみせました。(とはいえ、ギャラップも1948年の米大統領選挙では民主党のトルーマン候補の勝利を読み切れず予測を外しています。これについては後編を参照してください。)

George Gallup

世論調査や標本抽出の方法とは関係ありませんが、ジョージ・ギャラップは統計を引き合いにした面白いセリフを残しています。
I could prove God statistically. Take the human body alone - the chance that all the functions of the individual would just happen is a statistical monstorosity.
少し意訳すると「私は神の存在を統計的に証明できる。人間の身体を見てみたまえ−ひとりの身体に備わるすべての機能がそのように(見事に調和したものとして)作られているということは(神が存在しないとしたら)統計的にはありえないほどの途方もないことである」といったところでしょうか。
神の存在が証明できるかどうかはともかく、人類の進化の過程を振り返るとき、ギャラップのいうとおり統計的には奇跡としか思えない偶然が積み重なってきたのかもしれません。