アメリカ大統領選挙の番狂わせ(前編)標本調査における偏り1

 統計調査や世論調査においては、調べようとする対象(母集団)を漏れなく調査すること(全数調査・悉皆調査)はコストや時間などの制約から難しいことが少なくありません。このため、母集団の一部を標本(サンプル)として選び出して調査を行い、その結果から母集団全体の傾向を推察する標本調査(サンプル調査)によって行われることが一般的になっています。

 このような標本調査では、母集団の姿をできるだけ正確に反映する標本を抽出すること、つまり標本の「偏り」をできるだけ少なくすることがカギになります。今日までに何通りもの標本抽出の方法が考案され、実際に統計調査や世論調査で使われていますが、ここでは標本抽出の方法で明暗が分かれた1936年のアメリカ大統領選挙予測の例をご紹介します。

 1936年のアメリカ大統領選挙は、「暗黒の木曜日」(1929年10月24日)に端を発した世界大恐慌、ヨーロッパ、アジアなどにおける世界的な政情不安の中、再選を目指す民主党のフランクリン・ルーズベルト候補と、共和党のアルフレッド・ランドン候補によって争われました。

Franklin D. Roosevelt

 

Alfred Landon

 

 ルーズベルト候補は、現職大統領とはいえ、保守的色彩が強く、大恐慌を食い止めるには力不足との評判から、再選の見込みはないと目されていました。実際、世論調査において当時最も信頼に足ると思われていた「リテラリー・ダイジェスト」(The Literary Digest)という総合週刊誌は、200万人以上を対象から回収した調査結果を基に共和党のランドン候補が57%の得票を得て当選することを予想していました。

 これに対して、前年に世論調査の業界に参入したばかりのジョージ・ギャラップが率いる「アメリカ世論研究所」(the American Institute of Public Opinion)は、わずか3000という少ない対象者からの回答を基にルーズベルト候補が55.7%の得票を得て当選することを予想したのです。

 リテラリー・ダイジェストはこれに先立つ5回の大統領選挙において予測を外したことがないという実績がある上に、回答を得た標本の数もギャラップ側とは文字どおりケタ違いです。11月の大統領選挙に先立って9月に行われたメーン州の選挙において共和党は勝利していました。過去の大統領選挙の結果からメーン州の結果は全米の結果を先取りするというジンクスがあり、それもリテラリー・ダイジェストの予測が正しいことを示しているようでした。人々は、小さなオフィスしか持たないギャラップの研究所が行った調査を笑いました。

 しかし、最後に笑ったのはギャラップだったのです。実際の結果では、ルーズベルト候補が60%の得票を得て全米48州中46州を手にするという地滑り的に圧勝しました。リテラリー・ダイジェストが勝利を予想したランドン候補は、地元カンザス州でも敗れ、わずか2州(メーン州とバーモント州)で勝利したのみに終わりました。

 

 なぜこのような大番狂わせが起こったのでしょうか。そのカギは両者の調査方法、特に標本抽出の方法にありました。

 リテラリー・ダイジェストは、まず自誌の購読者-大恐慌の最中になお雑誌購読を続けられる裕福な人たち-を対象に、それから自動車保有者と電話利用者の名簿を使って1千万人もの対象者に郵便を送り、返送された2百万以上の回答をただ積み上げたのです。現代のアメリカなら事情は違うでしょうが、1930年代当時、自動車を保有したり、電話を利用できるのは平均的な収入を相当程度上回る人々に限られていました。

 過去5回の大統領選挙では、豊かな人々と貧しい人々が同じような投票傾向だったため、リテラリー・ダイジェストの調査手法でも予想が外れることはありませんでした。しかし、大恐慌の収まらない不安定な時代に誰を大統領に選ぶのかという厳しい選択を迫られた1936年の選挙では事情が異なりました。比較的豊かな人々は共和党が推すランドン候補を、それほど豊かでない人々は民主党が推すルーズベルト候補をそれぞれ支持する傾向に分かれたのです。リテラリー・ダイジェストは、この標本の偏りに何の手も打ちませんでした。

 これに対して、市場調査の経験を経て世論調査の世界に参入したギャラップは、市場調査の分野で時間をかけてテストが繰り返されてきた、標本の偏りをより少なくする科学的な抽出方法を用いたのです。その方法は、母集団全体(この場合は大統領選挙の投票権を持つ人の全体)を「収入中間層・都市居住者・女性」「収入下位層・農村部居住者・男性」のように互いに重ならないグループに分け、それぞれのグループに対して決まった割合で対象を抽出するというものです。このような方法(この方法を「割り当て法」といいます)をとることで、抽出された標本の姿は母集団により近いものとなり、結果としてギャラップ側はリテラリー・ダイジェストの1%にも満たない小さい標本から正しい結果を予測することができたのです。しかも、ギャラップは大統領選挙の4か月も前に、リテラリー・ダイジェストがランドン候補の勝利を予測するであろうこと、その予測は外れるであろうことを新聞で予言していました。

 

 選挙予測を外したリテラリー・ダイジェストの評判は地に落ち、間もなくして経営が危うくなり他の雑誌社に吸収されてしまいました。一方で、ギャラップの世論調査は一躍にして政治のシーンで重きを置かれるようになり、1945年のイギリス総選挙においても、ほとんどの識者が現職首長ウィンストン・チャーチルが率いる保守党の勝利を予測する中、労働党の勝利を正しく的中させてみせました。(とはいえ、ギャラップも1948年の米大統領選挙では民主党のトルーマン候補の勝利を読み切れず予測を外しています。これについては後編を参照してください。)

 世論調査や標本抽出の方法とは関係ありませんが、ジョージ・ギャラップは統計を引き合いにした面白いセリフを残しています。

 I could prove God statistically. Take the human body alone - the chance that all the functions of the individual would just happen is a statistical monstorosity.

 少し意訳すると「私は神の存在を統計的に証明できる。人間の身体を見てみたまえ-ひとりの身体に備わるすべての機能がそのように(見事に調和したものとして)作られているということは(神が存在しないとしたら)統計的にはありえないほどの途方もないことである」といったところでしょうか。

 神の存在が証明できるかどうかはともかく、人類の進化の過程を振り返るとき、ギャラップのいうとおり統計的には奇跡としか思えない偶然が積み重なってきたのかもしれません。

George Gallup

 

【参照した文献】
吉田洋一・西平重喜(1956)『世論調査』岩波新書
西平重喜(1997)『-25周年記念特集号-世論調査外史』一般社団法人 新情報センター

存在しない調査の伝説

 リテラリー・ダイジェストが200万人以上の大規模な調査結果から予測に失敗し、ギャラップはわずか3000人調査で予測に成功したという伝説ですが、近年の研究では、そのような調査は存在しないということが分かってきました。

 8月にリテラリー・ダイジェストの選挙予測調査が始まる前、7月の時点でギャラップは新聞社に「ダイジェストがいま調査したら、ルーズベルトが44%、ランドンが56%くらいになる」というコラムを送付し、新聞社が独自取材も加えて記事にしました。

 実際にダイジェストの予測数値が出ると、ギャラップの予言は約1ポイントの差異で的中していました。「ダイジェストが、このような数値を出して予測に失敗する」という予言が的中したこの結果は、大きな衝撃を与え、ギャラップの名声が残りました。

 ギャラップは、ダイジェストの失敗を予測するのに3000人調査を実施しています。この3000人という数値がギャラップが実施した選挙予測結果と混同され、さまざまなテキストに書かれ、日本で広く伝搬したものだと思われます。そもそも、この3000人をどのように抽出したのか、疑問は残されたままです。

 実際には、ギャラップの選挙予測調査の標本サイズは30万人前後で、投票日までに11回程度調査されたようです。

【出典】
鈴木督久(2021)『世論調査の真実』 日経BP 日本経済新聞出版本部