ここから本文です。

EBPM入門

「西内啓」の写真の画像

EBPM入門


株式会社データビークル 取締役 西内啓

医学の世界で生まれた「エビデンス」という概念は、教育・経営の分野にまで広がりを見せています。自分たちの経験、勘、あるいは有識者の意見だけで意思決定をすることと、エビデンスに基づいて判断することとは、何が違うのでしょうか。

動画を再生

動画はYouTube統計局動画チャンネル(外部サイト)でご覧いただけます。

そもそもエビデンスとは何なのか

EBPM(証拠に基づく政策立案)の取り組みが推進されており、国はもちろん地方公共団体においても、統計データの利活用が注目されている。そもそもエビデンスとはどういったものなのか、EBPMとは何なのか、医療統計や統計学に詳しい西内啓氏に話を伺った。

3つのポイント

  1. 経験や勘だけでなく、データを適切に分析して客観的に意思決定することが重要
  2. 「エビデンス」には強いものから弱いものまで、複数のレベルがある
  3. まずは既にあるデータを二次利用することから始めるのがおすすめ

医療の世界で生まれた「エビデンス」

「エビデンス」に基づくとはどういうことですか?

 元々これは、医療の世界で生まれた考え方です。いわゆる経験と勘とロジカルシンキングですべてを決めようという従来の医療の考え方に加えて、ちゃんとデータを取る、そしてそれを適切に分析した結果に基づいて意思決定をするということがより正しい判断に繋がる、というような考え方です。

 元々は1991年に、初めて公的な文献の中で「エビデンスに基づく医療」、「根拠に基づく医療」という考え方が生まれました。その背景にあった大きな転換点として1989年のCAST studyと言われる研究があります。急性心筋梗塞の方が、そこから一命を取り留めた後にも不整脈で亡くなっているということが経験上知られており、「じゃあ不整脈を止める薬を使えばいい」というのが医療における一般的な治療の選択肢でした。しかし、その1989年に発表された論文の中で、実際にこの不整脈の薬にはどれくらい効果があるのかということを、ちゃんと正確に検証しようとした方がいらっしゃったんです。

図1 医学でエビデンスが必要になった理由 CAST studyの研究より
図1 医学でエビデンスが必要になった理由 CAST studyの研究より

 その研究では1,400人の研究参加者を700人ずつランダムに半々に分けます。ランダムに分けているということは、こちらの方が男性が多いとか、こちらの方が高齢者が多いとか、重傷の方が多いということはなくて、概ね均等なグループになると考えることができます。

 このランダムに分けた状態で、片方のグループには当時一般的に使われていた不整脈の薬を使い、もう一方のグループには本来何の効果もないはずのダミーの薬を使い、結果としてどれ位の差がつくか、が、おそらく正確な因果関係の実証になるだろうという考え方です。その結果、実際効くであろうと言われていた不整脈の薬を使った方々のほうが、死亡率が大体3%〜5%ほど、高くなってしまいました。
 そうすると、いくらロジカルに正しかったとしても、経験上正しいと言ってる人がいたとしても、実際にちゃんとデータを取ると、「こちらのグループの死亡率が高い」「自分たちは(この薬を)使われたくない」というように、きちんとデータを取りそして分析をするということによって正しい判断が出来る、それが医療に於ける「エビデンスに基づく」という考え方になっています。

どんな分野でエビデンスに基づいた課題解決がおこなわれていますか?

 医療の分野で生まれた「エビデンスに基づく」という考え方は、医療の世界では1990年代から急速に普及し、それが色々な分野に波及しています。

 例えば代表的な例として、教育の分野というものが挙げられます。2002年に、ブッシュ政権の下で「落ちこぼれゼロ法」という風に訳される、教育の格差をどんどん小さくし、子供達のリテラシーを上げていく、教育の改革を進めるための法律が制定されました。その中には「エビデンスに基づく」という言葉が100回以上登場しています。つまり、ちゃんとデータを取り、何となく経験や勘で判断するのではなく、ちゃんと教育の効果が上がると実証されたプログラムに対して集中的に推進してくことが、その法律の意図になっています。

 それ以外には、例えばいわゆるアフリカの貧困を無くす、といった開発経済の世界でも「こういった援助をすればこの地域の経済状態が良くなるんじゃないかな?」(と勘や経験に頼るの)ではなく、ちゃんとデータを取って、そして適切に分析することで、良かれと思ってやったことが実は悪影響だったということも知られてくるようになり、対策をきちんと考えていこうという考え方も生まれています。

 また、身近なところでは、防犯や刑事司法という分野で、「刑事の勘でこの辺りを集中的に警備すればいいんじゃないかな?」ということではなくて、どのような地域で、どういった犯罪が起きているかといったデータをちゃんと取り、そして集中的にその地域の防犯を進めることで、本当にそれは実際に効果があったのかどうかを検証しようとか、そういったことを通して治安を良くしていこうという取り組みも世界中で行われています。

専門家が言うエビデンス

「エビデンス」って具体的には何ですか?

 日常会話で「エビデンスを残してください」という話になるときは、書面・覚書といった意味で使われますが、専門家が使うエビデンスというのはこれとは全く違う意味になってきます。
 それは何かというと、実は一言で言うことはちょっと難しいのですが、エビデンスというのは大きく分けて4段階か5段階ぐらいに分かれるものになっています。

図2 エビデンスは大きく4段階か5段階ぐらいに分かれる
図2 エビデンスは大きく4段階か5段階ぐらいに分かれる

 例えば「権威の意見」というのもエビデンスではあります。けれども、それは信頼しすぎてはいけないという考え方があります。おそらく行政の中でも有識者会議を開いて、そして専門家の人に来ていただき、「私の経験ではこうだ」という意見を求めたりすることはしばしばあると思いますが、実はこれはエビデンスとしては一番弱いエビデンスです。それ以外にも例えば、動物実験の結果であったりとか、何か学術的な理論であったりとかというのも、実は弱いエビデンスになります。

 それよりも少し強いエビデンスは、とにかく事例で語れという考え方になります。一人でもいいから、一例でもいいから、本当にそういういったことがあったのか、そのケースを探してそれを事実として提示するほうが、より強いエビデンスと考えることができます。ただ、その事例はもしかしたら特殊な例かもしれないということを考えた場合、当然、一つの事例や一人の証言ではなくて、それを何十人・何百例と集積していったほうが、より強いエビデンスになります。

 これがいわゆるデータを集めて分析しよう(調査データの分析)という考え方になっており、そうすると「一例だけでは特殊かもしれないが、何十例・何百例と集めて、その結果こういう傾向が出てきた」という話であれば、それはより強いエビデンスであると考えられます。これがエビデンスの中で、データを重視しようという考え方の背景にあるものです。

 ただ、これで終わりではありません。こうしたやり方を観察研究という表現をしたりしますが、既存のデータを調査して集めてきたというだけでは、意外と因果関係を実証するのが難しい場合があります。例えば、特定の学校に入ったかどうかで「その後の所得が高くなりましたよ」と言われても、それは学校の違いなのか、それとも学校に入ってくる子供たちの層が違うのかは分かりません。元々、将来出世しそうな子が入ってきているだけで、実は学校は何もしていなくても卒業生がすごいキャリアを歩めるかもしれません。そのため、そういったことをちゃんと実証しようとした場合、次の「ランダム化比較実験」というものがより強いエビデンスになります。

 これは先ほど申し上げた不整脈の薬の効果を実証するときと同じロジックですが、例えば子供が受けた教育によってどれくらいその後の人生が変わるかという因果関係を調べたい場合、とにかくランダムに子供を、こっちの教育に参加する人、こっちの教育に参加する人、と分けて実証します。そうするとランダムに十分な数を分けることで、こちらは男の子が多いとか、こちらは優秀な子が多いということにならずに、ほぼ均等なグループになります。その状況で、唯一違う受けた教育プログラムの内容によって、どれくらいの差が生じるのかを考えた場合、この教育プログラムが「原因」で、その後の実際のキャリアが「結果」として、因果関係の実証がより正確にできます。

 これがかなりエビデンスとしては強いものですが、さらに強いエビデンスは、こうしたランダム化比較実験の結果や、あるいは観察研究、そういったデータを集めて分析したもの、過去に色々な世界中で行われてきた研究を集積し、そしてその分析結果に対する分析という意味である「メタアナリシス」をやった結果が、基本的には最も強いエビデンスと考えられています。そうしたメタアナリシスの結果、十分に信頼できるような結果が出てきたということであれば、それは科学者のコミュニティの中で「こういう風に考えた方が良い」という合意が概ね形成された状態になります。

これからのEBPMへの期待を教えてください。

 行政の皆さんの中には、これからEBPMということで何か新しくビッグデータをたくさん集めなきゃいけないんじゃないかと、危惧しているような方もいらっしゃいました。しかし、せっかく公的統計というこれだけたくさんのデータが集積されていて、それを実際に使うことも出来ますので、先ほど言った観察研究、つまり調査したデータを分析しよう、そこから何かを見つけていこう、といったことは(データの)二次利用という形で行ったほうが、おそらく効率的だと思います。せっかく素晴らしいデータをたくさん取っているので、まずそこの活用から始めていくと良いでしょう。そしてそこから「こういった政策が必要なんじゃないかな」というアイディアが得られたら、可能な限り早く実証研究を考えていくのが良いと思います。

 可能な限り「ランダム化比較実験」をした方が正確な因果関係というのが取れますが、それが難しいという状況であれば「自然実験」というやり方で代替することもできます。自然実験というのは行政区の境目で自分たちの自治体の中で新しい政策をします。そして基本的にほぼ変わりがないであろう行政区の外側(隣の自治体)で、まだ新しい取り組みがやられていない期間に、どういった違いが出てくるかという傾向を見て、ちゃんとデータを取っていくことで、政策効果が見込めるかどうかということが検証出来ると思います。

 そしてランダム化比較実験よりも強いというエビデンス、メタアナリシスというのを自分たちでやるのはちょっと大変なのですが、例えばGoogle Scholar(グーグル・スカラー)という、科学的な文献を分野を問わずに、重要そうなものを検索すればすぐに見つけられるサイトがあります。そこでメタアナリシスという言葉、そして自分たちの興味のある政策課題というのを入れていただくと、一体どのような研究が過去に行われているかということを、だれでも探すことが出来ます。

 そして、多くの文献は英語で書かれていますけれども、英語が苦手な方でも、最近は自動翻訳がどんどん精度が上がっていますので、是非、検索結果の文章を恐れることなく自動翻訳にかけてみるとよいでしょう。日本語で見たときに「あっ、こういう政策が効果があるんだな」「特にこういった集団に対して効果が強く出るんだな」ということを踏まえると、恐らく自分たちの経験、勘、あとは有識者の意見だけで決めるよりも、より筋の良い政策を見つけることが出来ると思います。

 せっかく世界中の研究者がたくさんのエビデンスを積み重ねてくれているので、是非活用して社会をどんどん良くしていただければなと思います。

プロフィール

株式会社データビークル 取締役 西内啓 にしうちひろむ

東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月より株式会社データビークルを創業。自身のノウハウを活かした拡張アナリティクスツール「dataDiver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事。著書に『統計学が最強の学問である』、『統計学が日本を救う』(中央公論新社)などがある。日本プロサッカーリーグ(Jリーグ)アドバイザー。

サイトマップ
ページ上部へ アンカーのアイコン画像