ここから本文です。

キーワード編 〜知っておきたい基本用語

データ利活用やEBPM推進時に知っておきたい基本概念や本サイト内で使用された用語・統計手法などを解説します。

EBPM関連

EBPM開く

Evidence Based Policy Makingの略で、「証拠に基づく政策立案」と訳される。
政策目的を明確化したうえで、その目的のために効果が上がる行政手段を合理的根拠(エビデンス)に基づき企画立案すること。統計データは、エビデンス(証拠)のうちでも重要なものであり、EBPMの推進に統計データの利活用が注目されている。

閉じる
エビデンス開く

「証拠・根拠」を意味する。Evidence。
医療の分野で生まれた「エビデンスに基づく」(医師の個人的経験や慣習などに依存するのではなく、治療法が科学的に検証された臨床結果などに基づいて医療を実践する)という考え方をもとに提唱されたEBM(Evidence Based Medicine:証拠に基づく医療)が1990年代から急速に普及し、政策立案の分野でも導入されたのがEBPMである。エビデンスには、弱いものから強いものまでいくつかのレベルがある。

エビデンスのレベル(出典 株式会社データビークル)
閉じる
ランダム化比較試験(Randomized Controlled Trial)開く

RCTと略される。ランダム化比較実験という場合もある。
治療などの介入効果を科学的に分析・推論する手法。対象者をランダムに2グループに分け、ある政策手段の対象とするグループ(介入群)と対象としないグループ(比較対照群)間の比較を行い、政策効果の分析・推論を行う。
他の条件の介在を排除するため、グループ分けをランダムに行うこと以外にも、対象者自身にもどちらのグループかわからないようにするなど、厳密性の確保のための条件設定が必要とされる。その他、コスト面、倫理面の問題もあるが、RCTが実施できれば政策効果をわかりやすく示せるメリットは大きい。

閉じる
PPDACサイクル開く

問題を解決するためのフレームワークの一つ。統計やデータを活用し、科学的・協働的に問題を解決する際に威力を発揮する。問題解決のプロセスをProblem(問題)、Plan(計画)、Data(データ)、Analysis(分析)、Conclusion(結論)の5つのフェーズに分け、各フェーズの頭文字をつなげたもの。統計教育で取り上げられることも多い。
ちなみに、業務改善に使われることの多いPDCAサイクルは、Plan(計画)、Do(実行)、Check(評価)、Act(改善)の頭文字をつなげたものである。

PDCAサイクルの図
閉じる
ロジックモデル開く

最終的に目指すゴールの実現に向けた論理的な道筋(ロジック)を、体系的にかつ簡潔に図示化(モデル)したもの。EBPMにおいては、そのロジックが数値化された指標により裏付けられることも重要である。

ロジックモデルの図
閉じる
ロジックツリー開く

問題解決に使うツールの一つ。論理的に(ロジック)考えるために、樹木のように(ツリー)分解することから、ロジックツリーと呼ばれる。問題の要因を広く深く具体的に掘り下げて分解し、階層ごとに整理する。全体構造やメカニズムを把握することで、解決策を模索しやすい、仮説を立てやすくなるなどの利点がある。さらにアクションに向けた優先順位をつけやすくなる場合もある。

ロジックツリーの例(滋賀県・平成30年度 EBPMモデル研究事業 報告書より)
閉じる

統計関連

ミクロデータ開く

統計調査において、集計される前の個々のデータのこと。調査票情報ともいう。一方、e-Stat等で公開されている集計後の統計データを「統計マクロデータ」と呼ぶこともある。
ミクロデータ活用により、新たな側面の分析を行うことができるため、今後の利活用が期待される。

閉じる
e-Stat(イー・スタット)開く

政府統計の総合窓口e-Statは、政府統計のポータルサイト。各府省等が公表する統計データを一つにまとめ、統計データの検索・グラフ化・ダウンロードや、地図上に表示できるなど、統計を利用する上で、たくさんの便利な機能を備えている。各府省等の参画の下、総務省統計局が整備し、独立行政法人統計センターが運用管理を行う。

閉じる
GIS開く

地理情報システム(Geographic Information System)の略称。地理情報と付加情報をコンピューターの地図上に可視化して、情報の関係性やパターン、傾向を示すシステムをいう。
統計情報と組み合わせた統計GISの例として、「地図で見る統計(jSTAT MAP)」がある。統計地図を作成するだけでなく地域分析が可能になる各種機能がそろっている。

閉じる
全数調査と標本調査開く

統計調査で母集団全数を調べるものを全数調査という。悉皆(しっかい)調査、センサスともいう。一方、母集団から無作為に抽出された一部(標本、サンプル)を調べ、全体を推計する調査を標本調査という。
公的統計の全数調査の例としては、「国勢調査」と「経済センサス-活動調査」があげられる。大量のコストや時間がかかるため、全数調査は一部の統計調査に限られる。

全素調査と標本調査
閉じる
記述統計と推測統計開く

統計学は、記述統計と推測統計の2つに大別できる。
記述統計は、データの特徴を明らかにすることを目的とする。身近な例では、表やグラフで表す、平均や分散、相関係数を求めるなどがこれにあたる。一方、推測統計は、データから母集団の特性を推測することを目的とする。
全数調査ができれば、記述統計だけで母集団の全容が明らかになるが、必ずしも全数調査ができるとはいえない。標本調査を行い、記述統計によって標本の特徴をつかみ、推測統計により母集団の特性を推測する。

記述統計と推測統計の統計手法
閉じる
相関分析開く

相関係数を計算し、2つのデータの関係を分析すること。相関係数の主な特徴は以下のとおりである。
【相関係数の特徴】
(1)-1から+1までの範囲の値をとる。
(2)正の場合を「正の相関」、負の場合を「負の相関」という。
(3)相関係数の絶対値が1に近いほど「強い相関」があるといい、0に近いほど「弱い相関」となる。

散布図と相関係数の関係

なお、相関係数は直線状の関係を測る尺度のため、2変数間の関係が直線状でない場合はその強さを適切に測ることはできない。相関係数の値だけに頼るのではなく、散布図を描いてみることが重要である。

また、相関関係と因果関係は全く異なる概念であることに注意が必要。因果関係は、原因と結果の関係を表すものだが、相関関係は、2つの変数の動きに関連性を示す概念であり、2つの変数は対等な立場にある。相関係数の値が大きいからといって、2つの変数に因果関係があるわけではない。

閉じる
主成分分析開く

たくさんの変数があるときに、より少ない指標や合成変数(主成分)に要約する手法。この要約は「次元の縮約(圧縮)」と呼ばれる。
例えば年収や人口など、単位の異なる多様なデータがもつ情報量をできるだけ損なわずに情報の次元を圧縮する。また,5教科の得点を,理系と文系の指標に縮約したり,多数の体力測定の結果を,走力,跳力,持久力などの指標に圧縮することもできる。
元のデータを情報量の大きい方向から捉えるように、「主成分」と呼ばれる合成変数に縮約することで、すべての変数の相対的な関係を定量的に把握できるのが特徴である。

閉じる
回帰分析開く

結果となる数値と要因となる数値の関係性を数式モデルで表す手法。結果となる数値を「目的変数」、要因となる数値を「説明変数」という。説明変数が1つの場合は「単回帰分析」、2つ以上の場合は「重回帰分析」という。
回帰分析によって事象の検証や予測、要因分析などを行うことができる。推計の精度は、「決定係数」と呼ばれる指標によって計ることができる。回帰分析は、表計算ソフト(Microsoft社Excel)のアドイン分析ツールでも行える。

閉じる

監修:滋賀大学データサイエンス学部教授 杉本知之

サイトマップ
ページ上部へ アンカーのアイコン画像