散布図

特徴

 散布図は、横軸と縦軸にそれぞれ別の量をとり、データが当てはまるところに点を打って示す(「プロットする」といいます。)グラフです。2つの量に関係があるかどうかをみるのに非常に便利なグラフです。
 散布図は、個々の要素に関して、2つの特性について観察して得たn組の変量を (x1, y1), (x2, y2), ..., (xn, yn) と表したとき、(xi, yi) を座標とする点をxy平面上に表したものと言い表せます。
 また、散布図でわかることは、2つの量の間に関係があるかということだけであり、因果関係(どちらかが原因となって、もう一方が起こる)を示すものではありません。注意点は、下方の相関関係と因果関係をご覧ください。

散布図の作り方

 あるクラスのテストの点数を散布図にして関係性をみてみましょう。
① エクセルに表を作成し、グラフ作成に必要な項目、数値を選択します。
 「表 理科と数学の成績」のように、表が複数に離れている場合は、全体をつなげた表に作成し直してから、全てのデータを選択する方法と、一部のデータを選択して散布図を表示させた後、離れた表のデータを追加する方法があります。表全体をつなげる場合は、この時点で表をつなげておきましょう。

表 理科と数学の成績

理科と数学の成績

② 画面上部にある「挿入」タブから「散布図またはバブルチャートの挿入」を選択し、適当なグラフを選択して散布図を表示させます。ここでは「散布図」を選択しています。

図 グラフの選択

グラフの選択

③ 一部のデータを選択して、散布図を表示させた後にデータを追加する場合は、表示された散布図のグラフエリアを右クリックして「データの選択」を選択し、編集をクリックして「系列の編集」表示させます。

図 データの選択1

データの選択

④ まず、系列X(理科の成績)のデータを追加していきます。
 系列Xの値を選択し、キーボードの「Ctrl」(コントロールキー)を押しながら、系列Xに追加するデータを選択します。系列Yも同様に行い、「系列の編集」画面、及び「データソースの選択」画面の「OK」をそれぞれクリックしていくとデータが追加されます。

図 データの追加2

データの追加2

⑤ グラフに表題や出典名などの必要事項を記載し、背景などのデザインを修正して、表を整理すれば完成です。
 関係性がありそうな分布があった場合は、その場所を枠で囲ったり、近似線を引くことで、要点がわかるグラフになります。

図 理科と数学の散布図

理科と数学の散布図

※仮想のデータを使用しています。

相関関係と因果関係

 上記「散布図の作り方」で作成した理科と数学の成績の散布図をみると、数学の成績と理科の成績には関係がありそうに見えます。しかも、数学の成績が良いと理科の成績も比例してよくなることから相関関係(どちらかの数値が増加(又は減少)すると、それに比例して他方の数値が増加又は減少する)があると思われます。
 しかし、ここで注意しなければならないのは、散布図で分かることは、2つの量の間に見た目の関係性があるかということだけであり、因果関係(どちらかが原因となって、もう一方が起こる)をも示すものではないということです。
 例えば、働いている人について、血圧と給料の関係を散布図に描いたとします。普通は、年齢が高い人ほど血圧が高く、また年齢が高いほど給料も高くなるので、「血圧と給料には関係があります」という散布図になります。しかし、このことから、「血圧を高くすると、給料が上がります」ということにはなりません。
 分析を行う際は、数値やグラフだけではなく、その背後となる理論や知識も総合して検討を行っていく必要があります。