なるほど統計学園高等部 > 統計の作成・分析 > 統計を学ぶ上で必要な基礎数学
統計を学ぶ上で必要な数学

平均値

算術平均(一般的に言われる平均値)

 平均値は変量を全て加えて、データ数で割ったものです。変量 :x1,x2,x3,…,xnと するとき、平均値エックスバー(エックスバー)を式で表すと下のようになります。

平均値の式

 例)3年E組の平均登校時刻を求めるとします。この場合、それぞれの登校時刻を、例えば7時を基準として何分後になるかに換算し、それを変量として和を求め、総人数(38人)で割ります。

平均登校時刻を求める式

度数分布表から平均値を求める計算方法

 度数分布表からでも階級値(代表値ともいいます。)と度数を用いて平均値を求めることができます。階級の数をk、階級値m1,m2,…,mkに対する度数f1,f2,…,fk(ただし、数式nは変量のデータ数)とします。そしてそれぞれの階級値と度数の積階級値と度数の積を考えます。これをまとめたものが、以下の表です。

度数分布表から平均値を求める計算方法

 このとき、平均値は次の計算式で表されます。

平均値の計算式

加重平均

 各変量の"重み"を加味した平均の事で、100人の集団の平均値と10人の集団の平均値を合計して110人の平均値を算出する場合、単純に各集団の平均値の算術平均をとると誤った計算となってしまいます。この場合は各集団の人数を重みとして加重平均を使用します。
 変量 :x1,x2,x3,…,xnに対する変量の加重(重み) : w1,w2,w3,…,wnとするとき、加重平均エックスバーは、

加重平均の数式

となります。

 例)数学のテストを行ったところ、A組の平均点が63点、B組の平均点が84点でした。A組の生徒数は30人、B組の生徒数は40人とすると、両クラスの生徒全員の平均点を求めましょう。
 両クラス合計70人の平均点を考える場合、63点が30人、84点が40人と置き換えることができるので、以下のとおりとなります。

平均点を求める数式

A. 75点

幾何平均(相乗平均)

 かけ算で変化していくような(例:預金の利子率など)変量の、平均の変化率を求めるには幾何平均(相乗平均ともいいます。)を用います。変量 :a1,a2,a3,…,anのとき、幾何平均幾何平均m_Gの式は以下のとおりとなります。

幾何平均=各変量の積の累乗根

 (aのn乗根は、aのn乗根を表します。n=2のときはnを省略して√aと表すこともでき、aの平方根(ルートa)となります。)
 例)ある企業の年間の売上高が対前年度比で1年後に5%、2年後には10%に上昇しました。この企業の年間売上高の平均上昇を求めます。初年度の売上をAとすると1年後の売上高はA×1.05、2年後の売上高はA×1.05×1.1となるので、年間の平均上昇率は、以下のとおりとなります。

幾何平均を求める公式

A. およそ 7%

調和平均

 変量 :x1,x2,x3,…,xnとすると、変量の逆数の算術平均を求め、さらにその逆数をとったものを調和平均といい、下の式で表します。

調和平均の数式

 例)家から学校までを往復するのに、行きは時速6kmで走り、帰りは時速4kmで歩きました。この時の往復の平均時速を求めます。 往復の距離2dを往復にかかった時間t(=d / 6 + d / 4)で割るので、以下のとおりとなります。

往復の平均速度を求める数式

A. 時速 4.8km

中央値(メディアン)

 中央値とは変量を昇順か降順に並べて、ちょうど真ん中にきた変量を表します。

 例)2、5、8、13、31の中央値は8となります。

 変量の個数が偶数のときは真ん中の2つの値を足して2で割った値になります。

 例)2、5、8、13の中央値は(5 + 8) / 2 = 6.5となります。

最大値、最小値、範囲

 変量 :x1,x2,x3,…,xnの中で最大の値を最大値(max)、最小の値を最小値(min)といいます。最大値と最小値の間を範囲(レンジ)といいます。
 例)変量xが1、2、2、3、4、4、9、10、11のとき、最小値、最大値、範囲は以下のとおりです。

最小値と最大値と範囲

最小値:1、最大値:11
範囲:最大値 - 最小値 = 11 - 1 = 10

偏差

偏差の図

各変量各変量と平均エックスバーの差差を偏差といいます。


 例)x1=6,x2=4,x3=8,・・・,x9=9で、これらの変量の平均が5であれば、x1の偏差は1、x2の偏差は-1、x3の偏差は3、x9の偏差は4となります。

分散

分数の図

 各偏差を2乗して全て加えたのち、データ数で割ったものを分散s2乗といいます。偏差を2乗しているので、全体の散らばりを見ることができます。

 変量 :x1,x2,x3,…,xnとするとき、分散は

分散の数式

となります。

標準偏差

 分散は各変量の偏差を2乗した値の平均をとっているため、その数値は元のデータとは次元が異なったものとなっています。そこで、もとの変量と次元をそろえるため、分散の正の平方根を取り、その値を標準偏差sと言います。
 変量 :x1,x2,x3,…,xnとするとき、その標準偏差は

標準偏差の数式

 となります。

 また、変量xの取るn個の値の中で、x1f1個、x2f2個…、xnfn個あるとき、標準偏差sは、

標準偏差sを求める数式

 となります。

2つの変量の関係

相関係数

 相関係数とは、2つの変量がどのような関係性を持っているかを分析する方法の一つとして、比例的な関係性を数値で示したものです。
 2つの変量の組を二つの変量の組とし、エックスバーワイバーはそれぞれの平均とすると、相関係数r

相関係数の式

 となります

 相関係数rは共分散共分散の数式xの標準偏差xの標準偏差sxの数式yの標準偏差標準偏差syの数式割ったものです。

散布図

 2つの変量の関係を図で表すとき、横軸と縦軸にそれぞれ別の変量をとり、データが当てはまるところに点を打って示した図を散布図といいます。

 2つの変量の組を2つの変量の組としたとき、座標を座標とする点を平面上に表すことで、変量の分布や変量の相関関係を分かりやすく示すことができます。

回帰直線

 調査や測定によって得られたデータ(実測値)には理論値との差「ばらつき」があります。これらの変量について最も「ばらつき」が少なくなる直線(一次関数)の式を回帰直線といいます。

 2つの変量の組を2つの変量の組Xの標準偏差sxYの標準偏差をsyXYの相関係数をrxy、回帰直線の式を回帰直線の式とすると、
 回帰直線の傾きa

回帰直線の傾きを表す式

 また、切片b

切片bの式

となります。

▲ ページのトップへ

Copyright © 2013 総務省 統計局 All rights reserved.

〒162-8668 東京都新宿区若松町19-1 TEL 03-5273-2020(代)