平均値は変量を全て加えて、データ数で割ったものです。変量 :と するとき、平均値
(エックスバー)を式で表すと下のようになります。
例)3年E組の平均登校時刻を求めるとします。この場合、それぞれの登校時刻を、例えば7時を基準として何分後になるかに換算し、それを変量として和を求め、総人数(38人)で割ります。
度数分布表からでも階級値(代表値ともいいます。)と度数を用いて平均値を求めることができます。階級の数を、階級値
に対する度数
(ただし、
は変量のデータ数)とします。そしてそれぞれの階級値と度数の積
を考えます。これをまとめたものが、以下の表です。
このとき、平均値は次の計算式で表されます。
各変量の"重み"を加味した平均の事で、100人の集団の平均値と10人の集団の平均値を合計して110人の平均値を算出する場合、単純に各集団の平均値の算術平均をとると誤った計算となってしまいます。この場合は各集団の人数を重みとして加重平均を使用します。
変量 :に対する変量の加重(重み) :
とするとき、加重平均
は、
となります。
例)数学のテストを行ったところ、A組の平均点が63点、B組の平均点が84点でした。A組の生徒数は30人、B組の生徒数は40人とすると、両クラスの生徒全員の平均点を求めましょう。
両クラス合計70人の平均点を考える場合、63点が30人、84点が40人と置き換えることができるので、以下のとおりとなります。
A. 75点
かけ算で変化していくような(例:預金の利子率など)変量の、平均の変化率を求めるには幾何平均(相乗平均ともいいます。)を用います。変量 :のとき、幾何平均
の式は以下のとおりとなります。
(は、aのn乗根を表します。n=2のときはnを省略して
と表すこともでき、aの平方根(ルートa)となります。)
例)ある企業の年間の売上高が対前年度比で1年後に5%、2年後には10%に上昇しました。この企業の年間売上高の平均上昇を求めます。初年度の売上をAとすると1年後の売上高はA×1.05、2年後の売上高はA×1.05×1.1となるので、年間の平均上昇率は、以下のとおりとなります。
A. およそ 7%
変量 :とすると、変量の逆数の算術平均を求め、さらにその逆数をとったものを調和平均といい、下の式で表します。
例)家から学校までを往復するのに、行きは時速6kmで走り、帰りは時速4kmで歩きました。この時の往復の平均時速を求めます。 往復の距離2dを往復にかかった時間t(=d / 6 + d / 4)で割るので、以下のとおりとなります。
A. 時速 4.8km
中央値とは変量を昇順か降順に並べて、ちょうど真ん中にきた変量を表します。
例)2、5、8、13、31の中央値は8となります。
変量の個数が偶数のときは真ん中の2つの値を足して2で割った値になります。
例)2、5、8、13の中央値は(5 + 8) / 2 = 6.5となります。
変量 :の中で最大の値を最大値(max)、最小の値を最小値(min)といいます。最大値と最小値の間を範囲(レンジ)といいます。
例)変量が1、2、2、3、4、4、9、10、11のとき、最小値、最大値、範囲は以下のとおりです。
最小値:1、最大値:11
範囲:最大値 - 最小値 = 11 - 1 = 10
各変量と平均
の差
を偏差といいます。
例)で、これらの変量の平均が5であれば、
の偏差は1、
の偏差は-1、
の偏差は3、
の偏差は4となります。
各偏差を2乗して全て加えたのち、データ数で割ったものを分散といいます。偏差を2乗しているので、全体の散らばりを見ることができます。
変量 :とするとき、分散は
となります。
分散は各変量の偏差を2乗した値の平均をとっているため、その数値は元のデータとは次元が異なったものとなっています。そこで、もとの変量と次元をそろえるため、分散の正の平方根を取り、その値を標準偏差sと言います。
変量 :とするとき、その標準偏差は
となります。
また、変量の取る
個の値の中で、
が
個、
が
個…、
が
個あるとき、標準偏差
は、
となります。
相関係数とは、2つの変量がどのような関係性を持っているかを分析する方法の一つとして、比例的な関係性を数値で示したものです。
2つの変量の組をとし、
と
はそれぞれの平均とすると、相関係数
は
となります
相関係数は共分散
を
の標準偏差
と
の標準偏差
割ったものです。
2つの変量の関係を図で表すとき、横軸と縦軸にそれぞれ別の変量をとり、データが当てはまるところに点を打って示した図を散布図といいます。
2つの変量の組をとしたとき、
を座標とする点を平面上に表すことで、変量の分布や変量の相関関係を分かりやすく示すことができます。
調査や測定によって得られたデータ(実測値)には理論値との差「ばらつき」があります。これらの変量について最も「ばらつき」が少なくなる直線(一次関数)の式を回帰直線といいます。
2つの変量の組を、
の標準偏差
、
の標準偏差を
、
と
の相関係数を
、回帰直線の式を
とすると、
回帰直線の傾きは
また、切片は
となります。
▲ ページのトップへCopyright ? 2013 総務省 統計局 All rights reserved.
〒162-8668 東京都新宿区若松町19-1 TEL 03-5273-2020(代)