その他のデータ分析手法

 データの分析を行う方法として、平均や分散などの算出以外にも、様々な手法があります。ここでは、それら統計分析の手法の一部を紹介していきます。

横断面分析

ジニ係数

 ジニ係数は所得や貯蓄などの格差を表す指標です。
 ローレンツ曲線において、均等配分線とローレンツ曲線に囲まれた部分の面積を均等配分線と横軸の間の面積で割った値で求められます。

特化係数

 特化係数とは、例えば、ある県の産業別の構成比を全国の平均的な構成比と比較することで、その県がどの産業に特化しているのかを示す指標です。ある県の産業の構成比を全国の平均的な構成比で割れば算出できます。

時系列分析

成長率

 成長率とは、ある値について、過去の値に比べてどれくらい伸びたかを示す指標です。

 例えば、企業の年間売上が1000万円から1年後に1010万円になるのと、10万円から20万円になるのとでは、どちらも10万円の上昇ですが、その意味は大きく異なります。元々1000万円あった企業にとって増加した10万円は1%の上昇にすぎませんが、10万円しかなかった企業にとっては前回より100%上昇、すなわち売上が2倍に成長したことを意味します。

寄与度

 あるデータの構成要素となる項目の変化が、データ全体にどのくらい影響を与えているかを示す指標です。構成要素全ての寄与度の総和は、全体の成長率と一致します。

寄与率

 寄与率は寄与度を構成比で表した指標であり、データ全体の変化を100とした場合に構成要素となるデータの変化がどのくらい影響を与えているかを示す指標です。

季節調整

 時系列のデータを見る時は季節性の問題に気を付ける必要があります。例えば、飲食業の売上は12月や8月にはクリスマス、忘年会、お盆などで毎年売上が伸びるなど、季節的な要因が含まれており、単純に前月からの上下だけを比較しても、正確な分析はできません。そこで、季節的な変動を取り除いて分析することが必要になるのです。

図 全国飲食店の売上高

※2020年は、新型コロナウイルス感染症の影響により例年と違う動きが見られます。

 季節調整の方法はいろいろな種類がありますが、ここでは前年同月比と移動平均について見ていきましょう。

移動平均

 移動平均(単純移動平均)とは、各月の移動平均値として、その月を含む一定期間の平均値を使用する方法です。各月とその前後の月の平均値を使う中央移動平均、各月とそれ以前の月の平均値を使う後方移動平均、各月とそれ以後の月の平均値を使う前方移動平均などがあります。
 例えば、月別の飲食店の売上高について、11カ月の移動平均(中央)を作成する場合、7月の移動平均は、7月と前後5カ月分(2月から12月まで)の平均値となり、その他の月も同様に計算していきます。すると、以下のグラフのように、季節変動を除いた傾向が捉えやすくなります。

図 全国飲食店の売上高

 

前年同月差、前年同月比

 前年同月差、前年同月比は、その名のとおり、前年の同じ月との差や比を使うことで、季節的な変動を除く方法です。同様に前年からの増加率を使うことでも季節性を取り除くことが可能です。
 ただし、前年同月と比較する際は、この指標が前年同月との相対的な値であることに注意しなければなりません。例えば、前年の同じ月の売上高が何らかの原因により例年より大きく下回った場合、今年の売上高が例年どおりの値だったとしても、前年同月との比較では、大きな上昇を示すことになるので、注意する必要があります。