まずはこちらをクリック!

2変数の関係性(量的データ)

サバくん
サバくん

データを収集したり、何か疑問を解決したい時に変数間の関係を見たい時があると思います。

特に2つの変数の間にある関係性をみる時には散布図を使うとわかりやすいです。

2変数の関係性

2つの変数間の互いの関係で特に2つの変数間に区別を設けずに対等にある関係を相関(correlation)と言います

一方で変数aから変数bを推定したい!という関係性を回帰(regression)と言います。

具体例を挙げると

相関は関係の身長体重のような対等な関係性です。どちらがどちらかを決めるわけではないので矢印は2方向性です。

身長体重

回帰は 生理的断面積から筋力を推定したいといった関係です。この2群は生理的断面積→筋力と矢印が1方向となっています。

生理的断面積筋力

相関図

例えば、10人の身長と体重を計測したとして以下の結果が得られたとします。

変数AさんBさんCさんDさんEさんFさんGさんHさんIさん
身長cm178169180142150162172148165
体重kg706592424950685258

これらの結果を図にしてみましょう。縦軸に身長、横軸に体重をとってみましょう。

このような図を散布図と言います。表ではどのような2変数にどのような関係性があるのかわかりにくかったですが、散布図を図示することで2変数にどのような関係性(傾向)があるのかがわかりやすくなります。この散布図は2次元データの分析の最初に行われることが多いです。

統計学的に2変数の関係が直線関係に近い傾向ある時に強い相関があると表現します。逆に直線関係の程度が弱い場合は弱い相関がある、全く直線関係がない場合は無相関といった表現をします。

加えて、1変数が増加するともう一方も増加する場合は正の相関もう一方が減少する場合は負の相関と言います。

この例では身長と体重という2変数の場合、身長が伸びると体重が増加することがわかります。つまり、強い正の相関がありそうです。

相関係数

相関図を見て感覚的には2変数の関係性が掴めると思いますが、どの程度関係性があるのかを客観的にしたい場合があると思います。そんな時には相関係数(correlation coefficient)を用います。特に2変数がどちらも量的データであればピアソンの積立相関係数を使います。相関係数は−1〜1の値をとります。(ピアソンの積立相関係数の算出方法はまた別の記事にて、)

相関係数の解釈の仕方を図と表にすると以下の通りです。

相関係数の値解釈
1に近い強い正の相関
0に近い無相関
−1に近い強い負の相関

このように2変数の散布図をとった時の直線関係を定量化することで客観的に2変数の相関を判断することができます。

相関係数の扱いに注意

相関係数を扱う時にはいくつか注意をしないといけないことがあります。簡単にあげると以下の通り

  • あくまでも直線的な関係なので曲線的な関係があることは散布図で確認が必要
  • 強い相関係数であっても因果関係があるとは限らない
  • 強い相関があってもそれは見た目上の相関である場合がある(偏相関係数で第3の因子を除く必要がある)

脱・統計学苦手療法士ロードマップ

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA