サバくん
2変数がどちらも量的なデータであれば、散布図を図示して2変数の関係性を視覚的に把握することができましたが、どちらか一方でも質的データの場合は分割表(クロス表)というものを使います。
目次
分割表(cantingency table)を実際に見てみましょう。
表側(縦方向にある変数)を転倒歴のあり・なし、表頭(横方向にある変数)を運動習慣のあり・なしとした分割表です。この場合、表側の数が2で表頭の数が2なので2×2分割表と言います。
分割表は表側の1変数と表頭の1変数が交差する目に対応する度数が表示されています。
例えば、赤く色がついている182という数字は運動習慣があり、転倒歴がない人の度数を表しています。
また表側・表頭ともに合計値が表示されており、これは表側・表頭それぞれの度数になっています。(周辺度数という)
ちなみに変数の片方のみ質的データの場合はもう一方の量的データを階級で分けて分割表を作成します。
表側を転倒歴の有無、表頭をTUGの値(階級幅8秒)をとった時の分割表が以下の表です。
この場合は表側の数が2で表頭の数が3なので2×3分割表と言います。
分割表を可視化するにはヒートマップを用いると良いです。
上の表にある転倒歴の有無とTUGの2×3分割表をヒートマップにしてみましょう。
こうすることで視覚的に数値の大小を把握することができます。
このヒートマップから
- TUGの時間が長い人の方が転倒歴がある人が多く
- TUGの時間が短い人は転倒歴がない人が多い
傾向にあることがわかります。
今回は2×3分割表と少ない分割表なのでヒートマップにするまでもないかもしれませんが、変数の項目が多くなると便利になってきます。