【7】数量化V類
数量化T類およびU類では求めるべき外的基準があったが、数量化V類では求めるべき外的基準がなく、与えられた質的データについて、そのデータの類似性について調べる方法である。項目(カテゴリ)と被験者(サンプル)について、両方同時に数量化を行い、項目と被験者の相互の関連をより明らかにする方法である。パターン類似法とも呼ばれている。量的データの分析である主成分分析に似た質的データの分析方法である。
項目(カテゴリ)と被験者(サンプル)について、質的データが与えられているとき、同一の項目に反応した被験者は類似性が高く、また同一の被験者に反応した項目は類似性が高いと仮定する。お互いに類似性の高い項目・被験者が近くにくるように並べかえると反応したものが対角線の周辺に集まってくる。このようにして、その類似性を調べようとするのであるが、項目と被験者を並べかえる代わりに、項目と被験者の相関係数を最大にすることにより実施する。
いま、4人の被験者について、野球とすもうのどのスポーツが好きかを調べたところ、下のような表な結果を得た。この結果から被験者の類似性や項目間の類似性を調べる。
好きなスポーツ項目に「レ」をつける。
|
カテゴリ(項目) |
|||
被 験 者 |
サ ン プ ル |
No |
野球 |
すもう |
1 2 3 4 |
レ レ レ |
レ レ |
上の表について、「該当有り」には「1」を、「該当無し」には「0」の数量を与えると
(1)サンプルスコア・カテゴリスコアを求める。
サンプルデータの分散をVaa、カテゴリデータの分散をVbb、サンプルデータとカテゴリデータの共分散をVabとすると
@×a1+A×a2+B×a3+C×a4を求めると
a1b1+a2b1+a2b2+a3b1+a4b2−λ(a12+2a22+a32+a42)
=
a1b1+a2b1+a2b2+a3b1+a4b2−λ
D×b1+E×b2を求めると
a1b1+a2b1+a2b2+a3b1+a4b2−μ(3b12+2b22)
=
a1b1+a2b1+a2b2+a3b1+a4b2−μ
これから λ=μ
@ABCから
FGを変形して
この式から λ2 =1
,0.583
数量化V類では、得られた固有方程式を解くと、固有値の1つとして必ず1が得られるが、こ の解の1は採用しないで(全部同じ値となり意味がない)、2番目以降の固有値から採用する ようにする。λ2=0.583を採用し、固有ベクトルb1・b2 を求める。
相関係数Rは
以上をまとめると
[カテゴリスコア]
相関係数Rは
以上をまとめると
カテゴリ数・サンプル数が少ないためにそれぞれの類似性がはっきりしないが、サンプルス コアを見ると、@とBの被験者の嗜好が同じであり、AとCの被験者の嗜好が近いといえる。一般にカテゴリ数がn個あると、固有値もn個求められるが、数量化V類では、固有値の中で最大の固有値は、常に1となるのでこれを除いたn−1個の固有値を採用する。
(2)行列を使用して、サンプルスコア・カテゴリスコアを求める。
カテゴリ数やサンプル数が増えてくると計算が非常に大変になる。そこで、同様の計算を行列を用いて実施する。各行列を下のようにする。
同様に Vbb=b’・B・b Vab=a’・D・b
ここで条件は、a’・A・a= b’・B・b =
1
相関係数Rは
これをAに代入し
D’・A-1・D・b−λ2・B・b=0
これを変形すると
B-1/2・D’・A-1・D・B-1/2・x−λ2・x=0
ただし B1/2・b=xとする
(B-1/2・D’・A-1・D・B-1/2−λ2)x=0
λ2 =1
,0.583
固有値λ2=1を除いて、λ2=0.583を採用する。
これより、b1=0.365 b2=−0.548
(3)アイテム・カテゴリ方式
いままで行ってきた数量化V類の方法は、1つの項目について「好き」「嫌い」のように2者択一的に選択するという方法をとったが、1つの項目について「好き」「普通」「嫌い」のように選択支が2つ以上ある時には、このような方法は使用できない。選択支がつ以上ある時には、アイテム・カテゴリ方式で求める必要がある。
前の表をアイテム・カテゴリ方式で新しく表を作成すると、下のようになる。
該当するカテゴリは1、該当しないときは0の数量を与える。
@サンプルスコア・カテゴリスコアを求める。
前回の方法と同様にして計算し、それぞれの得点を求める。
サンプルデータの分散Vaa、カテゴリデータの分散Vbb、共分散Vabを求めると
この式から固有値を求めると、λ2=1 , 0 , 0.789 , 0.211
λ2=1 , 0 は無意味なので λ2=0.789 , 0.211 を採用する。
λ2= 0.789 , 0.211 を採用し、それぞれに属する固有ベクトルを求める。
@λ2=0.789 の時
3b1+b3+2b4−6×0.789・b1=0
b2+b3−2×0.789・b2=0
b1+b2+2b3−4×0.789・b3=0
2b1+2b4−4×0.789・b4=0
以上から、b1=−0.57・b3 b2=1.73・b3 b4=−b3
b3=1 とすると、b1=−0.57 b2=1.73 b4=−1
また標準化すると
b1=-0.188 b2=0.577 b3=0.33 b4=-0.33
サンプルスコアを求めると
a1=-0.88 a2=0.24 a3=-0.88 a4=1.53
A同様にして、λ2 =0.211 の時のカテゴリスコア・サンプルスコアを求めると
b1=0.577 b2=-1.73 b3=1
b4=-1
a1=-0.46 a2=1.72 a3=-0.46
a4=-0.79
[カテゴリスコア]
λ2 |
野 球 |
すもう |
||
好(b1) |
嫌(b2) |
好(b3) |
嫌(b4) |
|
0.789 0.211 |
-0.57 0.57 |
1.73 -1.73 |
1 1 |
-1 -1 |
λ12= 0.789 を横軸に,λ22= 0.211 を縦軸にとりカテゴリスコアをグラフに描くと
グラフを見ると横軸の+方向は、個人戦のスポーツが好き、−方向は団体戦のスポーツが好きな傾向と考えられる。また縦軸の+方向は全般的にスポーツが好きな傾向、−方向は全般的にスポーツが嫌いな傾向を示すと考えられる。
[サンプルスコア]
サンプルスコアをみると、被験者の嗜好の類似性を見ることができる。
λ12= 0.789 を横軸に,λ22= 0.211 を縦軸にとりサンプルスコアをグラフに描くと