統計解説書シリーズC-03
データ分析入門2 多変量解析法・MDSの応用
A5判307ページ・ソフトカバー
●解き方より応用の仕方、応用例を中心に解説している。
●他の解説書とは異なったような説明が多いが、これは、分析法の意味を、使い易いように表現した結果である。
目次
第1章 多変量解析の目的と基本的な概念
1.1 多変量解析の利用目的(類似関係の分析と要因分析)……………………………………
1
1.1.1 多変量解析の目的………………………………………………………………………
1
1.1.2 類似関係の分析法と要因分析の方法…………………………………………………
1
1.2 多変量を取り扱うときの基本的な概念………………………………………………………
5
1.2.1 見かけ上の相関と因果関係の相関……………………………………………………
5
1.2.2 多変量の相関部分を除く計算式(多変量標準化)…………………………………
6
1.2.3 一般決定係数と一般化分散(多変量の説明率)……………………………………
8
1.2.4 マハラノビスの距離(多変量の距離)………………………………………………
9
1.2.5 特異値分解・主成分分析など…………………………………………………………
11
1.2.6 交互最小2乗法と固有値………………………………………………………………
11
1.2.7 本書によく出てくる用語(2つの用語の違い)……………………………………
13
第2章 因子分析・主成分分析の応用
2.1 主成分分析の目的………………………………………………………………………………
15
2.1.1 主成分軸を用いて多変数の類似関係を表現する(目的1)………………………
15
2.1.2 主成分得点による類似度比較(目的2)……………………………………………
18
2.1.3 主成分分析の特徴………………………………………………………………………
20
2.2 因子分析法の目的………………………………………………………………………………
21
2.2.1 因子分析の目的1(普遍的な因子を求める)…………………… …………………21
2.2.2 因子分析の目的2(因子得点によるデータの表現)………………………………
23
2.2.3 因子分析に関する概念の解説…………………………………………………………
25
2.2.4 因子分析の有効な分析手順……………………………………………………………
32
2.3 因子の決め方(因子尺度の構成)……………………………………………………………
34
2.3.1 因子数の決め方…………………………………………………………………………
34
2.3.2 因子の理解(因子負荷量の解釈法)…………………………………………………
36
2.3.3 因子負荷量の多次元表示の方法………………………………………………………
40
2.4 因子得点のプロット(因子分析の目的2)…………………………………………………
44
2.4.1 因子得点の利用法………………………………………………………………………
44
2.4.2 イメージマッピングの例………………………………………………………………
45
2.4.3 3次元プロットの例……………………………………………………………………
49
2.4.4 多因子の因子得点の表現(レーダー図と折れ線グラフ)…………………………
50
2.4.5 分散共分散行列の主成分分析・因子分析……………………………………………
52
2.4.6 嗜好の個人差分析(評価者を変数にした共分散行列の分析)……………………
54
2.4.7 積和行列の主成分分析・因子分析……………………………………………………
56
2.4.8 多重因子分析(時系列データの因子分析など)……………………………………
59
2.4.9 因子得点の追加計算(外部因子分析)………………………………………………
62
第3章 ノンメトリックMDSの応用 順序情報の多次元尺度構成法
3.1 MDS(多次元尺度構成法)の概略…………………………………………………………
65
3.1.1 ノンメトリックMDSのデータと分析法の特徴……………………………………
65
3.1.2 ノンメトリックとメトリック…………………………………………………………
66
3.1.3 類似度データの分析法の概要…………………………………………………………
67
3.2 ノンメトリックMDSの計算法について……………………………………………………
69
3.2.1 順位データと順序情報処理との違い…………………………………………………
69
3.2.2 計算法の概略……………………………………………………………………………
70
3.2.3 ノンメトリックMDSで使われる概念………………………………………………
71
3.3 ノンメトリックMDSの性質…………………………………………………………………
76
3.4 分析例……………………………………………………………………………………………
78
3.4.1 イメージ地図(認知地図)の作成・マグニチュード推定法………………………
78
3.4.2 類似度評定データの分析………………………………………………………………
80
3.4.3 混同率・同時反応率などの分析………………………………………………………
81
3.4.4 多次元データを平面上にマッピングする場合(因子得点の平均値表)……………
82
3.4.5 多次元データを平面上にマッピングする場合(クラスターのマップ)……………
84
3.4.6 非対称行列のノンメトリックMDS…………………………………………………
85
3.5 既存のMDSマップに刺激を追加する方法…………………………………………………
88
3.5.1 分析に必要なデータ……………………………………………………………………
88
3.5.2 計算方法…………………………………………………………………………………
89
第4章 クラスター分析の目的と利用法
4.1 クラスター分析の目的と特徴…………………………………………………………………
91
4.1.1 クラスター分析の目的…………………………………………………………………
91
4.1.2 いくつかの注意点や特徴………………………………………………………………
94
4.1.3 クラスター分析の計算法………………………………………………………………
95
4.1.4 似ている対象をまとめていくプロセス………………………………………………
96
4.1.5 クラスター数の決め方…………………………………………………………………
98
4.1.6 多数のクラスターを平面にプロットする方法………………………………………
99
4.2 クラスター分析の結果の表現例………………………………………………………………
102
4.2.1 クラスター分析の途中のプロセスを利用する場合…………………………………
102
4.2.2 就業者のパーソナリティタイプ………………………………………………………
102
4.2.3 年齢・性別平面上へのクラスターのマッピング(クラスタークロスの図示法) … 106
4.3 所属クラスターの判定(クラスターの外部分析)…………………………………………
109
4.4 主軸クラスター(変数のクラスター・角度のクラスター)………………………………
112
第5章 AID(Automatic Interaction Detector)
5.1 AID分析の目的………………………………………………………………………………
115
5.2 AID分析の特徴………………………………………………………………………………
116
5.2.1 説明変数の効果が群の分割で表現されること………………………………………
116
5.2.2 先に導入された説明変数を固定して次の変数を決める手続き……………………
117
5.2.3 予測の方法(高得点群・ターゲット群の判定)……………………………………
117
5.3 様々なデータのAID分析……………………………………………………………………
118
5.4 2カテゴリー説明変数の場合の分析例………………………………………………………
119
5.5 複数の目的変数のAID分析…………………………………………………………………
122
5.6 属性分析のAID………………………………………………………………………………
124
第6章 コレスポンデンス分析
6.1 コレスポンデンス分析の目的と特徴…………………………………………………………
125
6.1.1 対応させるということの意味…………………………………………………………
125
6.1.2 集計表の度数とマッピング結果が一致しない理由…………………………………
127
6.1.3 コレスポンデンス分析と主成分分析の違い…………………………………………
128
6.1.4 一般的なコレスポンデンス分析………………………………………………………
129
6.1.5 コレスポンデンス分析と数量化3類…………………………………………………
130
6.1.6 コレスポンデンス分析と正準相関分析………………………………………………
131
6.1.7 一般的コレスポンデンス分析が適用できるデータ…………………………………
132
6.2 クロス表・集計表のコレスポンデンス分析…………………………………………………
133
6.3 平均値表のコレスポンデンス分析……………………………………………………………
134
6.4 横パーセント表のコレスポンデンス分析……………………………………………………
135
6.5 相関係数表のコレスポンデンス分析…………………………………………………………
135
6.6 多重コレスポンデンス分析(集計表を並べて分析する方法)……………………………
138
6.7 多重コレスポンデンス分析(3重クロス表の場合)………………………………………
140
6.8 外部コレスポンデンス分析(要素の追加)…………………………………………………
142
6.9 対数コレスポンデンス分析……………………………………………………………………
144
6.10 ノンメトリックコレスポンデンス分析 ……………………………………………………
145
第7章 数量化3類の特徴
7.1 数量化3類のデータと因子分析のデータ……………………………………………………
147
7.2 数量化3類の目的………………………………………………………………………………
148
7.3 数量化3類の特徴とコレスポンデンス分析…………………………………………………
150
7.3.1 計算法の基本的部分は同じ……………………………………………………………
150
7.3.2 個人得点を対応させる場合と集計のカテゴリーを対応させる場合………………
151
7.3.3 項目(アイテム)のカテゴリーを一つ落として対応する場合………………………
154
7.4 サンプルスコアの追加法(外部数量化3類)………………………………………………
156
第8章 3元データの分析法
8.1 3元データの3つの種類………………………………………………………………………
157
8.1.1 個人差プロフィールデータ……………………………………………………………
157
8.1.2 個人差類似度データ……………………………………………………………………
158
8.1.3 3元類似度データ(3重クロス表など)……………………………………………
158
8.1.4 3元データの分析法の概略……………………………………………………………
159
8.2 別々に分析………………………………………………………………………………………
160
8.3 個人のみ要約して別々に分析(POV分析など)…………………………………………
161
8.4 評価尺度のみ因子にする場合(1相因子分析・外部分析)………………………………
166
8.5 評価尺度と個人を因子にする場合(2相因子分析)………………………………………
170
8.5.1 尺度の因子化・個人の因子化(2相因子分析)の特徴……………………………
170
8.5.2 計算法の概略……………………………………………………………………………
171
8.5.3 分析結果の例……………………………………………………………………………
172
8.6 個人差を次元のウェイトで表現する場合(INDSCALモデル)……………………
174
8.7 3つの相を別々の因子にする場合(3相因子分析)………………………………………
176
8.8 3つの相を同じ次元で表現する場合(3元主成分分析・3元コレスポンデンス分析)
180
8.8.1 3元類似度データと個人差プロフィールデータ(認知型データ)……………… 180
8.8.2 3元の関連度は3要因の交互作用部分を表す………………………………………
181
8.8.3 分析の例…………………………………………………………………………………
182
第9章 目的変数が多数の場合の要因分析
9.1 目的変数が多数の場合の要因分析法概要……………………………………………………
183
9.1.1 目的変数が多数であることの意味……………………………………………………
183
9.1.2 多変量データにおける要因効果の表現法……………………………………………
184
9.1.3 目的変数が多数の場合の分析法………………………………………………………
186
9.2 多変量回帰分析…………………………………………………………………………………
189
9.2.1 多変量回帰分析のデータ………………………………………………………………
189
9.2.2 部分決定係数を用いた回帰式の一般的な表現………………………………………
191
9.2.3 計算例……………………………………………………………………………………
193
9.3 正準相関分析法…………………………………………………………………………………
199
9.3.1 多変量標準偏回帰係数行列の因子(正準因子)……………………………………
199
9.3.2 分析例……………………………………………………………………………………
201
9.4 多変量分散分析(多変量の検定)……………………………………………………………
209
9.4.1 多変量分散分析と多変量回帰分析……………………………………………………
209
9.4.2 要因効果による多変量分散の分解……………………………………………………
211
9.4.3 多変量の検定法…………………………………………………………………………
212
9.4.4 多変量標準偏回帰係数行列から分散行列を分解する方法…………………………
214
9.4.5 固有値によるΛ統計量の計算(要因が直交しない場合の検定法)………………… 214
9.5 数量化2類・多重判別分析……………………………………………………………………
218
9.5.1 データの形と正準相関分析法との関係………………………………………………
218
9.5.2 分析結果の表現例………………………………………………………………………
219
9.5.3 判別予測の方法…………………………………………………………………………
221
第10章 目的変数が1つの場合の要因分析
10.1 重回帰分析の解釈 ……………………………………………………………………………
224
10.1.1 重回帰分析の目的 ……………………………………………………………………
224
10.1.2 重回帰分析を適用する2つのケース ………………………………………………
225
10.1.3 計算される指標とその説明 …………………………………………………………
227
10.1.4 説明変数間の相関が見かけ上の相関の場合(ケース1)の解釈法 ………………
231
10.1.5 説明変数間に本来的な相関がある場合(ケース2)の解釈法 ……………………
235
10.1.6 説明変数間に相関がある場合に違和感をなくす方法 ……………………………
237
10.2 段階的重回帰分析による時系列データの分析 ……………………………………………
239
10.2.1 段階的重回帰分析の目的 ……………………………………………………………
239
10.2.2 事例データの概略と分析結果の説明率 ……………………………………………
240
10.2.3 第1段階(合併号などの編集要因の調整) ………………………………………
241
10.2.4 第2段階・第3段階(情報量の効果・経済社会要因) …………………………
242
10.2.5 第4段階(季節変動要因) …………………………………………………………
243
10.2.6 第5段階・第6段階(地域特性・記事内容) ……………………………………
244
10.3 数量化1類(カテゴリー重回帰分析) ……………………………………………………
245
10.3.1 数量化1類とカテゴリー変数の重回帰分析 ………………………………………
245
10.3.2 出力例と図示法 ………………………………………………………………………
246
10.4 分散分析(カテゴリー重回帰分析) ………………………………………………………
250
10.4.1 分散分析と重回帰分析 ………………………………………………………………
250
10.4.2 コーディングの例とカテゴリーウェイトの計算法 ………………………………
251
10.4.3 分散分析表の作り方と交互作用の意味 ……………………………………………
253
10.5 コーホート分析(交互最小2乗法・固有値を用いる方法) ……………………………
257
10.5.1 年齢差を形成する世代差と加齢差 …………………………………………………
257
10.5.2 分析法の考え方(交互最小2乗法・固有値を用いる方法) ……………………
259
10.5.3 分析結果の例(交互最小2乗法によるカテゴリー重回帰分析) ………………… 261
10.5.4 分析結果の例(調査時点・年齢効果を除いたときの残差プロット)………………
262
10.6 個人別要因分析(コンジョイント分析)と回帰予測 ……………………………………
264
10.6.1 個人別要因分析法(コンジョイント分析)の特徴 ………………………………
264
10.6.2 順位値と順序情報処理 ………………………………………………………………
266
10.6.3 個人別分析とシェアのシミュレーション予測 ……………………………………
267
10.7 判別分析 ………………………………………………………………………………………
268
10.7.1 判別分析の概要 ………………………………………………………………………
268
10.7.2 判別分析の種類と特徴 ………………………………………………………………
268
10.8 ロジスティック回帰分析・一対比較法のロジットモデル ………………………………
278
10.8.1 データの形と離散型回帰分析の特徴 ………………………………………………
278
10.8.2 要因効果を含んだ尤度の計算法 ……………………………………………………
280
10.8.3 離散型回帰分析の特徴比較 …………………………………………………………
281
10.8.4 計算結果の指標値について …………………………………………………………
283
10.8.5 一対比較法・恒常和法のロジットモデル・プロビットモデル……………………
285
第11章 いくつかの予測法
11.1 マルコフ予測(構成比の推移) ……………………………………………………………
290
11.1.1 基本的な考え方 ………………………………………………………………………
290
11.1.2 適用の例 ………………………………………………………………………………
292
11.2 逐次的にパラメータを修正していく時系列予測 …………………………………………
295
参考文献 …………………………………………………………………………………………… 299
索 引 ……………………………………………………………………………………………
302