続・高橋セミナー
続・高橋セミナー 第11回 JMPで繰り返しが不揃いの2元配置データの解析ができるの? - 平方和の分解ではなくデザイン行列と最小2乗平均の活用 -
2023年03月
要約
実データで,2つの質的変数,量的な変数を応答として解析しようとすると必然的に「繰り返しが不揃いの2元配置」に帰着するが,この問題を扱っている日本語の書籍を見い出すことができない.そのためか,Web上では,「繰り返しが等しくないと解析できない」などが蔓延している.その原因は,平方和の分解に頼り切りで,ダミー変数を用いたデザイン行列Xを用いた解析法が,まったく普及していないためである.「モデルのあてはめ」を使っているJMPユーザは,繰り返しが等しくても,不揃いでも,全く気にせず解析しているはずである.「効果の詳細」での質的変数の水準平均を求めようとすると,「最小2乗平均」と「平均」が並列して出力されるので,それらに食い違いが出ることをうすうす知っているに違いない.ただし,その違いをきちっと説明することができるのだろうか.そこで,2×3の繰り返しが不揃いの2元配置データについて,Excelの行列関数を用いた解析方法を示し,JMPによる解析結果と対比することにより,「モデルのあてはめ」の計算原理の理解を深め,更なる応用ができるように,平方和の分解に代わる計算方法を示す.
目 次
1. はじめに 1
2. 繰り返しが不揃いの2元配置 2
各種のダミー変数
繰り返しが不揃いの事例
3種のダミー変数
3. 偏差平方和の計算 4
修正項CTを用いる方法
繰り返しが不揃いの場合に対する偏差平方和の計算
偏差平方和の定義式よる計算
平方和の分解が成り立たない
SASのGLMプロシジャによる結果と比較
JMPの「モデルのあてはめ」による解析結果
欠測値に対する伝統的な対応
4. デザイン行列Xが救いの神 12
コーディングのテーブル
交互作用はダミー変数の積
デザイン行列Xを用いた分散分析
普及活動への取り組み
新たな入門書を準備中
Excelの行列関数の活用
単回帰における予測値の標準誤差
予測値y^の標準誤差SE
予測値y^の95%信頼区間
JMPによる2次式のあてはめと95%信頼区間の表示
Excelによる2次式の95%信頼区間の推定の実際
5. 繰り返しが不揃いの2元配置 20
質的変数をダミー変数に
デザイン行列に関する入門書
繰り返しが不揃いの2元配置における平方和
効果の検定の平方和 SA
効果の検定の平方和 SB
効果の検定の平方和 SA*B
残差の平方和を用いる方法 SA
6. パラメータの推定値と標準誤差 24
パラメータの推定値
パラメータθ^の推定値 手順1) (XTX)
パラメータθ^の推定値 手順2) (XTy)
パラメータθ^の推定値 手順3) ((XTX)-1(XTy)
パラメータθ^のExcelの回帰分析を用いた計算
パラメータθ^の標準誤差
7. 「平均」と「最小2乗平均」の違いは何ですか 30
因子A の効果
パラメータθ^に関する線形和が最小2乗均
最小2乗平均の標準誤差SEの計算は?
パラメータの共分散行列 Σ(θ^)
A1 についての標準誤差
最小2乗平均に対する95%信頼区間
最小2乗平均の差に対する95%信頼区間
GLMプロシジャによる最小2乗平均の差
95%信頼区間付きの推定値の折れ線グラフ,
Excelの折れ線グラフ作成のヒント
因子Aの水準間の差の推定 1 (Studentの t 検定)
因子Aの水準間の差の推定 2 (対比の設定による場合)
因子Aの水準間の差の推定 3 (カスタム検定)
最小2乗平均の交互作用プロット
8. まとめ 41
構造モデル・回帰モデル・線形モデル
繰り返しなしの2元配置における構造モデル
文 献 43
文 献 索 引 44
索 引 44
解析用ファイル 46
添付ファイル
高橋セミナー11_繰返し不揃い_2023_03_16 takahashi11(2023-03-16).zip