続・高橋セミナー
続・高橋セミナー 第11回 JMPで繰り返しが不揃いの2元配置データの解析ができるの? - 平方和の分解ではなくデザイン行列と最小2乗平均の活用 -
2023年03月
要約
実データで,2つの質的変数,量的な変数を応答として解析しようとすると必然的に「繰り返しが不揃いの2元配置」に帰着するが,この問題を扱っている日本語の書籍を見い出すことができない.そのためか,Web上では,「繰り返しが等しくないと解析できない」などが蔓延している.その原因は,平方和の分解に頼り切りで,ダミー変数を用いたデザイン行列Xを用いた解析法が,まったく普及していないためである.「モデルのあてはめ」を使っているJMPユーザは,繰り返しが等しくても,不揃いでも,全く気にせず解析しているはずである.「効果の詳細」での質的変数の水準平均を求めようとすると,「最小2乗平均」と「平均」が並列して出力されるので,それらに食い違いが出ることをうすうす知っているに違いない.ただし,その違いをきちっと説明することができるのだろうか.そこで,2×3の繰り返しが不揃いの2元配置データについて,Excelの行列関数を用いた解析方法を示し,JMPによる解析結果と対比することにより,「モデルのあてはめ」の計算原理の理解を深め,更なる応用ができるように,平方和の分解に代わる計算方法を示す.
目 次 1. はじめに 1 2. 繰り返しが不揃いの2元配置 2 各種のダミー変数 繰り返しが不揃いの事例 3種のダミー変数 3. 偏差平方和の計算 4 修正項CTを用いる方法 繰り返しが不揃いの場合に対する偏差平方和の計算 偏差平方和の定義式よる計算 平方和の分解が成り立たない SASのGLMプロシジャによる結果と比較 JMPの「モデルのあてはめ」による解析結果 欠測値に対する伝統的な対応 4. デザイン行列Xが救いの神 12 コーディングのテーブル 交互作用はダミー変数の積 デザイン行列Xを用いた分散分析 普及活動への取り組み 新たな入門書を準備中 Excelの行列関数の活用 単回帰における予測値の標準誤差 予測値y^の標準誤差SE 予測値y^の95%信頼区間 JMPによる2次式のあてはめと95%信頼区間の表示 Excelによる2次式の95%信頼区間の推定の実際 5. 繰り返しが不揃いの2元配置 20 質的変数をダミー変数に デザイン行列に関する入門書 繰り返しが不揃いの2元配置における平方和 効果の検定の平方和 SA 効果の検定の平方和 SB 効果の検定の平方和 SA*B 残差の平方和を用いる方法 SA 6. パラメータの推定値と標準誤差 24 パラメータの推定値 パラメータθ^の推定値 手順1) (XTX) パラメータθ^の推定値 手順2) (XTy) パラメータθ^の推定値 手順3) ((XTX)-1(XTy) パラメータθ^のExcelの回帰分析を用いた計算 パラメータθ^の標準誤差 7. 「平均」と「最小2乗平均」の違いは何ですか 30 因子A の効果 パラメータθ^に関する線形和が最小2乗均 最小2乗平均の標準誤差SEの計算は? パラメータの共分散行列 Σ(θ^) A1 についての標準誤差 最小2乗平均に対する95%信頼区間 最小2乗平均の差に対する95%信頼区間 GLMプロシジャによる最小2乗平均の差 95%信頼区間付きの推定値の折れ線グラフ, Excelの折れ線グラフ作成のヒント 因子Aの水準間の差の推定 1 (Studentの t 検定) 因子Aの水準間の差の推定 2 (対比の設定による場合) 因子Aの水準間の差の推定 3 (カスタム検定) 最小2乗平均の交互作用プロット 8. まとめ 41 構造モデル・回帰モデル・線形モデル 繰り返しなしの2元配置における構造モデル 文 献 43 文 献 索 引 44 索 引 44 解析用ファイル 46
添付ファイル
高橋セミナー11_繰返し不揃い_2023_03_16 takahashi11(2023-03-16).zip