いやもう、ほんと、この記事は自分用のメモ。
なんでこんなものを書くことにしたかというと、
放送大学の講義「身近な統計」の第11回を見てて、講義のスライド(30分経過時点の「2群の平均の比較(2標本検定)」というスライド)に誤記(t値の分母が割り算になっているが、正しくは掛け算)があったため、いろいろ苦労したから、メモしようと思って。
講義の終盤にエクセルのデータ分析ツールを使って、スチューデントのt検定を出すのだが、これをツールを使わずに上記スライドに基づいて計算すると、値が合わなくて混乱していた。
放送大学生は、混乱しなかったのだろうか?
ちなみに、この講義のテキストの記載内容(p.193)は正しい記載がなされてる。
では、順を追って書いていこう。(といいつつ、途中までで止まるかも。いずれ追記するかもしれないが。)
概念を調べていたら、1標本検定から階層ベイズモデルまで行き着いた。
って、項目だけのところもあるけど。
<母平均μの1標本検定 >
身近な統計pp.188-190を一部引用。
以下がポイント。
・母集団の平均μと標本平均Xは必須。
・サンプルサイズnが十分大きいかどうか
・母標準偏差σが得られているかどうか(ない場合は、標本標準偏差sで代用)
(ア)母標準偏差σが既知の場合 → Z検定
Z = ( X - μ ) / ( σ / √n ) ・・・(1)
なお、サンプルサイズnが大きい場合は、母標準偏差σを標本標準偏差sで代用するとしても、式(1)を使う。
(イ)母標準偏差σが未知でサンプルサイズnが小さい場合 → t検定
t = ( X - μ ) / ( s / √n ) ・・・(2)
かつ、サンプルサイズも小さいので、t分布。
<2標本のt検定>たぶんあとで中身を追記する
を参考にさせていただいた。
2標本のt検定は対応のあるt検定と対応のないt検定に分けられ,
さらに,
対応のないt検定はスチューデントのt検定(等分散を仮定したt検定)と、ウェルチのt検定(等分散を仮定しないt検定)に分類される.
<F検定>たぶんあとで中身を追記する
対応のないt検定でどちらにするかを決める検定(F検定の1つの使い方)がある。
F検定 - Wikipedia 以下は、wikiの引用。
"""
F検定には次のようなものがある:
・正規分布に従う2つの群の「標準偏差が等しい」という帰無仮説の検定。これはt検定の前段階の「等分散性検定」として用いられる。ただし、このような前段階での等分散性検定の利用は正しくないという指摘も見られる。
・正規分布に従う複数の群(標準偏差は等しいと仮定する)で、「平均が等しい」(つまり同じ母集団に由来する)という帰無仮説の検定。この方法は分散分析に用いられる。
"""
<分散分析>たぶんあとで中身を追記する
あと、分散分析も。
N元配置分散分析(N要因分散分析)で、
N= 1, 2, 3以上 で書いていかないとね(今後書く)。
<一般化線形モデル(GLM)> たぶんあとで中身を追記する
ってやってると、
一般化線形モデルの話もしないといけなくなってくるね。
一般化線形モデルについて - アイアナ:データ分析や人工知能(AI)などの技術雑記
「線形重回帰(線形モデル) ・ 分散分析 ・ 共分散分析 ・ GLMは同じですよ、ということ。」
はいはい、こうなったら、みどり本p.6のノリになってきますわなあ。
<一般化線形混合モデル(GLMM)> たぶんあとで中身を追記する
<階層ベイズモデル> たぶんあとで中身を追記する