母集団分布が未知の区間推定(Python)
母集団分布が未知の区間推定
これの続きです
母集団分布が未知の場合で、以下のパラメータがわかっているとき母平均の推定を行ってみる。
N = 100
標本平均¯X = 25000
不偏標準偏差U=5000
ここで中心極限定理より、
Nが十分に大きいとき、母集団の平均がμ、分散σ^2から取り出した標本平均¯Xは近似的に平均μ、分散σ^2/nの正規分布に従う。
つまり、nが十分に大きいとき¯Xは正規分布に従う。
stats.t.intervalを使って計算を行う。
n = 100 #N
mu = 25000 #標本平均
sigma = 5000 #不偏標準偏差
df = 99 #自由度(N-1)
alpha = 0.95 #信頼係数stats.t.interval(alpha = alpha, df = df, loc = mu, scale = sigma/sp.sqrt(n))
>(24007.891524245657, 25992.108475754343)
だいたい95%信頼区間は、24007.89<= μ <=25992.11であることがわかる。
中心極限定理を利用した場合の計算式は、
25000-1.96*5000/√100<=μ<=25000+-1.96*5000/√100
24020<=μ<=25980となる。
参考
Pythonで学ぶあたらしい統計学の教科書(馬場 真哉)|翔泳社の本