母集団分布が未知の区間推定(Python)

母集団分布が未知の区間推定

これの続きです

me9md.hatenablog.com

 

母集団分布が未知の場合で、以下のパラメータがわかっているとき母平均の推定を行ってみる。

N = 100

標本平均¯X = 25000

不偏標準偏差U=5000

 

ここで中心極限定理より、

Nが十分に大きいとき、母集団の平均がμ、分散σ^2から取り出した標本平均¯Xは近似的に平均μ、分散σ^2/nの正規分布に従う。

つまり、nが十分に大きいとき¯Xは正規分布に従う。

 

stats.t.intervalを使って計算を行う。

n = 100 #N
mu = 25000 #標本平均
sigma = 5000 #不偏標準偏差
df = 99 #自由度(N-1)
alpha = 0.95 #信頼係数

stats.t.interval(alpha = alpha, df = df, loc = mu, scale = sigma/sp.sqrt(n))

>(24007.891524245657, 25992.108475754343)

 

 だいたい95%信頼区間は、24007.89<= μ <=25992.11であることがわかる。

 

中心極限定理を利用した場合の計算式は、

25000-1.96*5000/√100<=μ<=25000+-1.96*5000/√100

24020<=μ<=25980となる。

 

参考

Pythonで学ぶあたらしい統計学の教科書(馬場 真哉)|翔泳社の本