母比率の推定(Python)

母比率の推定とは?

例えば集団の中で、○✗クイズをしたときに、○と答えた人の確率を母比率pという。

一方、標本の○率を標本比率Rとすると、Rは母比率pに対応する。

よって、標本比率Rを用いてpを推定することが可能になります。

 

推定には中心極限定理を利用するため、サンプルサイズは十分に取る必要がある。

 

Pythonで計算するには、scipyのstats.binom.intervalを用いて推定が可能になります。

例題

サイコロを400回投げたところ、6の目が80回出た。このサイコロで6の目が出る母比率の95%信頼区間を求めよ。

 

実際に計算してみます。

import scipy as sp
from scipy import stats

 

alpha = 0.95
n = 400
p = 80/400 #標本確率
sita, ue = stats.binom.interval(alpha=alpha, n=n, p=p, loc=0)

 

bottom = sita/400 #下側確率
up = ue/400 #上側確率

print(f"{bottom} <= p <= {up}")
>0.1625 <= p <= 0.24 #答え

 

よって、 このサイコロで6の確率が出る信頼確率95%は、0.1625 <= p <= 0.24となる。

 

 

参考

bellcurve.jp