機械と学習する

統計解析、機械学習について学習したことをまとめていきます

【統計検定準一級】統計学実践ワークブックの問題をゆるゆると解く#21

【概要】

  • 統計検定準一級対応 統計学実践ワークブックの問題を解いていくシリーズ
  • 第20回は9章「区間推定」から1問

【目次】


はじめに

本シリーズでは、いろいろあってリハビリも兼ねて統計学実践ワークブックの問題を解いていきます。 統計検定を受けるかどうかは置いておいて。

今回は9章「区間推定」から1問。

なお、問題の全文などは著作権の問題があるかと思って掲載してないです。わかりにくくてすまんですが、自分用なので。

心優しい方、間違いに気付いたら優しく教えてください。

【トップに戻る】

問9.1

問題

内閣支持率世論調査を実施し、1,240人から回答があった。この回答を集計すると支持率は43%であった。(本当の調査かは知らないです)

f:id:hippy-hikky:20210526162753p:plain

(1) 回答者が母集団からの無作為抽出であると仮定したとき、95%信頼区間を求めよ

確率pで支持、(1-p)で不支持とすると、43%という集計結果は二項分布に従うことになります。

二項分布はベルヌーイ分布に従う確率変数の和となるので、中心極限定理からこれは正規分布で近似できることがわかります。

すると、二項分布の期待値と分散から、標準正規分布に従うz-scoreを導出できます。

f:id:hippy-hikky:20210526163117p:plain

このz-scoreが95%信頼区間の標準正規分布での下限と上限にかかる値を求めることで、信頼区間がもとまります。

f:id:hippy-hikky:20210526163534p:plain

この辺りの証明は、参考文献2を参考にしました。

(2) 支持率が40%前後と仮定したとき、95%信頼区間が2%となるために必要なサンプルサイズを求めよ

信頼区間の範囲から、幅は以下の式の通りとなります。


\begin{align}
 2 \cdot 1.96 \sqrt{\hat{p}(1-\hat{p})/n}
\end{align}

ここで、1.96は95%信頼区間なので1.96です。標準正規分布での2.5%, 97.5%の位置ですね。

f:id:hippy-hikky:20210526163646p:plain

【トップに戻る】

参考資料

【トップに戻る】