機械と学習する

統計解析、機械学習について学習したことをまとめていきます

【統計検定準一級】統計学実践ワークブックの問題をゆるゆると解く#26

【概要】

  • 統計検定準一級対応 統計学実践ワークブックの問題を解いていくシリーズ
  • 第25回は11章「正規分布に関する検定」から2問

【目次】


はじめに

本シリーズでは、いろいろあってリハビリも兼ねて統計学実践ワークブックの問題を解いていきます。 統計検定を受けるかどうかは置いておいて。

今回は11章「正規分布に関する検定」から2問。

なお、問題の全文などは著作権の問題があるかと思って掲載してないです。わかりにくくてすまんですが、自分用なので。

心優しい方、間違いに気付いたら優しく教えてください。

【トップに戻る】

問11.1

問題

2店舗(A, Bとする)を展開するハンバーガーショップがある。ポテトのサイズは120gと仕様が決まっているが、店舗Aはサイズが大きいと噂されている。

無作為に10個抽出して重さを測った結果、平均125g、標準偏差が10.0であった。

以下の設定で仮説検定する。

f:id:hippy-hikky:20210614232217p:plain

(1) 検定統計量の値は?

補足(1)で書いた検定統計量に当てはめる。

f:id:hippy-hikky:20210614232619p:plain

(2) 有意水準を片側2.5%としたときの棄却限界値は?

t分布表から、t_{0.025}(\nu=9)を読み取れば良い。そのため、2.262となることがわかる。

(3) 帰無仮説は棄却されるか?

(1)で算出したtと(2)で求めたt_{0.025}(\nu)を比較すると、t \lt t_{0.025}となるので、H_0は棄却されない。つまり、店舗Aのポテトのサイズは120gよりも大きいとは言えない。

(4) 有意水準2.5%(片側)で帰無仮説が棄却される最小の標本サイズはいくらか?

統計量をnについて展開すると以下のメモの通りとなります。ただし、t_{\alpha}(\nu)は自由度、つまり(n-1)に依存する関数となるので、素直に一つには決まりません。なので、具体的に値を入れて不等式が満たされる最小のnを探します。

f:id:hippy-hikky:20210614234447p:plain

もっと上手い方法ないですかね?

【トップに戻る】

問11.2

問題

問11.1の続きで、店舗Bでも同様に10個のポテトを無作為抽出して重量を計測したところ、平均115g、標準偏差が8.0gだった。

店舗A, Bのポテトはそれぞれ\mathcal{N}(\mu_A, \sigma^2)\mathcal{N}(\mu_B, \sigma^2)に従うとする。(分散は共通とする)

f:id:hippy-hikky:20210614235008p:plain

(1) 店舗A, Bのデータを合わせた標本分散を求めよ

2標本の合併分散は、偏差平方和と自由度から以下のメモの通りに定義されます。

f:id:hippy-hikky:20210614235137p:plain

(2) 検定統計量の値を求めよ

補足(2)で求めた式に代入します。

f:id:hippy-hikky:20210615000500p:plain

(3) 有意水準5%(両側)としたときの棄却限界値は?

自由度が\nu = 10+10-2 =18なので、素直にt分布表から値を探してきます。

\nu_{0.025}(\nu=18) = 2.101

(4) 帰無仮説は棄却されるか?

(2)、(3)の結果から、帰無仮説は棄却されることがわかります。

つまり、店舗A, Bのポテトフライの重さは有意水準5%で異なるということが支持されるようです。

【トップに戻る】

補足

(1) t検定統計量

標本平均の分布は\mathcal{N}(\mu, \sigma^2 / n)に従う。そのため、標準正規分布に変換すると以下のようになる。


\begin{align}
 Z = \frac{\bar{X} - \mu}{\sqrt{\sigma^2 / n}}
\end{align}

分散が未知の場合には、\sigma^2を消去する必要があり、\sqrt(s^2 / \sigma^2)で割る。


\begin{align}
 t = \frac{Z}{\sqrt(s^2 / \sigma^2)} = \frac{\bar{X} - \mu}{\sqrt{s^2 / n}}
\end{align}

このtは自由度(n-1)のt分布に従う。

(2) 2標本の平均の差が従う分布のt検定統計量

平均の差が従う分布は独立な正規確率変数の和の性質から以下の分布になる。(分散が共通の場合)


\begin{align}
 (\bar{X} - \bar{Y}) \sim \mathcal{N}\left(\mu_1 - \mu_2, \left( \frac{1}{m} + \frac{1}{n} \right)\sigma^2 \right)
\end{align}

補足(1)のt統計量の導出と同様に、分散が未知であるためこれを消去するように加工する。(以下のメモ参照)

f:id:hippy-hikky:20210614235433p:plain

【トップに戻る】

参考資料

【トップに戻る】