機械と学習する

統計解析、機械学習について学習したことをまとめていきます

【統計検定準一級】統計学実践ワークブックの問題をゆるゆると解く#10

【概要】

  • 統計検定準一級対応 統計学実践ワークブックの問題を解いていくシリーズ
  • 第9回は5章「離散型分布」から2問

【目次】


はじめに

本シリーズでは、いろいろあってリハビリも兼ねて統計学実践ワークブックの問題を解いていきます。 統計検定を受けるかどうかは置いておいて。

今回は5章「離散型分布」から2問。

なお、問題の全文などは著作権の問題があるかと思って掲載してないです。わかりにくくてすまんですが、自分用なので。

心優しい方、間違いに気付いたら優しく教えてください。

【トップに戻る】

問5.4

問題設定

二つのサッカーチームがある(T1, T2)。それぞれのチームの得点は以下のメモの通りのポアソン分布に従うとする。

f:id:hippy-hikky:20210502221822p:plain

(1) T1, T2の合計得点の従う分布を求めよ

ポアソン分布の性質として知られている結果を使えば一瞬で解が導出できるのですが、愚直に確率母関数を使って導出します。

f:id:hippy-hikky:20210502222123p:plain

ポアソン分布の期待値から考えて、確率変数の和の期待値は期待値の和という性質を使っても容易に導けます。

ちなみに補足ですが、ポアソン分布の期待値を改めて導出しました。

f:id:hippy-hikky:20210502222559p:plain

(2) 合計得点が5点という条件のもとで、T1の得点Xの分布を求めよ

条件付き分布を考えます。

2チームのそれぞれの得点は互いに独立ということを踏まえると、同時分布が単純な積で表現できるので、あとは定義に従って展開していくだけです。で、結局最後に二項分布の形が現れてくるので、これが二項分布であることがわかります。

f:id:hippy-hikky:20210502222656p:plain

最終的に二項分布が現れてくるのが面白かったです。途中は結構入り組んできれいな分布になるように思えなかったので、最終的によく知ってる形が現れた時には「おおっ!」て思いました。

問5.5

問題設定

k種類のシールが入っているお菓子がある。それぞれのシールは等確率で現れるとする。

f:id:hippy-hikky:20210502223212p:plain

(1) 4種類全てのシールを集めるまでに必要な購入数の期待値

持ってないシールが出る場合を「成功」とおき、持っているシールが出た事象を「失敗」とすると、成功するまでの試行回数は以下の幾何分布に従います。


\begin{align}
 \mathrm{Geo}(x | p) = p(1-p)^{x-1}
\end{align}

ここで、テキスト本文では幾何分布の確率変数の定義として、成功するまでの「失敗回数」の分布としていることに注意してください。上記の式は「成功するまでの試行回数」の分布です。成功まで含めるので、(1-p)にかかる指数が(x-1)になっています。

なお、テキストの解説を確認すると、Xを「成功するまでの試行回数」と定義した分布で解いているように見えます。成功した回数を含めるために期待値を+1すれば良いので同じ結果は得られるのですが、解説と本文に定義のズレがあるようなので、注意してください。

持っているシールの種類数をmとおくと、mを0~(k-1)までとした確率変数の和の期待値を導出すれば良いことがわかります。ということで、以下のメモの通りとなりました。

f:id:hippy-hikky:20210502224244p:plain

なお、上記の定義での幾何分布の期待値の導出は以下の通りとなりました。

f:id:hippy-hikky:20210502224400p:plain

(等比級数の無限和、また忘れてたのでここでも導出してます。。。効率悪い。。。)

(2) シールが1種類追加されたときの期待値について

問の詳細は以下の通りです。

シールが1種類追加されたあとで、追加された1種類を出して計5枚のシールを集めきるまでの試行回数の期待値をx。 初めから5種類のシールがあったときに5種類のシールを集め切るまでの試行回数の期待値をy。

x-yを求めよ。

ということで、x,yそれぞれ導出してみます。

xについては、(1)の結果を利用して、5種類のシールがあって4種類はすでにあるということで期待値を導出できます。

yについても(1)の結果を利用できて、(1)のk=5で計算すればよいです。

結果は以下の通りとなりました。

f:id:hippy-hikky:20210502225018p:plain

【トップに戻る】

参考資料

【トップに戻る】