機械と学習する

統計解析、機械学習について学習したことをまとめていきます

【統計検定準一級】統計学実践ワークブックの問題をゆるゆると解く#9

【概要】

  • 統計検定準一級対応 統計学実践ワークブックの問題を解いていくシリーズ
  • 第9回は5章「離散型分布」から1問

【目次】


はじめに

本シリーズでは、いろいろあってリハビリも兼ねて統計学実践ワークブックの問題を解いていきます。 統計検定を受けるかどうかは置いておいて。

今回は5章「離散型分布」から1問。

なお、問題の全文などは著作権の問題があるかと思って掲載してないです。わかりにくくてすまんですが、自分用なので。

心優しい方、間違いに気付いたら優しく教えてください。

【トップに戻る】

問5.3

問題設定

N=9人のうち、関東出身者(R)は3人、関東以外の出身者(N-R)は6人。

この人らから4人を無作為に非復元抽出した(X_1, X_2, X_3, X_4)。

f:id:hippy-hikky:20210501220535p:plain

(1) X^2_iの期待値E[ X^2_i ]は?

まず、X_iの期待値を考えました。が、結局、X_iは1か0しかとらないので、E[ X_i ]E[ X^2_i ]も同じだと後で気づいたのでどっちで考えてもOKです。

X_iの期待値を考えると、X_iは1か0しかとらないので二つの場合の和になりますが、X_i=0のときは消えてしまうので、結局p(x_i=1)を導出すれば良いということがわかります。

f:id:hippy-hikky:20210501221406p:plain

N人からn人を抽出するということを考えると、1~Nの数字を並べ替えるパターン数(順列数)が全ての場合です。このうち、i番目( i \leq n)に関東出身者(R)がくるパターン数を考えればよいです。このパターン数は、i番目が固定されているので、(N-1)個から(n-1)個を抽出するパターン数ということになります。

ということで、計算すると以下の通りとなりました。

f:id:hippy-hikky:20210501221818p:plain

(2) E[ X_i X_j ], (i \neq j)は?

(1)と同じ考えかたで導出できます。

(1)の考え方ができるまでが苦労しました。。。

f:id:hippy-hikky:20210501222825p:plain

(3) 標本平均 \bar{X} = \frac{1}{4}\sum^{4}_{i=1}X_iの分散V[ \bar{X} ]は?

非独立な確率変数の和の分散はテキストに書かれているとおり以下のようになります。


\begin{align}
 V[\sum X_i] = \sum V[X_i] + \sum_{i \neq j} \mathrm{Cov}[X_i, X_j]
\end{align}

ということで、共分散を導出する必要があります。共分散は期待値を使って導出でき、(1), (2)で導出した結果を利用すれば計算できます。

f:id:hippy-hikky:20210501222958p:plain

Xは同一の分布になるので、共分散パターン数を掛け合わせるところが時折出てきます。共分散成分は、i \neq jとなる組み合わせの数分あり、これは順列数で計算すれば良いのですが、上記のメモに書いたように、分散共分散行列は正方行列であり、対角成分以外の数ということでも計算できます。(というか、こっちが思い浮かんで計算したあとに、解説を読んで納得した次第です)

【トップに戻る】

参考資料

【トップに戻る】