機械と学習する

統計解析、機械学習について学習したことをまとめていきます

【統計検定準一級】第8章 統計的推定の基礎 #4【番外編】

【概要】

  • 統計検定準一級対応 統計学実践ワークブックの問題を解いていくシリーズの番外編
  • 8章「統計的推定の基礎」の内容をまとめます
  • 今回は推定量を評価する基準として、サンプルサイズが大きいときの漸近的な性質を議論します
    • 正直理解できてないです。折を見て再度挑戦しよう
  • おまけとして、不偏分散の導出も載せています

【目次】


はじめに

統計学実践ワークブック(参考資料1)」の問題を解いていくシリーズをやっていく中で、8章「統計的推定の基礎」の内容をさっぱり理解していないことがわかったので、改めて整理しています。

参考にした資料は参考文献に列挙しています。中でも主に文献4を参考にしています。

心優しい方、間違いに気付いたら優しく教えてください。

【トップに戻る】

8章の流れ

統計の目的の一つとして、「未知パラメータの推定」という問題があり、この章ではその中でも「点推定」について扱っています*1。「区間推定」については9章で扱われています。

  • 情報の集約
    • 推論を行うにあたって、生データを全て保存するのではなく、情報を集約できればうれしい(メモリ的に)
    • 「十分統計量」
  • 推定法
    • パラメータの点推定を行うためにはいくつか方法がある
    • モーメント法
    • 最尤推定
  • 定量の評価、推定量の性質
    • 推定法は複数の方法がある。推定量は、真のパラメータ\theta *2の周辺に集中して欲しい。そこでその期待を満たすかをいくつかの指標で評価する。
    • 不偏性
      • 定量に偏り(バイアス)がない推定量が望ましい
      • クラメール・ラオの不等式 : 不偏推定量の分散の下限を評価
      • 有効推定量 : クラメール・ラオの不等式を満たす不偏推定量
    • 漸近的性質
      • 標本サイズを大きくしたと仮定した場合の漸近的な評価基準についての議論
      • 一致性 : 推定量が真のパラメータ\thetaに確率収束すること
      • 漸近有効性 : 漸近的な分散が下限に達していること(クラメール・ラオの下限に対応)
      • → 一致性
      • → 漸近正規性

この流れに沿って、確認内容をまとめていこうと思います。

今回は推定量を評価する基準として、サンプルサイズが大きいときの漸近的な性質を議論します。

【トップに戻る】

定量の性質

前々回は、パラメトリックなモデルにおけるパラメータの推論方法として、「モーメント法」と「最尤法」を扱いました。

パラメータの推論方法は他にも事後確率最大化法(MAP推定)などの方法がありますが、それらの推定量の性質を評価して、どのような推定量が好ましいのかを議論していきます。

漸近的性質

標本サイズnが大きい時の推定量の性質がわかれば、推定量が良いものか判断できます。

一致性(consistency)

定量\hat{\theta}が一致性を持つとは、以下のようにnを大きくしていくと\hat{\theta}が真のパラメータ\thetaに確率収束することとあります。


\begin{align}
 \lim_{n \rightarrow \infty} P(|\hat{\theta}_n - \theta| \ge \epsilon ) = 0
\end{align}

以下の手書きメモにあるように、チェビシェフの不等式を使って導出できることがわかります。

f:id:hippy-hikky:20210514172040p:plain

漸近有効性(asymptotic efficiency)

漸近有効性については、用語を整理するだけです(正直理解できてないところです)。

「有効推定量」というのは前回の議論で出てきましたが、分散がクラメール・ラオ下限な不偏分散でした。

「漸近」有効性ということで、漸近的な分散がクラメール・ラオの下限を示すというのが「漸近有効性」です。

f:id:hippy-hikky:20210514173052p:plain

おまけ:分散の不偏性

これだけだと寂しいので、不偏分散の導出をおまけとしてまとめます。

分散といったら標本分散がよく使われていますが(最尤推定量ですし)、前回標本分散にはバイアスがあるということを述べました。そのため、不偏分散と比較していましたが、この不偏分散はなぜあの式なのかを証明してみます。

例によって手書きなので読みにくいと思いますが、やっていることはシンプルです。まず、標本分散の期待値を計算します。この期待値から、真の分散\sigma^2が期待値になるにはどうしたら良いかを考えます。

f:id:hippy-hikky:20210514173703p:plain

【トップに戻る】

参考資料

【トップに戻る】

*1:ここではパラメトリックなモデルを扱っています。ノンパラメトリックな方法については本書に記載があるのかは未確認です。

*2:真のパラメータってなんだ?という議論についてはここでは立ち入らないです。テキストの内容についてなるべく素直に読み解いていきます。