機械と学習する

統計解析、機械学習について学習したことをまとめていきます

【統計検定準一級】統計学実践ワークブックの問題をゆるゆると解く#28

【概要】


【目次】


はじめに

本シリーズでは、いろいろあってリハビリも兼ねて統計学実践ワークブックの問題を解いていきます。 統計検定を受けるかどうかは置いておいて。

今回は13章「ノンパラメトリック法」から1問。

なお、問題の全文などは著作権の問題があるかと思って掲載してないです。わかりにくくてすまんですが、自分用なので。

心優しい方、間違いに気付いたら優しく教えてください。

【トップに戻る】

問13.1

問題

血圧を下げる薬剤AとBがある。Aの方が新規で開発したもので、Bよりも効果が高いことが期待されている。

ということで、帰無仮説と対立仮説として以下のものを検定していきたいということになります。

  • H_0 : Aの効果 = Bの効果
  • H_1 : Aの効果 > Bの効果

(1) 6人の患者をランダムに3:3に分けてA, Bを投与。順位和検定における片側P-値はいくらか?

データについては以下のメモを参照ください。

検定というのは、ある仮定(基本的には帰無仮説)に基づいているとしたときに、手元のデータが発生する確率は大きいのか小さいのかを議論する枠組みです。確率がすごく小さいなら、仮定が間違っている、つまり帰無仮説が棄却される、ということになります。

本章で扱うノンパラメトリック法も同様で、効果が同じであると仮定するなら、順位などはランダムに生じるはずと考え、実際のデータがどの程度ずれているのかを議論します。

ということで本問題については、A, Bの各群の順位の和がランダムに生じているとするなら確率はいくらかというのを計算します。今回のデータでは、A群の順位和が7であり、和が7以下になる組み合わせは二通りしかありません。全体の組み合わせすうは20通りとなるので、結局10%ということがわかります。

f:id:hippy-hikky:20210623161011p:plain

(2) 別に被験者を募って順位和検定を行ったところ、片側P-値が3%未満になった。この場合、最低何人の被験者がいたか?

(1)の手順を思い起こすと、P-値は「対象の組み合わせ数」/「全体の組み合わせ数」です。”最低何人”の被験者が必要かという問なので、対象となる組み合わせ数は1が最小の数となります。

人数が6人の場合、組み合わせ数は20通りが最大です。3:3に分ける以外の組み合わせ数は20よりも小さくなることは、実際に計算しても容易にわかりますし、エントロピーを考えてもわかります。ということで6人の場合は5%が最小となります。

というのを他の人数で試していけばよく、結局、7人が最小人数であることがわかります。

f:id:hippy-hikky:20210623161842p:plain

(3) 患者3人にA, Bを投与し血圧値の差を比較した。符号付き順位検定を行う場合の片側P-値はいくらか?

これも順位和検定と同じような考え方の検定ですね。帰無仮説が正しいならば、符号はランダムになるはずだが、それとどの程度のずれがあるのかを評価しています。

今回のデータの場合(以下のメモのDを参照)、被験者は3人なので、1~3に符号がつくパターンは8通り、今回は順位の和が5なので、5以上となる組み合わせは2。ということで25%ということがわかりました。

f:id:hippy-hikky:20210623161906p:plain

(4) (3)と同様の検定を別の被験者を募って実施したところP-値が5%未満になった。この時最低でも何人の被験者がいたか?

やり方は(2)と全く同じです。

n=3, 4,,,, と評価していきます。

f:id:hippy-hikky:20210623162424p:plain

【トップに戻る】

参考資料

【トップに戻る】