はじめに

切断指数分布に従う乱数の生成が必要になったのですが、ちょっと調べたところ、切断指数分布に従う乱数を生成するためのAPIはあまり用意されてない？っぽかったです。なので本記事では、逆関数法を使って切断指数分布に従う乱数の生成についてまとめます。

（この記事を書く中でさらに調べたところscipyにtruncexponというAPIが用意されていました。なので、切断指数分布が必要な方はこちらを利用したら良いと思います。。。）

本記事に興味がある方はこちらも参考にしてください。

learning-with-machine.hatenablog.com

【トップに戻る】

切断分布

切断分布とは、値域が切断された確率密度関数です。

正規分布を例にするとこんな感じ。オレンジ線が $\mathcal{N}(x | \mu=0.0, \sigma^2=1.0)$ の確率密度関数。青線が同じパラメータで-1から1までの領域に限定した切断正規分布。

f:id:hippy-hikky:20210604222631p:plain

領域が切断されているため、積分して1になるという密度関数の定義を満たすために、値の定義される領域で密度関数の値は切断分布の方が大きくなっています。なので、単純に密度関数を切るだけではないということに注意が必要です。

切断正規分布などは稀に使われているところを見かけます。例えば、事前知識として値の領域が限定されていることがわかっているパラメータの推論をする際の事前分布とか。

【トップに戻る】

逆関数法

逆関数法とは、累積密度関数をの逆関数を利用して、一様分布に従う乱数（一様乱数）から所望の確率密度関数に従う乱数を生成する方法です。

f:id:hippy-hikky:20210604222743p:plain

上図を見れば一目瞭然で、乱数を得たい確率密度関数を $f(x)$ として、その累積分布関数 $F(x)$ を考えます。 $F(x)$ は0から1の範囲の関数なので(確率の定義から)、一様乱数に従うUを $F(x)$ の逆関数 $F^{-1}(U)$ に入力することで、 $f(x)$ に従う乱数xに変換することができます。

ということで、逆関数法を利用するには累積分布関数の逆関数 $F^{-1}(U)$ を導出する必要がありますが、複雑な関数の場合は解析的に導出することが難しい場合もあります。この点については、僕が以前書いたブログで、ノンパラメトリックな分布に対して逆関数法を適用してサンプルを取得している例があります。

【トップに戻る】