吉野家とマックをこよなく愛する外資金融マンwww

目的は利他的、されど体裁は利己的。矛盾。くそ。

特別回④:非線形モデルの解説(基礎編)

今回は非線形確率モデルについての解説

たまにロジット・プロビットといった確率モデルを耳にすると思うが、それらがどういう意味合いを持って用いられているかもあわせて解説していこうと思います。

 

まず初めに非線形確率モデルとは何か、そして何のために用いられているかをまとめると

 

”線形モデルでは正確に表すことのできない質的な説明変数をその決定の背後にある潜在変数の考察によって説明していくモデル”

さらに詳しく踏み込むと(どのようにそれをやるかというと)、

”説明変数の示す事象の潜在変数がある臨界値を超えたら事象が起こるとして、事象の起こりうる確率を潜在変数の累積密度関数として考察すること”である

 

仮定は次のとおりである。

仮定

1.事象Yの潜在変数Y*をY* = α+βX+εと定義する

2.Y*>0となったら事象Yが起こるとする

また、これら2つの仮定に基づくと

Y*>0→Y *= α+βX+ε>0→ε>-α-βXとおける

そこで最後の仮定

3.εの密度関数をP、累積密度関数をFとする

 

これらの仮定に基づくと事象Yが起こる確率は次のように表せられる。

 

P(Y=1)=P(Y*>0)=P(ε>-α-βX)=1-F(α-βX)

 

ここで一つ問題となってくるのが誤差項εの分布の仮定である。

この仮定によって非線形確率モデルの性質が変わる。ロジットやプロビットもこの分布の仮定の違いである。以下両者を取り上げていく。

 

1.ロジットモデル

 

上述したい潜在変数(正確にはε)の確率分布、及びYの累積分布関数とししてロジスティック分布を当てはめたものである。

 

ロジスティック分布を簡潔にまとめると、

 

”釣鐘型の正規分布に似ている分布”

 

イメージとしては密度関数、累積分布関数がこんな感じ

f:id:goldninjass:20160409164903p:plainf:id:goldninjass:20160409164908p:plain

(Wikipediaより引用)

 

ではこのロジスティック分布を通じてどのように分析して解釈するかについて解説すると、

 

まずロジスティック分布の累積分布関数に基づくとYが起こる確率は

 

P=1/(1+e^(-(α+βx)) ) 

 

(ロジスティック分布の累積分布関数は厳密にはeの指数がx、s、μという3つのパラメーターで決められる関数とされるが、μ=0、s=1の仮定を置くとそのままXの単独変数で決まる関数となる)

 

非線形は線形モデルの最小二乗法のように直接分析してパラメーター推定はできないので、線形の形に直してα、βのパラメーター推定を行うのである

 

上のPの式を使って保有確率と非保有確率の比をとると

 

P/(1-P)=e^(a+βx) という式が得られ、さらに両辺の対数をとると以下のような線形モデルの形に変換できるのである。

 

Ln{P/(1-P)}=a+βx

 

ここでは詳しく説明しないがこの式を最尤法に基づいて繰り返し計算して最も適切な値を導くのである。

簡単に紹介すると

ある事象の仮定した理論値の分布が実際の観測値の分布に最も近づくようにPを定義する手法である。

 

Ln{P/(1-P)}=a+βxという式を再びもってくる。

 

上記のプロセスで算出された係数α、βの解釈についてだが、

 

対数が%変化を表すことを思い出すと、X1単位の増加が事象の起こりうる、えないのオッズを平均してβ上げる(下げる)ことを意味する

 

大事なとこだけもう一度おさらいすると、ロジットモデルについては以下のようになる

1.線形モデルでは正確に表すことのできない質的な説明変数をその決定の背後にある潜在変数の考察によって説明していくモデル

2.説明変数の示す事象の潜在変数がある臨界値を超えたら事象が起こるとして、事象の起こりうる確率を潜在変数の累積密度関数として考察する

3.事象Yの累積分布関数としてはP=1/(1+e^(-(α+βx)) ) で表せ、正規分布に似たロジット分布を用いる

4.線形的なパラメーター推定をするために事象のオッズ比であるロジット変換Ln{P/(1-P)}=a+βxを行った上で、ある事象の仮定した理論値の分布が実際の観測値の分布に最も近づくようにPを定義する手法である最尤法に基づいてパラメーター推定をする。

5.係数の単位あたりの変化がβの係数分、事象のオッズ比の増減につながる

 

2.プロビットモデル

 

次にプロビットモデルについてだが、本質的な部分はさきほど説明したロジットモデルと変わらない。仮定において事象Yの累積分布関数が標準正規分布になっただけの話である。

ちなみに正規分布については以下の記事で簡単に取り上げている

goldninjass.hatenablog.com

 

では考え方のフレームワークは身についているとして、ここでは標準正規分布の累積密度関数と変換方法、そして係数解釈は紹介する

 

正直式も紹介する必要はない気がするが、式は以下のようになる

standard normal distribution

 

ここでZは-α-βXにあたる。

 

ここで先ほどのロジットモデルと異なるところとして、ロジット変換のようにパラメーターα-βXを線形の形で分析したいのだが、有意な形で導くことができない。

 

このようなパターンではパラメーターの保有確率への限界効果に注目するのである。ただし、ここで注意しなければならないのが、βの値が直接確率への限界効果にはならないということである。

 

以下の計算をみれば自明である

 

dP/dX = d(1-F(-α-βX))/dX = βf(-α-βX)

 

積分布関数を微分したら密度関数になることからfは標準正規分布の密度関数である。つまり限界効果の解釈は以下のようになる。

 

dP/dX = βf(-α-βX)

 

強いて言葉をつけるのであれば、

 

Xが1単位増加するたびに事象Yの起こりうる確率が標準正規分布の密度関数をYの潜在変数の誤差項ε(潜在変数のパラメーター)で評価した値にβをかけた分だけ増減するということである。

 

 

だいぶ専門的になってしまったが、こんなところ。細かい計算とかは申し訳ないけど自分でやってください笑

 

次回はこれらのモデルがファイナンスやバリュエーションのモデルで実際どのように使われたかの例を紹介します