シゲル博士のFX研究室

最終更新日 : 2020/04/19

対数正規分布について知っておくべきこと

Mathematics

対数正規分布の確率密度関数は,

f(x)=12πσ2xexp((lnxμ)22σ2) ,

で定義される.変数xは正の値をとる.また,μσ2は分布を特徴付けるパラメータである.

いくつかのパラメータの組に対して対数正規分布の関数形をプロットすると,下図のようになる.

log-normal distribution
対数正規分布のプロット.正規分布の場合と異なり非対称で,右側に裾野が長く広がっている.

対数正規分布と正規分布の関係

「ある確率変数が対数正規分布に従う」とは「確率変数の対数をとったものが正規分布に従う」ということである.実際,新しい変数をy=lnxで定義し,f(x)dx=g(y)dyと変数変換を行うと,yについての確率密度関数は,

g(y)=12πσ2exp((yμ)22σ2) ,

のように,平均μ,分散σ2の正規分布となる.ここで,確率密度の変換なので,dxdyという微小幅をかけて変換しなければならないことに注意しよう.

対数正規分布を特徴付けるパラメータμσ2は,対応する正規分布の平均値と分散に対応し,対数正規分布そのものの平均値や分散ではないことに注意が必要である.

対数正規分布の累積分布関数

xx0以下の値をとる確率F(x0)は,確率密度関数を0からx0まで積分して,

F(x0)=0x0dxf(x) ,

と計算できる.この関数F(x)累積分布関数と呼ぶ.累積分布関数は下図のようになる.

μ=0σ2=1の場合の対数正規分布の確率密度関数(波線)と累積分布関数(実線).

対数正規分布の場合,この関数を初等関数で書くことはできないが,数値的に任意の精度で計算することができる.

ここで,誤差関数(error function)E(x)

E(x)=12πxxdtet2/2=22π0xdtet2/2 ,

で導入すると,累積分布関数F(x)

F(x)=12[1+E(lnxμσ)] ,

と書くことができる.

ちなみに,誤差関数は

erf(x)=2π0xdtet2 ,

で定義されることが多い.erf(x)=E(2x)の関係があり,erf(x)を使うと,累積分布関数F(x)

F(x)=12[1+erf(lnxμ2σ)] ,

と書くことができる.

誤差関数はerf(x)よりも,先に定義したE(x)の方が便利なことが多い.例えば,

E(1)=0.6826 ,E(2)=0.9544 ,E(3)=0.9973 ,

のように,いわゆる「n-シグマ」の値が,E(n)とシンプルに表される.erf(x)を使うと,n-シグマの値はerf(n/2)と書かなくてはならない.

対数正規分布の平均値・分散・最頻値・中央値

対数正規分布の種々の統計量を,パラメータμσ2で表しておこう.平均値μx=xは,

μx=x=0dxxf(x)=dyeyg(y)=eμ+σ2/2 ,

と計算できる.対応する正規分布に変数変換してから計算すると良い.

同様に,x2の平均値x2は,

x2=0dxx2f(x)=dye2yg(y)=e2μ+2σ2 ,

と計算できるので,分散σx2

σx2=x2x2=e2μ+σ2(eσ21) ,

と求まる.

正規分布と異なり,対数正規分布は右側に長い裾を持つ非対称な分布なので,最頻値や中央値は自明ではない.これらを計算しよう.最頻値は分布のピークなので,分布関数の極値を求めれば良い.

f(x)=f(x)x[1+lnxμσ2] ,

であるから,f(Mx)=0を解いて,最頻値はMx=eμσ2と求まる.

中央値mxは,累積分布関数F(x)を使ってF(mx)=1/2と定義される.ここで,

F(mx)=0mxdxf(x)=lnmxdyg(y) ,

であるから,F(mx)=1/2となるのはlnmx=μのときである.すなわち,中央値はmx=eμと求まる.

最頻値 Mx=eμσ2 F(Mx)=12[1+E(σ)]
中央値 mx=eμ F(mx)=12
平均値 μx=eμ+σ2/2 F(μx)=12[1+E(σ/2)]
分散 σx2=e2μ+σ2(eσ21)

なお,重要な統計量はWikipediaのページにまとまっているので,適宜参照するとよい.

FXで月平均5万円・年利20%の利益を継続中(元本300万円)。感情を排除し、為替データの統計分析のみに基づき淡々とトレードするスタイル。FX歴6年の理学博士(専門:理論物理学)。「FXを科学する」