(10-13) 真数正規分布と対数正規分布どちらのモデルが株価長期変動幅の分布に適しているか

 ここでは、MSCI株価指数の3ヶ月間値動き率のヒストグラムを検討し、結局、入手可能な40年間の月次時系列データから得られる長期株価値動き率分布の実績からは、データ数不足のため、真数正規分布モデルと対数正規分布モデルに有意な優劣差を付けることは出来なかった。

 前節で株価短期変動分率(1ヶ月程度)は期間内変動幅が数%と小さく、その場合には変動率の真数 r と対応する変動倍率の自然対数log_e(1 + r) = 2.3026×log_10(1 + r) の値に実質的な差は無く、短期株価変動倍率のデータに関しては真数正規分布と対数正規分布の両分布を区別することが無意味であることを示した。

 しかし、価格変動測定期間を長くして当該期間内変動幅の絶対値が大きくなると、変動率の真数 r と対応する変動倍率 1 + r の自然対数 log_e(1 + r) の値の差が大きくなる。テーラー展開を用いると
  log_e(1 + r) = r - (1/2) r^2 + …
となるので、右辺第2項の (1/2) r^2 の値が第1項の r の値の1割程度以上の大きさになれば、つまり r > 0.2 位になると、真数 r と対応する自然対数 log_e(1 + r) の値の区別が付くようになる。このためには、例えばMSCI KOKUSAI指数の月リターンは0.5%、月リスクは5%程度なので、nヶ月間の指数値変動幅の目安 (r’ + σ’) が 0.2 より大きくなればよく、
  r’ + σ’ = n×r + σ×√n = n×0.005 + 0.05×√n > 0.2
となる n を求めると、n > 10 となる。つまり10ヶ月間の株価変動幅のヒストグラムを描けば、真数正規分布モデルと対数正規分布モデルのいずれの方が株価指数変動幅の分布の実情に近いかを判定できることになる。ところが、MSCI株価指数の最長期データでも1969年年末以降の40年間分であり、互いに独立な10ヶ月間株価変動データ数は僅か
  40年 × 12ヶ月/年 ÷ 10ヶ月/個 = 48 個  
となり、少ない。この少ない数のデータのヒストグラムを描いても、分布を再現するのに適切なモデルが真数正規分布と対数正規分布のいずれであるかを選択することは極めて困難であろう。

 スムースなヒストグラムを得るには、確率変数(ヒストグラム横軸)を区切る幅Δを、標準偏差σと総データ数Nから以下のように計算して
  Δ > [(100 ~ 300) ÷ N] σ
と同程度ないしこれ以上に大きく取る必要がある。つまりヒストグラムの横軸の分解能を上げるにはデータ総数 N を大きくしなければならない。価格変動を測る単位期間 (nヶ月) を長くしなければ変動率の真数 r と対応する変動倍率の自然対数 log_e(1 + r) の値の差が出ず、一方、単位期間を長くすると総データ数 N が少なくなってスムースな(即ち確率変数分解能が充分高い)ヒストグラムを描けなくなる。従って、株価指数の40年間の月次データから、その指数値変動率の分布が真数正規分布モデルと対数正規分布モデルのいずれによってよりよく再現されるかを見極めるのは不可能であろうと考えられる。

 そうは云っても、やや長期間の値動き倍率のヒストグラムを描くと、予想してなかったことが見えてくるかもしれない。そこで、ある程度のデータ数の確保できる“値動き計測の長い期間”として3ヶ月を選び、MSCI のKOKUSAI Net指数とJAPAN Net指数の3ヶ月間値動き倍率 (真数; 1 + r = x(i+3) /x(i) ) とその常用対数 log_10(1 + r) のヒストグラムを描き、図10-13-1と図10-13-2に示した。
画像
   (図をクリックすると拡大図が出てきます)
画像
   (図をクリックすると拡大図が出てきます)

 図10-13-1と図10-13-2の両図の間に目視で判るほどの歴然とした差は無い、つまり真数正規分布モデルと対数正規分布モデルの間に優劣差は無い。

 細かく見ると、
(1) まず図10-13-1と図10-13-2の左端部分(確率変数<-3σ)を見ると、対数正規分布モデルの理論曲線(図10-13-2の黒プロット)は、真数正規分布モデルの理論曲線(図10-13-1の黒プロット)に較べて、実測頻度分布の赤や黄緑のプロットよりも一層右側にずれて位置している。つまり、対数正規分布モデルは現実に起こった大暴落を真数正規分布モデルに比較して一層「起こりにくい筈のことが起きてしまった」と解釈していることになる。これは1ヶ月値動き率の真数と対数の出現頻度を正規分布と較べたとき(10-12節の記事)と同じ結論である。
(2) 次に図10-13-1と図10-13-2の右端部分 (3σ<確率変数) を見ると、対数正規分布モデルの理論曲線(黒プロット)も真数正規分布モデルの理論曲線(黒プロット)も、実測頻度分布の赤や黄緑のプロットとほぼ一致している。これは、1ヶ月値動き率では+3.5σ以上のめったに起きない株価暴騰が過去40年間には起こった(10-12節の記事参照)。しかし、3ヶ月値動きで見ると+3σ以上の株価暴騰は過去40年間には起こってないということである。そして+3σ以内の値上り率しかないときには、真数正規分布と対数正規分布の両モデルとMSCI株価指数の値上り率分布に有意差が出てこない。

 以上の通り、過去40年間(無料で素人が入手できる最長の時系列データが40年)のMSCI KOKUSAI やJAPAN指数の値動き率の出現頻度分布実績からは、結局、真数正規分布モデルと対数正規分布モデルの優劣を判定できなかった。ただし、対数正規分布モデルは真数正規分布モデルに較べて株価暴落は起こりにくいと予測するので、やや高リスク・高リターン側のポートフォリオを導き易いと推測される。真数正規分布モデルと対数正規分布モデルのそれぞれによる株価の長期予測には大きな差が出るが、その差はこのわずかな差の長期蓄積の効果である。株価変動の40年間の実績値から両モデルの優劣を決着できない以上、どちらのモデルを採用するかは好みの問題である。例えBuy & Holdに徹すると仮定したときには5年・10年の長期予測に差が出ても、実際には半年毎ないし1年毎にリバランスを行い、リバランスに際しては、各金融商品のリターン、リスク、相関係数を再検討してポートフォリオを多少は修正するつもりなら、真数正規分布モデルと対数正規分布モデルのどちらを使っても、資産運用に対して実質的な影響は出ない。
(2010/8/16/UP)(2010/8/21/勘違いの文章を修正)

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

ekrpat
2010年08月21日 16:54
なるほど、長期ホールドでなく定期的にリバランスするなら僅かな差は気にしなくてよさそうですね。

真数正規分布vs.対数正規分布の他、過去データ集計結果の尤度(後述)についても気になってたのですが、これも、定期的リバランス前提なら気にしなくていいのでしょうね。

----

過去データ集計結果の尤度の問題:

たとえば過去データの集計結果が「μ=0.4%、σ=3%」となったとします。これはあくまで「過去データとして発現したμ,σ」にすぎず、「真のμ,σ」とは限りません。さすがに「真のμ=0.1%、σ=2%」ということはないでしょうが、「真のμ=0.39%、σ=3.1%」とか「真のμ=0.41%、σ=3.1%」とかいうことは十分ありそうですし、「真のμ=0.38%、σ=3.2%」とか「真のμ=0.42%、σ=3.2%」とかいう可能性もそれなりにありそうです。このような「真のμ,σが集計結果のμ,σとずれている可能性」にも配慮するなら、集計結果のσにはいくらかの上乗せが必要なはずです(統計学の「検定」の概念で定量的な計算ができると思いますが、詳しくは知らないです)。

この記事へのトラックバック