AIによる株式投資3カ月で100万円上級【ノイズ除去】

ファイナンスにおいて、共分散行列はいたるところに登場する。共分散行列を用いて、回帰の実行、リスクの推定、ポートフォリオの最適化、モンテカルロ法によるシナリオ・シミュレーション、クラスターの発見、ベクトル空間の次元削減などを実行できる。

経験的(Empirical)共分故行列は、ランダムなベクトルを構成する確率変数間の線形共変動を推定するために、そのランダムなベクトルから生成される観測値系列から計算される。

これらの観測値は有限であり非決定論的であるため、共分散行列の孫定はある程度のノイズを含むことになる。

推定されたファクターから導出される経験的共分散行列もまた、ファクターが欠陥のあるデータから芬定されているため、数値的には悪条件(Ⅲ-conditic ned)である。

このノイズにうまく対処しないと、ノイズが共分散行列をjljいて実行する計算に影響を与え、時には分析を無意味にしてしまうこともある。

経験的共分故行列に含まれるノイズを減らし、シグナルを増強するための手順を説明する。

全体を通して、経験的共分散行列と相関行列は本章で、悦|剄する処理を受けたと仮定する。

Marcenko-Pastur定理

サイズnyVの独立同分布するランダム観測値行列Xを考えようっ観測値を生成する淋在的プロセスの平均値はO、分散は♂とする。行列C=T 1 X’Xの固有値λは、次式で示すMarchcnkc -Pastur確率密度関数(PDF)に漸近的に収束する(yV一十cx)、7’一十(×)と1<‘I人<+ooにおいて)ことが知られている。

シグナルを含むランダム行列

経験的相関行列では、すべての|占|有ベクトルがランダムであるとは隕らない、

スニベット2.3は完令にランダムではない共分散行列を作成する。 

したがってその閥有仙はMarcenk< -P;lstur PDFにおおむねにしかフィットしない。 getRndCov関数で生成される共分散行列はnCols佃のランダム変数で構成されるが、そのうちnFact佃だけがなんらかのシグナルを含んでいる、、 シグナルをさらに希薄化するために、この共分故行列を純粋なランダム行列に収みalphaで加算している。 ランダム共分散行列を構築する別の方法については、Lcwando wski ct al. (2009)を参照のこと。

Marcenko-Pastur分布の当てはめ

ここでは、Laloux et al. (2000)によって紹介されたアプローチに従う。

分散の一部だけがランダムな固有ベクトルによって引き起こされるため、上記の式のなかで♂をそれに応じて調整することができる。

たとえば、最大の固有値に対応する固有ベクトルがランダムではないと仮定すると、1二記の式において♂を♂囗-λ/jV)に雌き換えるべきである。

実際には、関数/[λ]を閥有値の経験分布に当てはめて、インプライド♂を導出することができる。

これによって、相関行列中のランダムな固有ベクトルによって説明される分散が得られ、非ランダムな囚有ベクトルの存在にあわせて、洲整されたカットオフレベルλ。を決定できる。

スニベット2.4は、Marccnko-Pastur確率密度関数をシグナルを含むランダムな共分散行列にフィットさせる。

フィットのII的は、解析的PDFと観測された固有値のカーネル密度推定Z (KDE)との間の二乗差の和を最小にするぶの値を見つけることである(KDEについてはRosenblatt 1956 ;Parzen 1962を参照)。

λ、はeMax0に、♂はvar0に、ファクターの数はnFa(tseに格納される。

フィットしたMarcenkt -Pastur分布の固有値のヒストグラムとPDFをプロットしたものである。

フィットしたM;II・cenko-Pastur分布の右側にある固有値はノイズではなくシグナルに対応している。

このコードは、共分散行列に注人したファクターの数と同じ数の100をnFa(:tseに返す。

共分散行列に含まれるシグナルは弱いが、この手法によってノイズに対応する固有値をシグナルに対応する岡有値から分離することができた。

フィットした分布は♂-。6768であることを示し、分散の約32.32%だけがシグナルに起囚することを示している。以1こが、裁定圧力の結果として低いことが知られている金融データにおけるS/N比を測定する1つの方法である。