AIによる株式投資3カ月で100万円上級【ファイナンス・リサーチの未来】

インターナショナル・データ・コーポレーション(IDC)は、利用可能なデータの80%が非俳造化データであると推定している(IDC 2014)。

利川できる新しいデータセットの多くは、高次元、スパース、または非数値である。

こうした新しいデータセットは複雑なため、回帰モデルなどの線形代数的または幾何学的アプローチを用いてできる分析には限界がある。

古いデータセットであっても、従来の定量的手法では、変数間の複雑な(たとえば、非線形で相互作用的な)関連性を捕捉できない可能性がある。

またこれらの手法は、金融データにつきものの多重共線性にきわめて敏感である(Lopezde Prado 2019b)。

経済学とファイナンスは、機械学習手法の採用によって多くの恩恵を受ける余地がある。

2018年11月26日時点で、Web of Science 4 には、「経済学」と「統計・確率」の共通分野のジャーナル記事が13.772件掲載されている。

そのなかで、「分類器」「クラスタリング」「ニューラルネットワーク」「機械学習」のいずれかの用語を含む論文は89本(0.65%)にとどまっている。

「生物学」と「統計・確率」の共通分野の40.283件の論文のうち、これらの用語が含まれているのは4,049件(10.05%)、「化学・分析」と「統計・確率」の共通分野の4.994件の論文のうち、これらの用語が含まれているのは766件(15.34%)であった。

計量経済学はデジタル・コンピューティングの黎明期よりも前に生まれた。

ほとんどの計量経済学モデルは、手作業で推定するために考案されたものであり、その時代の産物である。ロバート・ティブシラニの言葉を借りれば、「人々がある方法を使うのは、それがすべての始まりであり、それに慣れているからです。それを変えるのはむずかしいのです」.

21世紀の学生は、レガシーテクノロジーに過度に触れるべきではない。

また、歴史上最も成功しているクオンツ投資会社は、計量経済学ではなく主に機械学習を活用している。

現在、大学院教育では計量経済学が優勢であるが、これは学生を実務界ではなくアカデミック・キャリアに向けて準備させていることになる。

これは計量経済学がその有用性を失ったことを意味するものではない。

計量経済学と機械学習のどちらかを選択するように求めるのは間違いである。

計叺経済学と機械学習はそれぞれ異なる強みをもっているため、お互いに補完し合うことができる。

たとえば、機械学習は理論の構成要素を研究者に示唆するのに役立つし、計量経済学は経験的観測に基づいた理論を検証するのに役立つ。

実際には、セミパラメトリック法のように、両方のパラダイムを同時に適Jljしたいと思うこともある。

たとえば、回帰において、観測可能な説明変数と機械学習アルゴリズムが与える制御変数を組み合わせることも可能である(Mullainathan and Spiess 2017)。

このようなアプローチにより、省略された回帰変数によるバイアスに対処できる(Clarke2005)。