量化戦略のサンプル外データテストの必要性

作者: リン・ハーン小さな夢, 作成日: 2018-01-26 12:11:58, 更新日: 2019-07-31 18:03:38

実戦的なビッグデータです 量化戦略としてサンプル外でのデータのテストが必要なのです

img

  • NO:01

    幼いから大人まで,大人から老人まで,人間の人生は,事実,過ちを犯し,修正し,過ちを繰り返すプロセスであり,ほとんど誰も例外はできない.おそらく,多くの過ちを犯し,現在では非常に劣等に見えます.または,不動産,インターネット,デジタル通貨など,多くの乗車する機会を逃したかもしれません.

    聞いている者が言う. "最初はそうすべきじゃなかった"... "もし...私が...だったら"

    この疑問は長い間抱えていましたが,その後になって理解しました. 実際,これは恐れられるべきことではありません. なぜなら,そのとき,正しいか間違っているかに関わらず,あらゆる選択は,私たちを既定の結果から,未知の方向へと遠ざけ,私たちの反省は,単なる歴史的データ以外で,神の視点を開くだけです.

  • NO:02

    復習時に成功率が50%以上になる取引システムもたくさん見ました.この高い勝率を前提に,1:1以上の損損比も可能です.しかし,例外なく,これらのシステムは,一度実盤に投入すると,基本的に損失です.損失を引き起こす理由はたくさんあります.そのうちの1つは,復習時に,無意識に,右から左に,神の視点を開くことです.

    img

    しかし,取引は,このような絡み合っているものであり,後見では非常に明確ですが,もし私たちが神の視点の光環を持たないと,最初に戻っていれば,まだ理解できないのです.これは量化的根源の問題や歴史的データの限界に触れます.

  • NO:03

    しかし,限られたデータの中で,限られたデータを最大限に活用して取引戦略を全面的に検証するにはどうすればよいか?通常,2つの方法があります.推移検査と交差検査.

    推移式検査の基本原理は,前回の長い歴史データでモデルを訓練し,その後の比較的短いデータでモデルを検査し,その後,データ収集の窓を絶えず後方に移動し,訓練と検査のステップを繰り返す.

    img

    訓練データ:2000年から2001年,テストデータ:2002年. 2 訓練データ:2001年から2002年 テストデータ:2003年 3 訓練データ:2002年から2003年 テストデータ:2004年 4 訓練データ:2003年から2004年 テストデータ:2005年 5 訓練データ:2004年から2005年 テストデータ:2006年

    メディアの報道によると,

    最後に,2002年,2003年,2004年,2005年,2006年...) のテスト結果を統計化して戦略のパフォーマンスを総合的に評価します.

    推移式検査の原理は,次の図で直感的に説明できます.

    img

    上図は,推移式検査の2つの方法を示しています.

    "つ目は,テストデータが短く,テスト回数が多くなる. 2つ目は,テストデータが長くなって,テスト回数が少なくなる.

    実用的な応用では,テストデータの長さを変更することで,モデルが非平衡データに対して安定しているかを判断するために,複数のテストを行うことができる.

  • NO:04

    クロステストの基本原理は,すべてのデータ等式をNつの部分に分け,それらのN-1の部分で訓練し,残りの部分でテストする.

    img

    2000年から2003年の間を各年ごとに4つの部分に分けます.そのクロスチェックの操作は以下の通りです. 1,訓練データ:2001-2003,テストデータ:2000; 訓練データ:2000-2002,テストデータ:2003; 3, 訓練データ:2000,2001,2003,テストデータ:2002; 訓練データ:2000,2002,2003,テストデータ:2001.

    img

    上記の図のように,クロステストの最大の利点は,限られたデータを充分活用することであり,各トレーニングデータはテストデータでもある.しかし,クロステストを戦略モデルへのテストに適用する際には,明らかな欠点もあります:

    価格データが不安定している場合,モデルのテスト結果はしばしば信頼できない.例えば,2008年のデータでトレーニングし,2005年のデータでテストする.2008年の市場環境は,2005年と比較して大きく変化した可能性が高いため,モデルのテスト結果は信頼できない.

    2、第1項と同様に,クロスチェックでは,最新のデータでトレーニングモデルを試す場合,古いデータでテストモデルを試す場合,それ自体が論理的ではない.

  • NO:05

    さらに,量化戦略モデルをテストする際に,推移式検査と交差式検査の両方でデータ重複の問題が発生する.

    img

    取引戦略モデルの開発において,ほとんどの技術指標は,一定の長さの歴史的データに基づいている.例えば,傾向指標を使用して過去50日間の歴史的データを計算し,次の取引日に,その指標がその取引前の50日間のデータで計算された場合,計算した2つの指標のデータは49日間の同じであり,これは,2つの隣接する日にこの指標の変化をほとんど目立たなくさせる.

    img

    データの重複は,以下の影響をもたらす:

    1,モデル予測の結果の遅い変化が持株の遅い変化につながります.これは私たちがよく言う指標の遅延です.

    2, モデル結果検査のいくつかの統計値が利用不能であり,重複データによる配列関連性により,いくつかの統計検査の結果が信頼できない.

  • NO:06

    優れた取引戦略は,将来的に利益を得ることができるはずです. 抽出テストは,取引戦略を客観的に検知するだけでなく,より効率的にブロード客の時間を節約します.

    ほとんどの場合,サンプル全体の最適なパラメータを直接採用することは,実戦への投入は非常に危険です.

    パラメータ最適化が行われる時間前のすべての歴史的データを区分し,インサンプルのデータとアウトサンプルのデータに分割し,インサンプルのデータを使用してパラメータ最適化し,アウトサンプルのデータを使用してアウトサンプルのテストを行う場合,このエラーを排序し,同時に最適化された戦略が将来の市場に適用されるかどうかを検証することができます.

  • NO:07

    取引のように,私たちは決して時間を渡って,自分自身のために,少しも間違いのない正しい決断を下すことはできません. もし神の手,あるいは将来から戻る能力があるなら,テストを受けずに,直接オンラインのリアルディスクに取引し,また,ポケットが満タンです.そして,私,凡人は,歴史のデータで私たちの戦略を検証する必要があります.

    しかし,膨大なデータを持つ歴史でさえ,無限で予測不可能な未来に直面すると,歴史は極めて乏しく見える.したがって,歴史に基づいた,下から上へと推し進める取引システムは,最終的に時間の流れに沈み込む.歴史は,未来を尽きることがない.したがって,完全な正の期待取引システムは,その内在の原理/論理によって支えられなければなりません.

    img

  • NO:08

    私たちは (発明者 量化 量化取引プラットフォーム) 既存の量化サイクルを 乾燥し 取引が閉ざされ 詐欺師が横行している状態を 変え,より純粋な量化サイクルを作り出そうとしています.

    img

    共有は態度であり,より賢明です!

広域客はオンライン 作者:フキボ


もっと