機械学習に基づく注文簿 高周波取引戦略

作者: リン・ハーン小さな夢, 作成日:2016年11月16日 16:52:38, 更新日:2016年11月16日 16:55:18

機械学習に基づく注文簿 高周波取引戦略

  • ティオロギー

    証券市場の取引メカニズムは,オファー駆動市場とオーダー駆動市場に分類される.前者は,市場代理人として流動性を供給することを頼り,後者は,制限価格表で流動性を供給し,取引は投資家による買取委託と出售委託の競売によって形成される.中国の証券市場は,オーダー駆動市場であり,株式市場とフューチャー市場を含む.

    img図1 注文を駆動する市場図

    • (一) 制限価格の注文簿の简介

      注文簿の研究は市場微小構造の研究分野に属し,市場微小構造理論は,微小経済学の価格理論とメーカー理論を思想の源泉とするが,その核心問題である金融資産取引とその価格形成の過程と原因の分析において,一般均衡,局所均衡,辺縁利益,辺縁コスト,市場連続性,備蓄理論,賭け理論,情報経済学など様々な理論と方法が用いられる.

      海外の研究の進展から見ると,市場微小構造の領域は,オハラで代表されており,ほとんどの理論は,在庫モデルや情報モデルなど,市場操作市場 (すなわちオファー駆動市場) に基づいている.今年,実際の取引市場の中で,注文駆動が徐々に上位を占めているが,注文駆動市場に特化した研究は比較的少ない.

      国内証券市場と先物市場は,両方のオーダー駆動市場である.下図は,株式指数先物契約IF1312のLevel_1業界オーダーブックスクリーンショットである.上から直接入手した情報はほとんどなく,基本情報は買取価格,売出価格,買取量,売出量を含む.海外のいくつかの学術論文では,オーダーブックに対応する情報簿があり,最も細かいオーダー撮影データを含む,各オーダーの下注量,交付価格,オーダータイプの情報を含む.国内市場で公開されていない情報簿の情報から,我々は超高周波取引のみを頼る.

      img図2 株式指数の主要期貨 Level-1 注文簿

    • (二) 注文簿 高周波取引の研究の進展

      注文簿のダイナミックモデリングには,従来の計量経済学方法と機械学習方法が主に2つの方法がある.計量経済学方法は,研究価格差分析のMRR分解,黄とストール分解,注文持続のACDモデル,研究価格予測のロジスティックモデルなどの古典的な主流の研究方法である.

      金融分野における機械学習に関する学術研究も非常に活発である.例えば2012年のForecasting trends of high_frequency KOSPI200 index data using learning classifiersは,技術分析の一般的な指標 (MA,EMA,RSIなど) を利用して機械学習の分類方法を導入して市場予測を行う一般的な研究思想である.しかし,この慣習は注文簿動態情報の挖掘が不足している.つまり,注文簿動態情報を活用して高いレバレッジ取引を行う研究は国内外でも比較的少ない.これは深く研究に値する分野である.

  • 2 注文簿の高周波取引における機械学習の応用

    • (1) システムアーキテクチャ

      下の図は,典型的な機械学習取引戦略のシステムアーキテクチャであり,オーダーブックデータ,特徴発見,モデル構築と検証,取引機会のいくつかの主要なモジュールを含む. 注目すべきは,取引プロセスは市場イベントによって引き起こされ,ティック市場の到着はそれらのイベントの1つです.

      img図3 機械学習に基づく注文簿モデリングのシステムアーキテクチャ

    • (二) サポートベクトルマシン説明書

      1970年代,ヴァプニク氏らは比較的に完全な理論体系である統計学習理論 (SLT) を構築し始めた.これは,限られたサンプルの状況下での統計規則と学習方法の性質を研究するために使用され,限られたサンプルの機械学習問題に対して良い理論的枠組みを確立し,小サンプルの問題,非線形,高次元数,局所極小点などの実用的な問題をよりうまく解決した.1995年にヴァプニク氏らは,新しい汎用的な学習方法であるSVM (Support Vector Machine) を明確に提案した.この理論は広く重視され,さまざまな分野に適用され,初期には方法よりも多くの優位性を示した.

      SVMは,線形分別可能な状態における最適分別超平面から発展した.二つの種類の分別問題に対して,訓練サンプルセットを ((xi,yi),i=1,2...l,lとして訓練サンプル個数,xiとして訓練サンプルとして設定し,yiは{-1+,1}として入力サンプルのxiの等級標識 (期待出力) である.SVMアルゴリズムの出点は,最適分別超平面を探すことである.

      最適な分類超平面は,すべてのサンプルを正しく分離できるだけでなく,両クラス間の限界を最大にすることができる.限界は,訓練データセットからその分類超平面までの最小距離の和として定義される. 最適な分類超平面とは,テストデータに対する平均分類誤差が最小であることを意味する.

      d次元ベクトル空間に超平面がある場合:

      F(x) =w*x+b=0

      上記の2つのデータを分離できる場合は,この超平面を分割インターフェースと呼ぶ.ここでw*xは二次元ベクトル空間における二つのベクトルwとxの内積である.

      インタフェースを分割すると:

      w*x+b=0

      この区切り界面に最も近い2つのサンプル間の距離 (margin) を最大にするには,この区切り界面を最優位区切り界面と呼ぶ.

      img図4 SVM二次分類の最優位性インターフェース図

      最優位点インターフェースの方程式を集約することで,2つのサンプルの間の距離を

      img

      任意のサンプルに対して,

      img

      上の式を満たすだけでなく,最小化することも必要です.

      このSVMの問題の数学モデルは:img

      SVMは最終的に最も最適化された計画問題となり,学術界の研究焦点は,迅速な解答,マルチクラスへの普及,実際の問題への応用などに集中している.

      SVMは,最初は二次分類問題のために提案され,現在の実用的なアプリケーションの要求に応じて,多次分類問題にも普及した.既存の多次分類アルゴリズムには,一対多,一対一,誤差修正コード,DAG-SVM,およびMult i-class SVM分類器などが含まれている.

    • (3) 注文簿指標の抽出

      株価指数先物レベル-1の例として,注文簿は主に買取価格,売出価格,買取量,売出量などの基本指標を含み,深さ,傾斜,相対差などの指標を衍生することができる.他の指標には,保有量,取引量,基差などを含む合計17の指標が含まれ,以下の表のように.また,一般的な技術分析指標であるRSI,KDJ,MA,EMAなどの指標も導入することができる.

      表1 レベル市場オーダーブックに基づく指標データベース

      img

    • (四) 注文簿の動力特性と取引機会

      市場微观の観点から,短期間の価格動向を測定する方法は2つある.一つは中間価格動向,もう一つは差値交差である.この記事では,よりシンプルで直感的な中間価格動向を選択する.中間価格の定義:

      img

      オーダーブックにおけるΔt内の中間価格ΔPの変動の大きさは,上下平衡の3つのカテゴリーに分けられる.

      下のグラフは,主契約IF1311の10月29日の中間価格動力の分布であり,1日32400のティック市場データがあります.

      Δt=1tickの場合,中間価格の絶対値は0.2で約6000回,絶対値は0.4で約1500回,絶対値は0.6で約150回,絶対値は0.8で50回以上,絶対値は1で約10回以上変化する.

      Δt=2tickの場合,中間価格の絶対値は0.2で約7000回,絶対値は0.4で約3000回,絶対値は0.6で約550回,絶対値は0.8で約205回,絶対値は1より大きく約10回変化する.

      変化の絶対値が0.4より大きい場合,潜在的な取引機会と考えます.Δt=1tickの場合,1日あたり約1700回のチャンス;Δt=2tickの場合,1日あたり約4000回のチャンスです.

      img

      図5 IF1311 10月29日の中間価格変動の分布図 (Δt=1tick)

      img

      図6 IF1311 10月29日の中間価格変動の分布 (Δt=2tick)

  • 3 戦略的証拠

    SVMモデルは,大きなサンプルの場合の訓練が複雑で,訓練時間が長いため,我々はIF1311契約の10月のレベル_1の市場データを例として,モデルの有効性を検証するために,歴史的な市場データ跨度が比較的短いことを選択した.

    • (1) モデル効果の検査

      データサイクルは,IF1311契約の10月の市場データです.

      Δt取付:Δtが小さいほど,取引詳細に要求が高くなる.Δt=1tickの場合,実際の取引で利益を得ることは困難である.モデルの効果を比較するために,ここで1tick,2tick,3tickを取付する.

      モデル評価指標:サンプル正確性,検査正確性,予測時間.img表2 1 tick のデータによる 1 tick の予測効果

      img表3は1tickデータで2tickの効果を予測する

      img表4 2tickのデータを2tickで予測する効果

      この3つの表のデータから,以下のような結論を導き出せる. 最上限精度は70%程度で,精度は60%で,取引戦略に変換できます.

    • (二) 戦略的な模倣利益

      10月31日の例として,我々は模擬取引を行います. 機関の株式指数フューチャー取引手続費は一般的に0.26/10000です. 取引回数が制限されていないことを仮定します. 取引ごとに単発値が0.2ポイント,単発手数が1人であると仮定します.

      表5 10月31日の取引状況の模擬戦略img

      日中605回取引,手続を含む場合,利益339回,勝利率56%,純利益11814.99元.

      理論上の滑り値が14,520元であり,この部分は戦略的実戦の鍵である.下注の詳細がより精密に制御されれば,滑り値を減少させ,純利益を増やすことができる.下注の詳細が適切に制御されていない場合,または市場変動異常がある場合,滑り値が大きくなり,純利益が減少する.したがって,高周波取引の成功は,詳細の実行に依存することが多い.

      図7 10月31日の模擬戦略の収益img

原文の声明: 本文の原作は広客公众号.


もっと

エヴァン1987オーダー・薄を研究する方法を学んでいる