Kebutuhan pengujian data di luar sampel untuk strategi kuantifikasi

Penulis:Mimpi kecil, Dibuat: 2018-01-26 12:11:58, Diperbarui: 2019-07-31 18:03:38

Big data real-time. Perlunya pengujian data di luar sampel dalam strategi kuantifikasi.

img

  • NO:01

    Kehidupan manusia, dari kecil hingga besar, dari tua hingga tua, sebenarnya adalah proses yang terus-menerus membuat kesalahan, memperbaiki, dan membuat kesalahan, hampir tidak ada yang bisa dikecualikan. Mungkin pernah melakukan banyak kesalahan, yang sekarang terlihat sangat rendah; atau mungkin kehilangan banyak kesempatan untuk naik mobil, seperti: real estat, internet, mata uang digital, dll...

    Sehingga orang yang sering mendengar berkata: "Aku seharusnya tidak"... "Kalau... saya akan... "

    Saya pernah mempertimbangkan pertanyaan ini dan tidak bisa mengatasinya untuk waktu yang lama, tapi kemudian saya mengerti. Sebenarnya, ini bukan sesuatu yang perlu ditakuti, karena setiap pilihan, baik yang benar atau yang salah, akan membawa kita jauh dari hasil yang telah ditetapkan dan menuju ke tempat yang tidak diketahui; dan refleksi kita hanya membuka perspektif Tuhan di luar data sejarah.

  • NO:02

    Saya telah melihat banyak sistem perdagangan yang tingkat keberhasilan saat retesting bisa mencapai lebih dari 50%. Dengan asumsi tingkat kemenangan yang tinggi ini, juga bisa memiliki rasio keuntungan dan kerugian lebih dari 1: 1. Namun, tidak ada pengecualian, sistem-sistem ini pada dasarnya rugi sekali digunakan. Ada banyak alasan yang menyebabkan kerugian, di antaranya adalah, saat retesting, secara tidak sengaja, melihat dari kanan ke kiri, membuka perspektif Tuhan.

    img

    Namun, transaksi adalah sesuatu yang rumit, dan jika kita melihat ke belakang dengan sangat jelas, kita tidak akan tahu apa yang terjadi jika kita tidak mengambil sudut pandang Tuhan, dan kembali ke awal. Ini akan menghalangi masalah akar kuantitatif dan keterbatasan data sejarah.

  • NO:03

    Tetapi bagaimana memanfaatkan data yang terbatas untuk melakukan pengujian strategi transaksi secara komprehensif dalam kondisi data yang terbatas? Biasanya ada dua metode: pengujian posisi dan pengujian silang.

    Prinsip dasar dari pengujian reversal: melatih model dengan data sejarah yang lebih lama sebelumnya, dan memeriksa model dengan data yang relatif lebih pendek berikutnya, dan kemudian terus-menerus memindahkan jendela pengambilan data ke belakang, mengulangi langkah-langkah pelatihan dan pengujian.

    img

    1. data pelatihan: tahun 2000-2001; data pengujian: tahun 2002; Data pelatihan: 2001-2002; data pengujian: 2003; Data pelatihan: 2002-2003, data pengujian: 2004 4. Data pelatihan: 2003-2004, data pengujian: 2005; Data pelatihan: 2004-2005, data pengujian: 2006

    ...dan sebagainya...

    Akhirnya, hasil uji coba (tahun 2002, 2003, 2004, 2005, 2006...) dibuat statistik untuk mengevaluasi kinerja strategi secara komprehensif.

    Di bawah ini adalah gambar yang dapat dijelaskan secara intuitif tentang prinsip-prinsip pengujian retrograde:

    img

    Gambar di atas menunjukkan dua metode pemeriksaan posesif masing-masing.

    Yang pertama adalah bahwa setiap tes memiliki data yang lebih pendek dan jumlah yang lebih banyak. Cara kedua: setiap kali tes, data tes lebih panjang dan jumlah tes lebih sedikit.

    Dalam aplikasi praktis, beberapa kali pengujian dapat dilakukan dengan mengubah panjang data uji untuk menentukan stabilitas model terhadap data yang tidak stabil.

  • NO:04

    Prinsip dasar dari pengujian silang adalah membagi semua data menjadi N bagian, berlatih dengan bagian N-1 setiap kali, dan periksa dengan sisa.

    img

    Pembagian tahun 2000-2003 menjadi empat bagian menurut tahunnya. Proses operasi dari pemeriksaan silang adalah sebagai berikut: 1, data pelatihan: 2001-2003, data pengujian: 2000; Data pelatihan: 2000-2002, data pengujian: 2003 Data pelatihan: 2000, 2001, 2003, data pengujian: 2002 4. Data pelatihan: 2000, 2002, 2003, data pengujian: 2001.

    img

    Seperti yang ditunjukkan di atas: Keuntungan terbesar dari pemeriksaan silang adalah memanfaatkan data terbatas, dan setiap data pelatihan juga merupakan data pengujian. Namun, ada kelemahan yang jelas ketika pemeriksaan silang diterapkan pada pengujian model strategi:

    1. Hasil pengujian model seringkali tidak dapat diandalkan ketika data harga tidak stabil. Misalnya, melatih dengan data tahun 2008 dan menguji dengan data tahun 2005. Kemungkinan besar lingkungan pasar tahun 2008 telah berubah secara signifikan dibandingkan tahun 2005, sehingga hasil pengujian model tidak dapat diandalkan.

    2, Sama seperti yang pertama, dalam pengujian silang, jika model pelatihan menggunakan data terbaru dan model pengujian menggunakan data yang lebih tua, itu sendiri tidak masuk akal.

  • NO:05

    Selain itu, pada pengujian model strategi kuantifikasi, baik pengujian reversal maupun pengujian silang mengalami masalah overlap data.

    img

    Dalam pengembangan model strategi trading, sebagian besar indikator teknis didasarkan pada data historis dengan panjang tertentu. Misalnya, menggunakan indikator tren untuk menghitung data historis selama 50 hari terakhir, dan pada hari perdagangan berikutnya, indikator yang dihitung adalah data 50 hari sebelumnya, maka data dari kedua indikator yang dihitung adalah sama selama 49 hari, yang menyebabkan perubahan indikator tidak jelas setiap dua hari berdekatan.

    img

    Data tumpang tindih dapat menyebabkan efek berikut:

    1, perubahan lambat dari hasil yang diprediksi oleh model menyebabkan perubahan yang lambat dalam kepemilikan, yang sering kita sebut sebagai keterlambatan indikator.

    2. Beberapa nilai statistik untuk pengujian hasil model tidak dapat digunakan, dan hasil dari beberapa pengujian statistik tidak dapat diandalkan karena hubungan urutan yang disebabkan oleh data yang berulang.

  • NO:06

    Strategi perdagangan yang baik seharusnya dapat menguntungkan di masa depan. Pengujian di luar sampel, selain dapat secara objektif mendeteksi strategi perdagangan, lebih efektif menghemat waktu pelanggan luas.

    Dalam kebanyakan kasus, menggunakan parameter optimal secara langsung dari seluruh sampel sangat berbahaya untuk terlibat dalam pertempuran nyata.

    Jika semua data historis sebelum waktu optimasi dilakukan dibedakan menjadi data dalam sampel dan data di luar sampel, lalu data dalam sampel digunakan untuk mengoptimalkan parameter, lalu data di luar sampel digunakan untuk melakukan pengujian di luar sampel, maka kesalahan ini dapat diurutkan, sementara juga memeriksa apakah strategi yang dioptimalkan berlaku untuk pasar masa depan.

  • NO:07

    Seperti halnya perdagangan, kita tidak akan pernah bisa melewati waktu untuk membuat keputusan yang benar untuk diri kita sendiri tanpa kesalahan. Jika ada tangan Tuhan atau kemampuan untuk melintasi kembali dari masa depan, maka tanpa pengujian, langsung masuk ke meja nyata untuk berdagang, dan juga kolam yang bisa diisi penuh. Dan saya, sebagai manusia, harus memeriksa strategi kami dalam data sejarah.

    Namun, bahkan dengan sejarah yang memiliki data besar, sejarah tampak sangat langka di hadapan masa depan yang tak ada habisnya dan tidak dapat diprediksi. Oleh karena itu, sistem perdagangan yang didasarkan pada sejarah yang ditarik dari bawah ke atas akhirnya akan tenggelam seiring waktu. Karena sejarah tidak dapat memiliki masa depan yang tak ada habisnya. Oleh karena itu, sistem perdagangan yang benar dan lengkap harus didukung oleh prinsip / logika yang ada di dalamnya.

    img

  • NO:08

    Kami (penemu Quantum Trading Platform) bertujuan untuk mengubah keadaan saat ini di dunia kuantum yang tidak kering, tidak ada pertukaran, tidak ada penipu, dan menciptakan dunia kuantum yang lebih murni. Dunia ini tidak pernah ada yang menciptakan pengetahuan dan teori, mereka hanya ada menunggu kita untuk menemukan mereka.

    img

    Berbagi adalah sikap, bahkan kebijaksanaan!

Pelancongan online Penulis Hukybo


Lebih banyak