Nhu cầu kiểm tra dữ liệu ngoài mẫu trong chiến lược định lượng

Tác giả:Giấc mơ nhỏ, Tạo: 2018-01-26 12:11:58, Cập nhật: 2019-07-31 18:03:38

Dữ liệu lớn trong cuộc chiến thực sự. Cần phải thử nghiệm dữ liệu ngoài mẫu trong chiến lược định lượng.

img

  • NO:01

    Cuộc sống của con người, từ nhỏ đến lớn, từ lớn đến già, thực sự là một quá trình liên tục phạm sai lầm, sửa chữa và phạm sai lầm, hầu như không ai có thể ngoại lệ. Có lẽ đã phạm nhiều sai lầm, bây giờ có vẻ rất thấp; hoặc có lẽ đã bỏ lỡ nhiều cơ hội để lên xe, chẳng hạn như: bất động sản, Internet, tiền kỹ thuật số, vv...

    Cho đến khi một người thường nghe nói: "Tôi không nên"... "Nếu như... tôi sẽ"...

    Tôi đã từng mắc phải câu hỏi này và không thể giải quyết được trong một thời gian dài, nhưng sau đó tôi đã hiểu rõ hơn. Thật ra, điều này không phải là một điều đáng sợ, bởi vì mỗi lựa chọn, dù đúng hay sai, sẽ đưa chúng ta ra khỏi kết quả đã được đặt trước và đi đến một vùng chưa biết; và suy nghĩ của chúng ta chỉ mở ra quan điểm của Thiên Chúa ngoài dữ liệu lịch sử.

  • NO:02

    Tôi đã nhìn thấy rất nhiều hệ thống giao dịch, tỷ lệ thành công khi kiểm tra lại có thể đạt đến hơn 50%. Với tỷ lệ thắng cao như vậy, cũng có thể có tỷ lệ thắng thua hơn 1: 1. Tuy nhiên, không có ngoại lệ nào, các hệ thống này một khi được đưa vào thực tế, về cơ bản là thua lỗ. Có nhiều lý do dẫn đến thua lỗ, trong đó có, khi kiểm tra lại, vô tình, nhìn từ bên phải sang bên trái, mở quan điểm của Chúa.

    img

    Tuy nhiên, giao dịch là một thứ phức tạp, nhìn lại sau này rất rõ ràng, nhưng nếu chúng ta không có cái nhìn của Thiên Chúa, chúng ta sẽ trở lại và vẫn không hiểu được. Điều này làm cho vấn đề nguồn gốc định lượng bị hạn chế bởi dữ liệu lịch sử.

  • Không:03

    Nhưng làm thế nào để tận dụng tối đa dữ liệu hạn chế để kiểm tra toàn diện các chiến lược giao dịch trong bối cảnh dữ liệu hạn chế? Thông thường có hai phương pháp: kiểm tra đẩy và kiểm tra chéo.

    Nguyên tắc cơ bản của kiểm tra đẩy: huấn luyện mô hình bằng dữ liệu lịch sử dài trước đó và kiểm tra mô hình bằng dữ liệu tương đối ngắn sau đó, sau đó liên tục di chuyển cửa sổ lấy dữ liệu về phía sau, lặp lại các bước đào tạo và kiểm tra.

    img

    1, Dữ liệu đào tạo: 2000-2001, dữ liệu thử nghiệm: 2002; 2, dữ liệu đào tạo: 2001-2002, dữ liệu thử nghiệm: 2003; 3, dữ liệu đào tạo: 2002-2003, dữ liệu thử nghiệm: 2004; 4, Dữ liệu đào tạo: 2003-2004, dữ liệu thử nghiệm: 2005; 5, Dữ liệu đào tạo: 2004-2005, dữ liệu thử nghiệm: 2006;

    ... và như vậy...

    Cuối cùng, kết quả thử nghiệm (năm 2002, 2003, 2004, 2005, 2006...) được thống kê để đánh giá tổng thể hiệu suất chiến lược.

    Một hình dưới đây có thể giải thích trực quan các quy tắc của kiểm tra đẩy:

    img

    Hình trên cho thấy hai phương pháp kiểm tra đẩy.

    Thứ nhất: mỗi lần kiểm tra, dữ liệu kiểm tra ngắn hơn và nhiều lần kiểm tra hơn. Phương pháp thứ hai: mỗi lần kiểm tra, dữ liệu kiểm tra dài hơn và kiểm tra ít hơn.

    Trong các ứng dụng thực tế, nhiều lần thử nghiệm có thể được thực hiện bằng cách thay đổi độ dài của dữ liệu thử nghiệm để quyết định sự ổn định của mô hình đối với dữ liệu không ổn định.

  • NO:04

    Nguyên tắc cơ bản của kiểm tra chéo: chia tất cả các dữ liệu thành N phần, mỗi lần thực tập với N-1 phần và kiểm tra với phần còn lại.

    img

    Phân loại năm 2000 đến 2003 theo từng năm và chia thành 4 phần. 1, dữ liệu đào tạo: 2001-2003, dữ liệu thử nghiệm: 2000; 2, dữ liệu đào tạo: 2000-2002, dữ liệu thử nghiệm: 2003 3, Dữ liệu đào tạo: 2000, 2001, 2003, dữ liệu thử nghiệm: 2002; 4, Dữ liệu đào tạo: 2000, 2002, 2003, dữ liệu thử nghiệm: 2001.

    img

    Như hình trên cho thấy: lợi thế lớn nhất của kiểm tra chéo là tận dụng đầy đủ dữ liệu hạn chế, mỗi dữ liệu đào tạo cũng là dữ liệu thử nghiệm; nhưng cũng có những nhược điểm rõ ràng khi kiểm tra chéo được áp dụng cho các mô hình chiến lược:

    Khi dữ liệu giá không ổn định, kết quả thử nghiệm của mô hình thường không đáng tin cậy. Ví dụ, đào tạo với dữ liệu năm 2008 và thử nghiệm với dữ liệu năm 2005. Có thể là môi trường thị trường năm 2008 đã thay đổi rất nhiều so với năm 2005, do đó kết quả thử nghiệm mô hình không đáng tin cậy.

    2, tương tự như ở phần 1, trong kiểm tra chéo, nếu mô hình được đào tạo bằng dữ liệu mới nhất và thử nghiệm với mô hình dữ liệu cũ hơn, nó sẽ không hợp lý.

  • NO:05

    Ngoài ra, khi kiểm tra mô hình chiến lược định lượng, cả kiểm tra đẩy và kiểm tra chéo đều gặp vấn đề chồng chéo dữ liệu.

    img

    Trong việc phát triển mô hình chiến lược giao dịch, hầu hết các chỉ số kỹ thuật đều dựa trên dữ liệu lịch sử một độ dài nhất định. Ví dụ, sử dụng chỉ số xu hướng để tính toán dữ liệu lịch sử trong 50 ngày qua, và ngày giao dịch tiếp theo, chỉ số đó được tính toán lại với dữ liệu 50 ngày trước đó, thì dữ liệu tính toán của hai chỉ số này là giống nhau trong 49 ngày, điều này sẽ dẫn đến sự thay đổi của chỉ số này không rõ ràng trong mỗi hai ngày liền kề.

    img

    Sự chồng chéo dữ liệu có thể gây ra những ảnh hưởng sau:

    Một, sự thay đổi chậm trong kết quả dự đoán của mô hình dẫn đến sự thay đổi chậm trong nắm giữ, đó là những gì chúng ta thường gọi là sự chậm trễ của các chỉ số.

    2, một số giá trị thống kê không được sử dụng để kiểm tra kết quả mô hình, do liên quan đến chuỗi dẫn đến dữ liệu lặp đi lặp lại, làm cho kết quả của một số kiểm tra thống kê không đáng tin cậy.

  • NO:06

    Một chiến lược giao dịch tốt sẽ có thể mang lại lợi nhuận trong tương lai. Các thử nghiệm ngoài mẫu, ngoài việc có thể kiểm tra khách hàng khách quan một cách khách quan, còn tiết kiệm thời gian hiệu quả hơn.

    Trong hầu hết các trường hợp, sử dụng các thông số tối ưu của toàn bộ mẫu trực tiếp là rất nguy hiểm khi tham gia chiến đấu thực tế.

    Nếu phân biệt tất cả dữ liệu lịch sử trước thời điểm tối ưu hóa tham số, chia thành dữ liệu trong mẫu và dữ liệu ngoài mẫu, trước tiên sử dụng dữ liệu trong mẫu để tối ưu hóa tham số, sau đó sử dụng dữ liệu ngoài mẫu để thử nghiệm ngoài mẫu, bạn có thể loại bỏ lỗi này, đồng thời kiểm tra liệu các chiến lược tối ưu hóa có áp dụng cho thị trường tương lai hay không.

  • NO:07

    Giống như giao dịch, chúng ta không bao giờ có thể đi qua thời gian để tự mình đưa ra một quyết định đúng đắn mà không có chút sai lầm nào. Nếu có bàn tay của Chúa hoặc khả năng đi qua và trở lại từ tương lai, thì không được kiểm tra, giao dịch trực tuyến trực tuyến trực tiếp, và cũng có thể có một bể đầy rẫy. Và tôi, những người chết, phải kiểm tra chiến lược của chúng tôi trong dữ liệu lịch sử.

    Tuy nhiên, ngay cả khi có một lịch sử dữ liệu khổng lồ, lịch sử lại rất thiếu hụt khi đối mặt với một tương lai vô tận và không thể đoán trước được. Vì vậy, một hệ thống giao dịch dựa trên lịch sử được đẩy từ dưới lên cuối cùng sẽ chìm trong thời gian. Bởi vì lịch sử không thể có một tương lai vô tận. Do đó, một hệ thống giao dịch dự kiến hoàn chỉnh phải được hỗ trợ bởi các nguyên tắc / logic bên trong của nó.

    img

  • NO:08

    Chúng tôi (những người phát minh định lượng, sàn giao dịch định lượng) nhằm mục đích thay đổi tình trạng định lượng hiện tại, không có hàng rác, giao dịch bị đóng cửa, lừa đảo và tạo ra một vòng định lượng tinh khiết hơn.

    img

    Chia sẻ là một thái độ, và thậm chí là một sự khôn ngoan!

Khách sạn rộng rãi trực tuyến Tác giả: Hukybo


Thêm nữa