Điều làm cho giao dịch theo chương trình thực sự trở nên phổ biến là sự kiện Oolong Thumbs of the Sun, một chứng khoán lớn đã gây sốc cho toàn bộ thị trường hai năm trước, khi thumbs of the Sun tăng hơn 5% trong một phút do lỗi tạo ra và thực hiện lệnh của chương trình giao dịch tần số cao của nhà môi giới ETF này.
Từ 7·31 của Trung Quốc tài chính tương lai giao dịch, để Cung Tâm giao dịch công bố liên tục hạn chế các biện pháp giao dịch đối với ba lô tài khoản, và sau đó đến gần đây, giao dịch chứng khoán tài chính T + 0 được thay đổi thành T + 1, các cơ quan quản lý liên tục mở ra hàng rào đối với giao dịch quy trình.
Bài viết này được lấy từ câu hỏi: “Bạn biết những thuật toán nổi tiếng nào về giao dịch tần số cao?” được đưa ra bởi người dùng Trần Đường Quân vào tháng 8 năm 2014? Câu trả lời cho câu hỏi này, từ đó đến nay, đã đúng một năm.
Tôi không đồng ý với quan điểm này. Giao dịch là giao dịch trước tiên, có ý nghĩa kinh tế riêng của nó, bỏ qua điều này và xem nó đơn thuần là trò chơi kỹ thuật số để tăng giá trị tiền, dễ dàng bị lạc hướng.
Tôi cũng không nghĩ rằng các thuật toán có gì là kỳ quặc, các thuật toán tốt cũng đã chết, giá trị cốt lõi thực sự phải là những người nắm bắt và sử dụng các thuật toán. Thực tế, những gì tôi nói là thông tin công khai, nhưng ngay cả khi hiểu các chi tiết kỹ thuật, rất ít người có thể thực sự làm tốt.
Hy vọng rằng câu trả lời này sẽ giúp bạn hiểu rõ hơn về giao dịch định lượng và tần số cao.
Đầu tiên, tôi tin rằng nhiều người sẽ nghĩ rằng giao dịch tần số cao là như thế này:

Nhưng đối với giao dịch tần số cao, thông tin này là rất thô sơ. Vì vậy, trước tiên chúng ta hãy giới thiệu cho những bạn học không quen thuộc với bối cảnh về những gì được gọi là Sổ đơn đặt hàng.

Bid cho thấy người mua, Offer cho thấy người bán, và bảng đề nghị này cho thấy tất cả các đề nghị được đưa ra bởi cả hai bên mua và bán (Limit Order). Đây là bảng thông tin quan tâm nhất của giao dịch tần suất cao.
Khi nào giao dịch sẽ xảy ra? Có hai trường hợp, đầu tiên là một bên phát hành lệnh thị trường, ví dụ như một người mua phát hành một đơn vị giá thị trường là 10, có thể mua 10 bản của người bán ở mức giá 101, sau khi giao dịch thành công, Sổ đơn đặt hàng sẽ trở thành như sau:

Thứ hai, phát hành một đơn giá giới hạn bằng giá tốt nhất của đối phương cũng sẽ tạo ra kết quả tương tự như trường hợp trên.
Cần nhấn mạnh rằng mặc dù sổ đơn đặt hàng thực sự chỉ tồn tại trong sàn giao dịch và tất cả các giao dịch đều được thực hiện trong sàn giao dịch, nhưng sàn giao dịch sẽ gửi mọi giá đề nghị và giá thị trường cho tất cả mọi người, vì vậy tất cả người mua và người bán có thể tự duy trì một cấu trúc dữ liệu giống nhau, tương đương với hình ảnh của sổ đơn đặt hàng của sàn giao dịch. Để xây dựng chiến lược giao dịch bằng cách theo dõi và phân tích sự thay đổi của hình ảnh này trong tay, là ý tưởng cốt lõi của thuật toán giao dịch tần số cao.
Sau khi nói về những kiến thức cơ bản, dưới đây là một ví dụ về Order Book để giúp mọi người hiểu:

Hình ảnh này tương ứng với cuốn sách đặt hàng ở đầu bài viết, nên có thể thấy rõ ràng rằng các trục ngang cho thấy giá cả, các trục dọc cho thấy số lượng đơn đặt hàng, màu xanh lá cây cho thấy người mua và bốn màu đỏ cho thấy người bán. Điều này được thực hiện để đưa ra chủ đề của bài viết này: đơn đặt hàng núi băng giá.
Thông qua phân tích cơ bản trên, chúng ta có thể thấy rằng dữ liệu giao dịch trong sàn giao dịch là hoàn toàn công khai, bất cứ lúc nào trên thị trường, ai muốn mua / bán bao nhiêu, tất cả mọi người đều thấy rõ, không có bí mật. Làm như vậy là có ý nghĩa kinh tế, bởi vì chỉ cần hiển thị nhu cầu mua / bán, sẽ thu hút các thương nhân tiềm năng để giao dịch, vì vậy một mức độ công khai nhu cầu của riêng mình là cần thiết.

Điều này rất bất lợi cho anh ta, bởi vì tất cả mọi người sẽ sử dụng thông tin này để đối xử với anh ta. Mọi người sẽ phán đoán rằng hiện nay có rất nhiều áp lực mua trên thị trường, vì vậy sẽ có một loạt những người lao vào để kiếm tiền mua sắm, giá sẽ tăng nhanh chóng, vì vậy người này có thể mua thứ gì đó với giá 98 sẽ sớm phải mua ở mức giá cao hơn. Để giải quyết vấn đề này, các sàn giao dịch đã cung cấp một công cụ cụ thể, gọi là đơn đặt hàng Iceberg. Các đơn đặt hàng này có thể lớn, nhưng chỉ một phần nhỏ được công khai, phần lớn bị che giấu, không ai nhìn thấy ngoài sàn giao dịch và chính người gửi, giống như một tảng băng trôi.

Phần màu xám là phần lệnh bị ẩn. Như vậy, các sàn giao dịch sẽ chỉ thông báo cho người khác khi có giao dịch tương ứng với số lượng ẩn, tránh cho người khác sử dụng thông tin về lệnh hiển thị để làm Front running.
Bất cứ điều gì có lợi cũng sẽ có bất lợi. Các lệnh núi băng tuy bảo vệ lợi ích của người gửi, nhưng nó lại trở thành một quy tắc không công bằng đối với những người tham gia thị trường khác. Những người tham gia có nhu cầu giao dịch thực sự có thể bị thiệt hại nặng nề vì phán đoán sai lầm về tình hình.
Đầu tiên, có một cách đơn giản nhất. Đôi khi, một lệnh núi băng trôi được đặt giữa giá mua và giá bán tối ưu (spread), như sau:

Đối với trường hợp này, có một phương pháp phát hiện rất đơn giản, đó là gửi một lệnh giới hạn với số lượng tối thiểu trong spread, sau đó hủy lệnh. Ví dụ, trong ví dụ này, gửi một lệnh giới hạn với giá bán là 99 và sau đó hủy. Vì giá này không phải là giá mua rõ ràng, nếu không có khối băng, chắc chắn sẽ không có giao dịch.
Để đối phó với sự gián đoạn này, người ta thường không đặt hàng trực tiếp trong spread. Thay vào đó, nó sẽ được gắn với lệnh giới hạn thông thường như trước đây, vì vậy sau khi giao dịch xảy ra, bạn sẽ khó có thể đoán xem đó là lệnh giới hạn bình thường hay đơn đặt hàng núi băng hà.
Đầu tiên, có một suy nghĩ trực tiếp. Sự tồn tại của lệnh núi băng phản ánh phần nào sự giải thích của người mua đơn vị về tình hình thị trường, cho rằng việc sử dụng lệnh núi băng là cần thiết. Cần nhấn mạnh rằng việc sử dụng lệnh núi băng không phải là không có chi phí, bởi vì bạn che giấu nhu cầu thực sự, đồng thời che chắn kẻ tấn công tiềm năng và che chắn người giao dịch thực sự.
Một số dữ liệu có thể có liên quan, chẳng hạn như chênh lệch giá mua bán, tỷ lệ đặt mua so với số lượng bán hàng. Đối với những dữ liệu này, bạn có thể thực hiện phân tích hồi quy trên dữ liệu lịch sử và xây dựng mô hình tuyến tính / phi tuyến tính giữa chúng và các đơn đặt hàng băng giá. Mô hình này, được đào tạo bằng dữ liệu lịch sử, sẽ hoạt động như một máy dò đơn đặt hàng băng giá mà bạn có thể sử dụng khi giao dịch trong thời gian thực.
Mô hình cơ bản có thể được định nghĩa là: F (spread, bidSize/offerSize, …) = Probability (Iceberg)
Nếu bạn muốn chơi cao sâu, bạn cũng có thể làm mô hình cao cấp như HMM, SVM, mạng thần kinh trên cơ sở này, nhưng ý tưởng cơ bản là giống nhau: tính xác suất có đơn đặt hàng núi băng giá thông qua phân tích phân tích.
Phương pháp trên có vẻ rất cao cấp, nhưng hiệu quả thực tế ra sao? Tôi nghĩ rằng tất cả mọi người cũng thấy rằng mô hình này không chính xác lắm. Nó là một phương tiện phân tích hậu quả để chỉ ra trường hợp nào có thể xảy ra lệnh núi băng, nhưng nó không phải là một máy dò giao dịch thực tế.
Vì vậy, đây là một phương pháp thực sự hấp dẫn cho người chơi có tần số cao, từ bài báo Prediction of Hidden Liquidity in the Limit Order Book of GLOBEX Futures.
高频世界里,有一条永恒的建模准则值得铭记:先看数据再建模。如果你看了上面的介绍就开始天马行空的思考数学模型,那基本上是死路一条。我见过很多年轻人,
特别有热情,一上来就开始做数学定义,然后推导偏微分方程,数学公式写满一摞纸,最后一接触数据才发现模型根本行不通,这是非常遗憾的。
Một số sàn giao dịch làm như thế này: một đơn hàng núi băng chứa hai tham số, V là tổng số đơn hàng và p là số lượng được hiển thị công khai. Ví dụ như một tảng băng với V = 100 và p = 10, số lượng ẩn thực sự là 90. Nếu có giao dịch xảy ra đối với đơn hàng này, ví dụ như khối lượng giao dịch 10, sàn giao dịch sẽ gửi ba thông tin theo thứ tự:
Kết thúc 10
Top bid size của Order Book -10
Đơn giá mới +10
Ba thông tin này chắc chắn sẽ xuất hiện liên tiếp, và sự khác biệt thời gian giữa thứ ba và thứ nhất là rất nhỏ. Lý do là mặc dù có khối lượng ẩn trong đơn đặt hàng núi băng, nhưng mỗi lần giao dịch chỉ xảy ra với số lượng hiển thị ((p)), và chỉ sau khi p bị tiêu hao, một phần p mới sẽ được làm mới từ số lượng ẩn còn lại. Như vậy, thông tin mà mọi người nhận được từ giao dịch vẫn có thể cập nhật Sách đơn hàng một cách hợp lý, như thể các đơn đặt hàng núi băng không tồn tại. Vì vậy, một khi chúng ta quan sát được quy luật này trong dữ liệu, chúng ta có thể xác định một cách chắc chắn rằng có một đơn đặt hàng trong thị trường, và giá trị liên tục của p có thể được xác định! Vấn đề này về bản chất là không thể giải quyết chính xác, vì V và p đều do cá nhân quyết định, có thể là bất kỳ giá trị nào. Nhưng có thể xem xét từ hai điểm: đầu tiên, cả hai giá trị đều là số nguyên; thứ hai, con người không phải là máy tạo số ngẫu nhiên hoàn hảo, quyết định sẽ tuân theo một quy luật nhất định.
Từ hai điểm này, bạn có thể xây dựng mô hình xác suất cho V và p, tức là tính toán xác suất xuất hiện của một nhóm giá trị ((V, p) được cho là bao nhiêu? Không đi sâu vào phân tích toán học, bạn bè quan tâm có thể tự xem bản gốc. Nói một cách đơn giản, bạn có thể ước tính hàm mật độ xác suất của họ trên dữ liệu lịch sử thông qua kỹ thuật ước tính hạt nhân.

Như vậy, khi bạn quan sát một giá trị của p trong dữ liệu thời gian thực, bạn có thể có được hàm mật độ xác suất điều kiện của giá trị V tương ứng, tức là một mặt cắt trên, ví dụ như (p = 8):

Tiếp theo, rõ ràng là rất dễ dàng để tính toán V có thể là giá trị gì. Đường cong hàm này còn có một vai trò quan trọng là giúp bạn đánh giá động lượng tồn tại, ví dụ khi bạn quan sát thấy đã có 5 bản p đã được tiêu hao, bạn có thể đưa ra V> = 40, từ biểu đồ trên bạn có thể đưa ra giá trị V mới và lượng tồn tại ((V-5p)).
Tóm lại, cốt lõi của thuật toán là xác định sự tồn tại của các đơn đặt hàng núi băng bằng cách theo dõi ba bản ghi liên quan xuất hiện liên tiếp trong một khoảng thời gian ngắn trong dữ liệu thời gian thực, trong khi định lượng các đơn đặt hàng núi băng được thực hiện bằng mô hình xác suất được đào tạo bởi dữ liệu lịch sử.
Tôi tin rằng bạn cũng sẽ thấy rằng thuật toán này không phải là một công cụ lừa đảo. Nó chỉ là một phỏng đoán được thực hiện bằng cách sử dụng dữ liệu công khai trên thị trường. Và sự phỏng đoán này cũng chỉ dựa trên xác suất, nhiều hơn là một tài liệu tham khảo. Nó có ý nghĩa đối với các nhà cung cấp thanh khoản làm thị trường, có thể giúp họ tránh bị tổn thất vì phán đoán sai lầm về tình hình.
Cuối cùng, thuật toán này cũng chỉ nhắm vào một giao dịch cụ thể. Các giao dịch khác có thể không xử lý các đơn đặt hàng giống nhau. Vì vậy, những gì thực sự có giá trị là cách suy nghĩ mô hình này dựa trên dữ liệu thực tế, thuật toán cụ thể không đáng giá.
Đây là một thuật toán nhỏ cho bạn thấy đỉnh của một ngọn núi băng giá trong lĩnh vực giao dịch tần số cao. Nó có thể không có vẻ phức tạp, nhưng tôi thích nó. Bởi vì nó cho thấy rõ ràng những gì được gọi là đầu tiên có ý tưởng, sau đó là định lượng.
Nếu bạn không tuân theo nguyên tắc này, bạn sẽ chuyển các mô hình cao cấp khác nhau để xử lý dữ liệu và mong đợi mô hình tự động tạo ra tín hiệu giao dịch cho bạn, theo tôi thì điều này không khác gì giấc mơ của kẻ ngốc. Và hãy làm điều đó và trân trọng nó.
Hình ảnh: Báo chí Việt Nam Liên kết