Hướng dẫn cho người mới bắt đầu phân tích chuỗi thời gian

Tác giả:Tốt, Tạo: 2019-03-30 11:17:42, Cập nhật:

Trong vài năm qua, chúng tôi đã xem xét các công cụ khác nhau để giúp chúng tôi xác định các mô hình có thể khai thác trong giá tài sản.

Trong khi tất cả những công cụ hiện đại tuyệt vời cho phân tích dữ liệu, phần lớn các mô hình hóa tài sản trong ngành vẫn sử dụng phân tích chuỗi thời gian thống kê.

Phân tích chuỗi thời gian là gì?

Đầu tiên, một chuỗi thời gian được định nghĩa là một số lượng được đo theo trình tự trong thời gian trong một khoảng thời gian nào đó.

Trong hình thức rộng nhất của nó, phân tích chuỗi thời gian là về suy luận những gì đã xảy ra với một loạt các điểm dữ liệu trong quá khứ và cố gắng dự đoán điều gì sẽ xảy ra với nó trong tương lai.

Tuy nhiên, chúng ta sẽ có một cách tiếp cận thống kê định lượng cho các chuỗi thời gian, bằng cách giả định rằng các chuỗi thời gian của chúng ta là thực hiện của các chuỗi các biến ngẫu nhiên. nghĩa là, chúng ta sẽ giả định rằng có một số quy trình tạo cơ bản cho chuỗi thời gian của chúng ta dựa trên một hoặc nhiều phân phối thống kê mà từ đó các biến này được rút ra.

Phân tích chuỗi thời gian cố gắng hiểu quá khứ và dự đoán tương lai. Một chuỗi biến ngẫu nhiên như vậy được gọi là quá trình ngẫu nhiên thời gian rời rạc (DTSP). Trong giao dịch định lượng, chúng tôi quan tâm đến việc cố gắng phù hợp với các mô hình thống kê cho các DTSP này để suy luận các mối quan hệ cơ bản giữa các chuỗi hoặc dự đoán giá trị trong tương lai để tạo ra các tín hiệu giao dịch.

Các chuỗi thời gian nói chung, bao gồm cả các chuỗi bên ngoài thế giới tài chính, thường chứa các tính năng sau:

  • Xu hướng - Xu hướng là một chuyển động theo hướng nhất quán trong một chuỗi thời gian. Những xu hướng này sẽ là định nghĩa hoặc ngẫu nhiên. Xu hướng thứ nhất cho phép chúng ta cung cấp một lý do cơ bản cho xu hướng, trong khi xu hướng thứ hai là một tính năng ngẫu nhiên của một chuỗi mà chúng ta sẽ không thể giải thích. Xu hướng thường xuất hiện trong các chuỗi tài chính, đặc biệt là giá hàng hóa, và nhiều quỹ CTA sử dụng các mô hình nhận dạng xu hướng phức tạp trong thuật toán giao dịch của họ.
  • Sự thay đổi theo mùa - Nhiều chuỗi thời gian chứa sự thay đổi theo mùa. Điều này đặc biệt đúng trong các chuỗi đại diện cho doanh số bán hàng hoặc mức độ khí hậu. Trong tài chính định lượng, chúng ta thường thấy sự thay đổi theo mùa trong hàng hóa, đặc biệt là những thứ liên quan đến mùa phát triển hoặc biến đổi nhiệt độ hàng năm (như khí tự nhiên).
  • Sự phụ thuộc hàng loạt - Một trong những đặc điểm quan trọng nhất của chuỗi thời gian, đặc biệt là chuỗi tài chính, là mối tương quan hàng loạt. Điều này xảy ra khi các quan sát chuỗi thời gian gần nhau về thời gian có xu hướng tương quan.

Làm thế nào chúng ta có thể áp dụng phân tích chuỗi thời gian trong tài chính định lượng?

Mục tiêu của chúng tôi như các nhà nghiên cứu định lượng là xác định xu hướng, biến đổi theo mùa và mối tương quan bằng cách sử dụng các phương pháp chuỗi thời gian thống kê, và cuối cùng tạo ra các tín hiệu giao dịch hoặc bộ lọc dựa trên suy luận hoặc dự đoán.

Cách tiếp cận của chúng tôi sẽ là:

  • Dự báo và dự đoán giá trị trong tương lai - Để giao dịch thành công, chúng ta sẽ cần dự đoán chính xác giá tài sản trong tương lai, ít nhất là theo nghĩa thống kê.
  • Mô phỏng chuỗi - Một khi chúng ta xác định các thuộc tính thống kê của chuỗi thời gian tài chính, chúng ta có thể sử dụng chúng để tạo mô phỏng các kịch bản tương lai. Điều này cho phép chúng ta ước tính số lượng giao dịch, chi phí giao dịch dự kiến, hồ sơ lợi nhuận dự kiến, đầu tư kỹ thuật và tài chính cần thiết cho cơ sở hạ tầng và do đó cuối cùng hồ sơ rủi ro và lợi nhuận của một chiến lược hoặc danh mục đầu tư cụ thể.
  • Định mối quan hệ - Xác định mối quan hệ giữa các chuỗi thời gian và các giá trị định lượng khác cho phép chúng ta tăng cường tín hiệu giao dịch của mình thông qua các cơ chế lọc. Ví dụ, nếu chúng ta có thể suy luận cách chênh lệch trong một cặp ngoại hối thay đổi theo khối lượng mua / mua, thì chúng ta có thể lọc bất kỳ giao dịch tiềm năng nào có thể xảy ra trong một khoảng thời gian mà chúng ta dự đoán chênh lệch rộng để giảm chi phí giao dịch.

Ngoài ra, chúng ta có thể áp dụng các bài kiểm tra thống kê tiêu chuẩn (classic/frequentist hoặc Bayesian) cho các mô hình chuỗi thời gian của chúng tôi để biện minh cho một số hành vi nhất định, chẳng hạn như thay đổi chế độ trong thị trường chứng khoán.

Phần mềm phân tích chuỗi thời gian

Cho đến nay, chúng tôi gần như chỉ sử dụng C ++ và Python để thực hiện chiến lược giao dịch của mình. Cả hai ngôn ngữ này đều là môi trường hạng nhất để viết toàn bộ ngăn xếp giao dịch. Cả hai đều chứa nhiều thư viện và cho phép xây dựng toàn bộ hệ thống giao dịch chỉ trong ngôn ngữ đó.

Thật không may, C ++ và Python không có thư viện thống kê rộng rãi. Đây là một trong những thiếu sót của chúng. Vì lý do này, chúng tôi sẽ sử dụng môi trường thống kê R như một phương tiện để thực hiện nghiên cứu chuỗi thời gian. R phù hợp với công việc do có sẵn các thư viện chuỗi thời gian, phương pháp thống kê và khả năng vẽ trực tiếp.

Chúng ta sẽ học R theo cách giải quyết vấn đề, trong đó các lệnh và cú pháp mới sẽ được giới thiệu khi cần thiết. May mắn thay, có rất nhiều hướng dẫn cực kỳ hữu ích cho R có sẵn trên internet và tôi sẽ chỉ ra chúng khi chúng ta đi qua chuỗi các bài viết phân tích chuỗi thời gian.

Bản đồ phân tích chuỗi thời gian QuantStart

Các bài báo trước đây cho đến nay về các chủ đề học tập thống kê, kinh tế học và phân tích Bayesian, chủ yếu là giới thiệu và không xem xét các ứng dụng của các kỹ thuật như vậy cho thông tin giá cao tần số hiện đại.

Để áp dụng một số kỹ thuật trên cho dữ liệu tần số cao hơn, chúng tôi cần một khuôn khổ toán học để thống nhất nghiên cứu của chúng tôi. Phân tích chuỗi thời gian cung cấp sự thống nhất như vậy và cho phép chúng tôi thảo luận về các mô hình riêng biệt trong bối cảnh thống kê.

Cuối cùng chúng ta sẽ sử dụng các công cụ Bayesian và kỹ thuật học máy kết hợp với các phương pháp sau đây để dự đoán mức giá và hướng, hoạt động như bộ lọc và xác định "sự thay đổi chế độ", nghĩa là xác định khi nào chuỗi thời gian của chúng ta đã thay đổi hành vi thống kê cơ bản của chúng.

Bản đồ hành trình chuỗi thời gian của chúng tôi là như sau. Mỗi chủ đề dưới đây sẽ tạo thành bài viết riêng hoặc bộ bài viết. Một khi chúng tôi đã kiểm tra các phương pháp này một cách sâu sắc, chúng tôi sẽ có thể tạo ra một số mô hình hiện đại tinh vi để kiểm tra dữ liệu tần số cao.

  • Giới thiệu về chuỗi thời gian - Bài viết này phác thảo lĩnh vực phân tích chuỗi thời gian, phạm vi của nó và cách nó có thể được áp dụng cho dữ liệu tài chính.
  • Tương quan - Một khía cạnh hoàn toàn cơ bản của việc mô hình hóa chuỗi thời gian là khái niệm tương quan hàng loạt. Chúng tôi sẽ xác định và mô tả một trong những cạm bẫy lớn nhất của phân tích chuỗi thời gian, cụ thể là rằng tương quan không ngụ ý nguyên nhân.
  • Dự báo - Trong phần này chúng ta sẽ xem xét khái niệm dự báo, đó là đưa ra dự đoán về hướng hoặc mức độ trong tương lai cho một chuỗi thời gian cụ thể, và cách thực hiện nó trong thực tế.
  • Mô hình ngẫu nhiên - Chúng tôi đã dành một thời gian để xem xét các mô hình ngẫu nhiên trong lĩnh vực định giá tùy chọn trên trang web, cụ thể là với chuyển động Brownian hình học và biến động ngẫu nhiên. Chúng tôi sẽ xem xét các mô hình khác, bao gồm tiếng ồn trắng và mô hình tự hồi quy.
  • Chuyển hướng - Khi chúng ta có xu hướng xác định (trái ngược với chứng ngẫu nhiên) trong dữ liệu, chúng ta có thể biện minh cho việc ngoại suy của chúng bằng cách sử dụng các mô hình hồi quy. Chúng ta sẽ xem xét cả hồi quy tuyến tính và phi tuyến tính, và tính toán mối tương quan hàng loạt.
  • Mô hình tĩnh - Mô hình tĩnh giả định rằng các tính chất thống kê (đặc biệt là trung bình và biến thể) của chuỗi là không đổi theo thời gian.
  • Mô hình không cố định - Nhiều chuỗi thời gian tài chính không cố định, nghĩa là chúng có trung bình và biến thể khác nhau. Đặc biệt, giá tài sản thường có thời gian biến động cao. Đối với các chuỗi này, chúng ta cần sử dụng các mô hình không cố định như ARIMA, ARCH và GARCH.
  • Mô hình đa biến - Chúng tôi đã xem xét các mô hình đa biến trên QuantStart trong quá khứ, cụ thể là khi chúng tôi xem xét các cặp cổ phiếu đảo ngược trung bình. Trong phần này, chúng tôi sẽ xác định chặt chẽ hơn về tích hợp và xem xét các thử nghiệm khác cho nó. Chúng tôi cũng sẽ xem xét các mô hình tự hồi (VAR) vector [không nên nhầm lẫn với Value-at-Risk!].
  • Mô hình không gian trạng thái - Mô hình không gian trạng thái mượn một lịch sử lâu dài của lý thuyết kiểm soát hiện đại được sử dụng trong kỹ thuật để cho phép chúng ta mô hình hóa chuỗi thời gian với các thông số thay đổi nhanh chóng (như biến độ nghiêng β giữa hai tài sản tích hợp chung trong hồi quy tuyến tính).

Thêm nữa