avatar of 发明者量化-小小梦 发明者量化-小小梦
tập trung vào tin nhắn riêng tư
4
tập trung vào
1271
Người theo dõi

Ra mắt Quỹ Dữ liệu lớn

Được tạo ra trong: 2017-02-27 13:01:49, cập nhật trên: 2017-02-27 23:43:03
comments   0
hits   2055

Ra mắt Quỹ Dữ liệu lớn


Bài viết đầu tư khoa học hôm nay nói về các nguyên tắc của quỹ dữ liệu lớn, và cách dữ liệu trên mạng như Taobao, Baidu và Sina giúp các nhà quản lý quỹ lựa chọn cổ phiếu.

  • #### Trước khi tiết lộ chi tiết về quỹ dữ liệu lớn, chúng ta hãy xem xét các bước chọn cổ phiếu của một quỹ cổ phiếu điển hình:

Ra mắt Quỹ Dữ liệu lớn

Các tiêu chuẩn đầu tiên thường sử dụng các chỉ số cơ bản hơn như thời gian niêm yết, giá trị thị trường. Lựa chọn từ không gian mẫu, các điều kiện lọc thường sử dụng dữ liệu ngành, chỉ số tài chính, lợi nhuận, v.v. Các nhóm cổ phiếu ban đầu sẽ được sử dụng như mẫu cho mô hình lựa chọn cổ phiếu đa yếu tố. Sử dụng mô hình lựa chọn cổ phiếu đa yếu tố để định lượng cổ phiếu. Các yếu tố được sử dụng trong mô hình đa yếu tố truyền thống bao gồm các yếu tố tài chính (tỷ lệ lợi nhuận thị trường, tỷ lệ lợi nhuận thị trường, tỷ lệ bán thị trường, tỷ lệ giá trị thị trường tài sản, tỷ lệ tăng trưởng thu nhập kinh doanh chủ sở hữu, tỷ lệ tăng trưởng lợi nhuận ròng, tỷ lệ tăng trưởng EPS, tỷ lệ tăng trưởng tài sản tổng thể, v.v.) và các yếu tố thúc đẩy thị trường (lựa chọn tỷ lệ thu nhập ngắn hạn, tỷ lệ thu nhập dài hạn, tỷ lệ biến động cụ thể, biến đổi khối lượng giao dịch, giá trị thị trường tự do) và nhiều hơn nữa. Tính toán thành phần của quỹ và trọng lượng tương ứng bằng cách học từ công cụ định lượng.

Vậy, điều gì khiến các quỹ dữ liệu lớn khác biệt với các quỹ truyền thống?

Ra mắt Quỹ Dữ liệu lớn

Trước đây, khi chúng tôi xây dựng mô hình lựa chọn cổ phiếu đa yếu tố, tất cả các yếu tố được sử dụng đều đến từ bên trong thị trường, chúng tôi chỉ quan tâm đến các thuộc tính của từng cổ phiếu, nhưng sự xuất hiện của các yếu tố dữ liệu lớn đã mang lại thông tin mới, chúng tôi sẽ quan tâm đến sự thay đổi của số lượng tìm kiếm theo tỷ lệ phần trăm có liên quan đến sự thay đổi của cổ phiếu hay không, chúng tôi sẽ quan tâm đến doanh số bán hàng của Taobao trong một ngành có ảnh hưởng đến giá cổ phiếu của các doanh nghiệp trong ngành hay không, chúng tôi cũng sẽ quan tâm đến số lượng nhận xét về tin tức liên quan đến một cổ phiếu trong phân khúc tài chính của Sina có ảnh hưởng đến biến động của giá cổ phiếu hay không.

Chúng tôi đưa ra một ví dụ về một quỹ dữ liệu lớn thực tế để giúp bạn hiểu rõ hơn về các yếu tố dữ liệu lớn.

Một ví dụ được đưa ra ở đây là Big Data 100 của Quảng cáo Binh và Quảng cáo Binh kim.

Trong việc xây dựng không gian mẫu, Taobao 100 đã chọn các cổ phiếu liên quan đến ngành công nghiệp chứng khoán thứ ba của Trung Quốc liên quan đến danh mục hàng hóa của thương hiệu điện tử mạng như không gian mẫu của nó, bao gồm các danh mục sau:

  • Sản phẩm gia đình bền

  • Thiết bị và đồ dùng giải trí

  • Dệt may và quần áo

  • Khách sạn, nhà hàng và giải trí

  • Tiệm bán lẻ thực phẩm và hàng hóa thiết yếu

  • Thực phẩm và đồ uống

  • Sản phẩm gia dụng

  • Hàng cá nhân

  • Có thể thấy rằng các ngành này rất giống với phân loại hàng hóa của Taobao, bởi vì các yếu tố dữ liệu lớn được tạo ra từ dữ liệu Taobao có thể cung cấp thông tin nhiều hơn trong các ngành này.

Dựa trên không gian lựa chọn của ngành liên quan đến Taobao, Quỹ BXF và Quần áo kim loại đã tạo ra các cổ phiếu được lựa chọn cho các yếu tố dữ liệu lớn của các công ty điện tử tập trung được sử dụng trong mô hình định lượng đa yếu tố. Trong đó, nền tảng dịch vụ thông tin tài chính của Alipay cung cấp dữ liệu về xu hướng thống kê tiêu dùng trực tuyến.

Cuối cùng, mô hình lựa chọn cổ phiếu định lượng sử dụng các yếu tố dữ liệu lớn, tài chính và thị trường để xếp hạng cổ phiếu, xác định thành phần và trọng lượng của quỹ dữ liệu lớn.

Ngoài chỉ số Taobao 100, các quỹ dữ liệu lớn cũng sử dụng nhiều nguồn dữ liệu lớn như Baidu, Snowball, Sina, Silver Linings để tạo ra các yếu tố dữ liệu lớn. Các yếu tố được sử dụng bởi các quỹ dữ liệu lớn thông qua các tài liệu công khai được cung cấp bởi CNET Index Limited như sau:

Các yếu tố tìm kiếm của 100 Index

Tổng số tìm kiếm và gia tăng tìm kiếm trong một tháng gần nhất được tính riêng cho các cổ phiếu trong không gian mẫu, được ghi nhận là nhân số tổng số và nhân số gia tăng, tương ứng; xây dựng mô hình phân tích nhân tố cho các yếu tố tổng số tìm kiếm và nhân số gia tăng, tính điểm tổng hợp cho từng cổ phiếu, được ghi nhận là yếu tố tìm kiếm;

100 tấn nhiệt độ cầu tuyết

Đầu tiên, tính toán độ bao phủ của danh mục đầu tư của mẫu được chọn dựa trên danh mục đầu tư của cầu tuyết được lấy từ bước thứ hai; tiếp theo, đánh giá cổ phiếu dựa trên độ bao phủ của danh mục đầu tư của từng cổ phiếu, được ghi nhận là điểm số của yếu tố nhiệt độ cầu tuyết của từng cổ phiếu.

Hình ảnh của Big Data ở Nam Sinatra

Số lượt truy cập trên trang của kênh Sina Finance, bài viết tích cực và tiêu cực của Weibo, ảnh hưởng của tin tức.

Chỉ số dữ liệu lớn của Liên đoàn Ngân hàng Liên đoàn

Dựa trên dữ liệu đặc trưng của xu hướng thống kê tiêu dùng của Liên đoàn Ngân hàng, các chỉ số đầu tư ngành được xử lý; tiếp theo, dựa trên các chỉ số đầu tư ngành thu được, mức độ kinh tế của ngành được xem xét tổng hợp, bao gồm: số tiền tiêu thụ, số lần giao dịch, v.v., được xếp hạng theo mức độ kinh tế của ngành; cuối cùng, dựa trên mức độ kinh tế cho các cổ phiếu trong ngành được đánh giá tương ứng, được xếp hạng theo yếu tố dữ liệu lớn của ngành.

Có nhiều người quen biết cho rằng các quỹ dữ liệu lớn thực sự không đạt được thành tích đáng mong đợi, và thực tế cho đến nay, một số quỹ dữ liệu lớn đã không đạt được kỳ vọng ban đầu, nhưng điều này không cho phép chúng tôi kết luận rằng quỹ dữ liệu lớn là sai hướng. Bởi vì hiện tại các ứng dụng của dữ liệu lớn vẫn còn bảo thủ, thử nghiệm, chúng tôi chỉ thêm các yếu tố dữ liệu lớn trên cơ sở mô hình đa yếu tố truyền thống, và không có nhiều đổi mới mang tính đột phá hơn trong mô hình. Đối với các yếu tố dữ liệu lớn, xử lý liên quan đến nhiều lĩnh vực xử lý ngôn ngữ tự nhiên và học máy như phân tích ngữ nghĩa, phân tích cảm xúc, mô hình chủ đề.

Trong thực tế, các ứng dụng của dữ liệu lớn đã chạm vào mọi khía cạnh của cuộc sống của chúng ta, trong đó ẩn chứa những kho báu có giá trị đầu tư, và mặc dù các quỹ dữ liệu lớn hiện tại chưa thể chứng minh được khả năng khai thác hiệu quả những giá trị này, nhưng kho báu trong dữ liệu lớn đã ở đó, có lẽ một số người cao cấp không được biết đến đã được hưởng.

Science Investments - Các khoản đầu tư đã được chứng minh