
Các tiêu chuẩn đầu tiên thường sử dụng các chỉ số cơ bản hơn như thời gian niêm yết, giá trị thị trường. Lựa chọn từ không gian mẫu, các điều kiện lọc thường sử dụng dữ liệu ngành, chỉ số tài chính, lợi nhuận, v.v. Các nhóm cổ phiếu ban đầu sẽ được sử dụng như mẫu cho mô hình lựa chọn cổ phiếu đa yếu tố. Sử dụng mô hình lựa chọn cổ phiếu đa yếu tố để định lượng cổ phiếu. Các yếu tố được sử dụng trong mô hình đa yếu tố truyền thống bao gồm các yếu tố tài chính (tỷ lệ lợi nhuận thị trường, tỷ lệ lợi nhuận thị trường, tỷ lệ bán thị trường, tỷ lệ giá trị thị trường tài sản, tỷ lệ tăng trưởng thu nhập kinh doanh chủ sở hữu, tỷ lệ tăng trưởng lợi nhuận ròng, tỷ lệ tăng trưởng EPS, tỷ lệ tăng trưởng tài sản tổng thể, v.v.) và các yếu tố thúc đẩy thị trường (lựa chọn tỷ lệ thu nhập ngắn hạn, tỷ lệ thu nhập dài hạn, tỷ lệ biến động cụ thể, biến đổi khối lượng giao dịch, giá trị thị trường tự do) và nhiều hơn nữa. Tính toán thành phần của quỹ và trọng lượng tương ứng bằng cách học từ công cụ định lượng.
Vậy, điều gì khiến các quỹ dữ liệu lớn khác biệt với các quỹ truyền thống?

Trước đây, khi chúng tôi xây dựng mô hình lựa chọn cổ phiếu đa yếu tố, tất cả các yếu tố được sử dụng đều đến từ bên trong thị trường, chúng tôi chỉ quan tâm đến các thuộc tính của từng cổ phiếu, nhưng sự xuất hiện của các yếu tố dữ liệu lớn đã mang lại thông tin mới, chúng tôi sẽ quan tâm đến sự thay đổi của số lượng tìm kiếm theo tỷ lệ phần trăm có liên quan đến sự thay đổi của cổ phiếu hay không, chúng tôi sẽ quan tâm đến doanh số bán hàng của Taobao trong một ngành có ảnh hưởng đến giá cổ phiếu của các doanh nghiệp trong ngành hay không, chúng tôi cũng sẽ quan tâm đến số lượng nhận xét về tin tức liên quan đến một cổ phiếu trong phân khúc tài chính của Sina có ảnh hưởng đến biến động của giá cổ phiếu hay không.
Chúng tôi đưa ra một ví dụ về một quỹ dữ liệu lớn thực tế để giúp bạn hiểu rõ hơn về các yếu tố dữ liệu lớn.
Một ví dụ được đưa ra ở đây là Big Data 100 của Quảng cáo Binh và Quảng cáo Binh kim.
Trong việc xây dựng không gian mẫu, Taobao 100 đã chọn các cổ phiếu liên quan đến ngành công nghiệp chứng khoán thứ ba của Trung Quốc liên quan đến danh mục hàng hóa của thương hiệu điện tử mạng như không gian mẫu của nó, bao gồm các danh mục sau:
Sản phẩm gia đình bền
Thiết bị và đồ dùng giải trí
Dệt may và quần áo
Khách sạn, nhà hàng và giải trí
Tiệm bán lẻ thực phẩm và hàng hóa thiết yếu
Thực phẩm và đồ uống
Sản phẩm gia dụng
Hàng cá nhân
Dựa trên không gian lựa chọn của ngành liên quan đến Taobao, Quỹ BXF và Quần áo kim loại đã tạo ra các cổ phiếu được lựa chọn cho các yếu tố dữ liệu lớn của các công ty điện tử tập trung được sử dụng trong mô hình định lượng đa yếu tố. Trong đó, nền tảng dịch vụ thông tin tài chính của Alipay cung cấp dữ liệu về xu hướng thống kê tiêu dùng trực tuyến.
Cuối cùng, mô hình lựa chọn cổ phiếu định lượng sử dụng các yếu tố dữ liệu lớn, tài chính và thị trường để xếp hạng cổ phiếu, xác định thành phần và trọng lượng của quỹ dữ liệu lớn.
Ngoài chỉ số Taobao 100, các quỹ dữ liệu lớn cũng sử dụng nhiều nguồn dữ liệu lớn như Baidu, Snowball, Sina, Silver Linings để tạo ra các yếu tố dữ liệu lớn. Các yếu tố được sử dụng bởi các quỹ dữ liệu lớn thông qua các tài liệu công khai được cung cấp bởi CNET Index Limited như sau:
Các yếu tố tìm kiếm của 100 Index
Tổng số tìm kiếm và gia tăng tìm kiếm trong một tháng gần nhất được tính riêng cho các cổ phiếu trong không gian mẫu, được ghi nhận là nhân số tổng số và nhân số gia tăng, tương ứng; xây dựng mô hình phân tích nhân tố cho các yếu tố tổng số tìm kiếm và nhân số gia tăng, tính điểm tổng hợp cho từng cổ phiếu, được ghi nhận là yếu tố tìm kiếm;
100 tấn nhiệt độ cầu tuyết
Đầu tiên, tính toán độ bao phủ của danh mục đầu tư của mẫu được chọn dựa trên danh mục đầu tư của cầu tuyết được lấy từ bước thứ hai; tiếp theo, đánh giá cổ phiếu dựa trên độ bao phủ của danh mục đầu tư của từng cổ phiếu, được ghi nhận là điểm số của yếu tố nhiệt độ cầu tuyết của từng cổ phiếu.
Hình ảnh của Big Data ở Nam Sinatra
Số lượt truy cập trên trang của kênh Sina Finance, bài viết tích cực và tiêu cực của Weibo, ảnh hưởng của tin tức.
Chỉ số dữ liệu lớn của Liên đoàn Ngân hàng Liên đoàn
Dựa trên dữ liệu đặc trưng của xu hướng thống kê tiêu dùng của Liên đoàn Ngân hàng, các chỉ số đầu tư ngành được xử lý; tiếp theo, dựa trên các chỉ số đầu tư ngành thu được, mức độ kinh tế của ngành được xem xét tổng hợp, bao gồm: số tiền tiêu thụ, số lần giao dịch, v.v., được xếp hạng theo mức độ kinh tế của ngành; cuối cùng, dựa trên mức độ kinh tế cho các cổ phiếu trong ngành được đánh giá tương ứng, được xếp hạng theo yếu tố dữ liệu lớn của ngành.
Có nhiều người quen biết cho rằng các quỹ dữ liệu lớn thực sự không đạt được thành tích đáng mong đợi, và thực tế cho đến nay, một số quỹ dữ liệu lớn đã không đạt được kỳ vọng ban đầu, nhưng điều này không cho phép chúng tôi kết luận rằng quỹ dữ liệu lớn là sai hướng. Bởi vì hiện tại các ứng dụng của dữ liệu lớn vẫn còn bảo thủ, thử nghiệm, chúng tôi chỉ thêm các yếu tố dữ liệu lớn trên cơ sở mô hình đa yếu tố truyền thống, và không có nhiều đổi mới mang tính đột phá hơn trong mô hình. Đối với các yếu tố dữ liệu lớn, xử lý liên quan đến nhiều lĩnh vực xử lý ngôn ngữ tự nhiên và học máy như phân tích ngữ nghĩa, phân tích cảm xúc, mô hình chủ đề.
Trong thực tế, các ứng dụng của dữ liệu lớn đã chạm vào mọi khía cạnh của cuộc sống của chúng ta, trong đó ẩn chứa những kho báu có giá trị đầu tư, và mặc dù các quỹ dữ liệu lớn hiện tại chưa thể chứng minh được khả năng khai thác hiệu quả những giá trị này, nhưng kho báu trong dữ liệu lớn đã ở đó, có lẽ một số người cao cấp không được biết đến đã được hưởng.
Science Investments - Các khoản đầu tư đã được chứng minh