Tôi đã từng tham gia một cuộc phỏng vấn rất lâu trước đây, và tôi nhớ lại chủ đề của cuộc phỏng vấn.
Người phỏng vấn: Bạn có biết về Logistic Return không? Tôi: Chắc chắn là có, nó rất phổ biến. Người phỏng vấn: Vậy bạn nghĩ rằng xác suất của dự đoán logistic regression là xác suất của một cá nhân thành công? Tôi: Chắc chắn là không. Nếu chỉ có một lần quan sát, xác suất cá nhân là không thể ước tính được. Nó nên được giải thích là, cho N cá nhân có cùng đặc điểm, tỷ lệ thành công bằng xác suất ước tính.
Ồ, có lẽ là do tôi có kinh tế học chứ không phải do tôi có kinh nghiệm về thống kê và máy tính.
Bạn có thể thấy điều tôi nói ở trên hơi khó hiểu và hơi khó hiểu, nhưng khi chúng ta ước tính logistic regression, chúng ta ước tính:

Có phải điều này có thể giải thích được bằng xác suất thành công của mỗi cá nhân?
Khi chúng ta nói về xác suất thành công của một cá nhân, nó nên là số lần thành công trung bình của cùng một người trong 100 lần lặp lại với các điều kiện tương tự. Nếu t là số lần một người cố gắng, thì mô hình lý tưởng của chúng ta (quá trình tạo dữ liệu) sẽ như sau:

Tuy nhiên, một cách khác, quá trình tạo dữ liệu thực tế có thể như sau:

