Я помню, как давно проходил собеседование, и мне пришла в голову эта тема.
Интервьюер: Вы знаете о Logistic Regression? Я: Конечно, я знаю, это часто используется. Опросчик: Как вы думаете, вероятность логистической регрессии объясняется вероятностью успеха? Я: Конечно, нет. Если только одно наблюдение, то вероятность индивидуума не поддается оценке. Это следует интерпретировать как, что, если дать N индивидуумов с одинаковыми характеристиками, вероятность успеха равна вероятности оценки.
Ну, собеседники были заняты, и, конечно, в итоге меня вычеркнули (возможно, это связано с тем, что я изучал экономику, а не статистику и компьютеры).
Возможно, вы думаете, что это немного противоречиво и трудно понять, но когда мы оцениваем логистическую отдачу, мы получаем:

Разве это не объясняется вероятностью успеха отдельного человека?
Когда мы говорим о вероятности успеха отдельного человека, то это должно быть среднее число успехов, полученных одним и тем же человеком в 100 повторных попыток при тех же условиях. Если записать t как количество попыток, то наша идеальная модель (процесс создания данных) должна выглядеть следующим образом:

Однако, альтернативно, процесс создания реальных данных может выглядеть следующим образом:

