Что мы предсказываем, когда прогнозируем вероятности?
Я помню, как давно проходил собеседование, и мне пришла в голову эта тема.
Интервьюер: Вы знаете о Logistic Regression?
Я: Конечно, я знаю, это часто используется.
Опросчик: Как вы думаете, вероятность логистической регрессии объясняется вероятностью успеха?
Я: Конечно, нет. Если только одно наблюдение, то вероятность индивидуума не поддается оценке. Это следует интерпретировать как, что, если дать N индивидуумов с одинаковыми характеристиками, вероятность успеха равна вероятности оценки.
Ну, собеседники были заняты, и, конечно, в итоге меня вычеркнули (возможно, это связано с тем, что я изучал экономику, а не статистику и компьютеры).
Возможно, вы думаете, что это немного противоречиво и трудно понять, но когда мы оцениваем логистическую отдачу, мы получаем:
Разве это не объясняется вероятностью успеха отдельного человека?
-
Я думаю, что это довольно сомнительно.
Когда мы говорим о вероятности успеха отдельного человека, то это должно быть среднее число успехов, полученных одним и тем же человеком в 100 повторных попыток при тех же условиях. Если записать t как количество попыток, то наша идеальная модель (процесс создания данных) должна выглядеть следующим образом:
Однако, альтернативно, процесс создания реальных данных может выглядеть следующим образом:




