Saya pernah mengikuti satu temuduga lama dahulu, dan saya masih ingat dengan baik tajuk temuduga tersebut.
Penanya: Adakah anda tahu tentang Logistic Regression? Saya: Sudah tentu saya tahu, ia sering digunakan. Jurucakap: Jadi, bagaimana anda mahu menjelaskan kebarangkalian ramalan logistic regression sebagai kebarangkalian seseorang individu untuk berjaya? Saya: Sudah tentu tidak. Jika hanya satu pengamatan, kebarangkalian individu tidak dapat dianggarkan. Ia harus ditafsirkan sebagai, diberikan N individu dengan ciri yang sama, kadar kejayaan adalah sama dengan kebarangkalian yang dianggarkan.
Oh ya, saya tidak dapat menjawab soalan-soalan itu, dan tentu saja saya gagal di akhir temuduga (mungkin kerana saya seorang ahli ekonomi dan bukan ahli statistik dan komputer).
Mungkin anda fikir saya agak bertentangan dan sukar untuk difahami, apabila kita menganggarkan pengembalian logistik, kita menganggarkan:

Tidakkah ia boleh diterjemahkan sebagai peluang kejayaan individu?
Apabila kita bercakap mengenai kemungkinan seseorang individu untuk berjaya, ia haruslah berapa kali orang yang sama berulang 100 kali di bawah keadaan yang sama, dan berjaya secara purata. Jika kita menulis t sebagai jumlah percubaan seseorang, maka model ideal kita (proses penjanaan data) harus seperti ini:

Walau bagaimanapun, secara alternatif, proses penjanaan data sebenar mungkin seperti ini:

