W problemie klasyfikacji binarnej etykietę możemy opisać jako zmienną losową z rozkładu dwumianowego o prawdopodobieństwie sukcesu
Dla
Interesuje nas opisanie prawdopodobieństwa
$$
p_i = f(X_i).
$$
Ponieważ
Bezpośrednie modelowanie prawdopodobieństwa
Szansa wystąpienia zdarzenia to iloraz prawdopodobieństwa, że to zdarzenie wystąpi do prawdopodobieństwa, że nie wystąpi.
$$
odds_i = \frac{p_i}{1-p_i}
$$
Szansa przyjmuje wartości w przedziale
Log-szansa to logarytm z szansy.
$$
\log(odds_i) = \log\left(\frac{p_i}{1-p_i}\right) = \log p_i - \log (1-p_i)
$$
Log-szansa przyjmuje wartości w przedziale
Prawdopodobieństwo można jednoznacznie przekształcić na log-szanse. $$ \log(odds_i) = \log\left(\frac{p_i}{1-p_i}\right) $$
Log-szanse można jednoznacznie przekształcić na prawdopodobieństwo. $$ p_i = \frac{1}{1 + \exp(- \log ({odds}_i))} $$