逻辑回归的似然估计公式推导
假设现有训练样本集合 ,,每个样本有 个特征。令条件概率 为 ,则有逻辑回归模型:
其中 ( 为偏移量,、、……、 为权重值),(、、……、 特征值)。
求解上式,得到
对于一个特征点 来说, 要么为 1(概率为 ),要么为 0 (概率为 ),所以似然函数为:
相应的 log 似然函数为:
为了使 最大化,可以在 log 似然函数中对每个 求偏导数:
令偏导数等于零,得到对应的极大值点 。对每个 求偏导数之后,得到让 log 似然函数取极大值的 。
梯度回传
在梯度下降方法中,损失函数为 ,于是有:
于是,梯度回传公式为:
其中 为学习率。
参考
A Gentle Introduction to Logistic Regression With Maximum Likelihood Estimation