线性回归、逻辑回归

线性回归、逻辑回归

线性回归

（1）目标

　　预测函数：

　　　　

　　即

　　学得w和b后，模型就可以确定。

（2）一维情形

　　先假设输入特征只有一维。

　　，

　　使用均方差当做损失函数，最小化均方差，也就是最小二乘法。

　　　　　

　求最小化均方差时的w和b，分别对上式w和b求导，使导数为0，即得到所求w*和b*。

　　　　

　　　　

　　

（3）推广到多维

　　现在考虑多维特征。

　　　　

　　把数据集D表示为一个矩阵X：

　　　　

　　此时，使用最小二乘法：

　　　　

　　令导数为0，解得：

　　实际计算中求以上矩阵计算量很大，因此常使用梯度下降法。二维情况下，函数变换最快的方向是斜率方向，多维情况下偏导就成为梯度，每次往负梯度方向走一步。

　　　　

逻辑回归

　　逻辑回归用于分类，在线性回归的基础上使用一个函数使得预测值与标记值联系起来。该函数需要连续可微，一般使用sigmoid函数。

　　　　

　　损失函数方面，线性回归的损失函数为平方损失函数，如果将其用于逻辑回归的损失函数，后续讨论的优化问题会变成非凸的，难以用梯度下降法求最优。因此逻辑回归使用负对数似然函数（交叉熵），它表示两个概率模型之间的相似度。

　　　　

　　这个损失函数使用极大似然法得到。似然函数是在参数θ条件下，出现数据X的概率。极大似然法最大化这个概率，也就是最大化似然函数：L=P(X=x|θ)。

　　对于逻辑回归中参数w，似然函数：

　　　　

　　其中，f(x)最后加上了sigmoid，所以就是代表概率，因此：

　　　　

　　所以

　　代入 L(w) 得：

　　　　

　　对 L(w) 取对数得到对数似然函数（是因为(0,1)的小数连乘容易下溢导致结果为0）：

　　　　

　　我们要最大化 l(w)，相当于最小化负 l(w)，即它的损失函数。

　　这个损失函数是高阶可导连续的凸函数，根据凸优化理论可以通过梯度下降法、牛顿法等方法求得最优解。
相关阅读:
Fedora 19 配置参考
 Lua 函数、闭包、尾调用总结
 基于MFC简单图片裁剪工具
 【OpenGL 学习笔记04】顶点数组
 【OpenGL 学习笔记03】点画多边形
 【OpenGL 学习笔记02】宽点画线
 【OpenGL 学习笔记01】HelloWorld示例
 【SSH + BootStrap】实现的无线点餐系统
 【C++ 基础 11】函数指针总结
 【C++基础 10】四种cast转换的区别
原文地址：https://www.cnblogs.com/sumuyi/p/12827700.html