斯坦福2014机器学习笔记四----逻辑回归

斯坦福2014机器学习笔记四----逻辑回归

一、纲要

　　逻辑回归

　　决策边界

　　拟合逻辑回归的参数θ

　　多类别分类问题(Multiclass classification)

二、内容详述

　　1、逻辑回归

　　逻辑回归，实际上就是一种分类算法，它的性质是输出值应该在[0,1]这个区间，所以对于逻辑回归问题我们的函数h就不再跟前面线性回归的函数一样的形式了，我们这里根据逻辑函数来假设逻辑回归函数。逻辑函数g(z)和分类函数h_θ(x)的曲线如下：

因此，我们就可以把h控制在[0,1]区间内

这里需要说明的是，h_θ(x)的作用是对于给定输入变量，根据选择的参数计算输出变量等于1的概率，即h_θ(x)=P(y=1|θ,x)。一定要注意这里说的是等于1的概率

　　2、决策边界

　　决策边界可以帮助我们理解逻辑回归中的假设函数做什么事情。根据上图，我们可以认为，当h_θ(x)>=0.5时，y=1，当h_θ(x)<0.5时，y=0。当把z换成θ^Tx时

所以，h_θ(x)>=0.5我们可以替换成θ^Tx>=0，y=1;θ^Tx<0,y=0。逻辑回归中我们需要做的就是拟合参数θ₀，θ₁，...θ_{n。我们举一个简单的例子说明什么是决策边界}

假设h_θ(x)=g(θ₀+θ₁x₁+θ₂x₂)，且θ^T=[θ₀，θ₁，θ₂]=[-3,1,1]，那么带入θ^Tx就变成了当-3+x₁+x₂>=0时，y=1；当-3+x₁+x₂<0时，y=0。如图所示

那么这条线 x₁+x₂=3就是决策边界。当然这是个简单的决策边界，也可以有更复杂的决策边界，这里h_θ(x)=g(θ₀+θ₁x₁+θ₂x₂+θ₃x₁^2+θ₄x₂^2)且θ=[-1，0，0，1，1]，同样的方法代入后我们会发现决策边界为x₁^2+x₂^2=1，是个圆。

这里需要注意的是，决策边界是参数集θ的属性，就是当参数集[θ₀，θ₁，...θ_n]确定了之后，决策边界就确定了，而并非由训练数据集决定(并非由图上的OOXX形成的形状决定)

　　3、拟合逻辑回归的参数θ

　　在解决逻辑回归问题时，就不能再用线性回归的代价函数来寻找最优解，因为当我们将带入代价函数的时候，得到的将是这样的曲线，这就有太多的局部最优解因而不利于我们寻找全局最优解

所以重新定义了代价函数如右上图，y轴为cost(h,y)的值。我们这里可以将两种条件下

的cost(h,y)进行合并得到。代价函数J为。之后就是同样的J(θ)的最小化问题了。用梯度下降法代入梯度下降公式，我们发现代入梯度下降公式之后得到的与线性回归问题是相同的。

　　4、多类别分类问题

　　多类别说的是输出值大于2的情况像y=1,y=2,y=3...我们有个新的工具叫做逻辑回归分类器h⁽ⁱ⁾(x),表示第i个类别的输出，输出的为P(y=i|θ,x)即y=i的概率。假设这样一组数据集，共可以分出3类，y=1,y=2,y=3

分类器就是先将某两个看成同一类，然后解决这个二元分类问题，然后再换另外两个为一类，再次循环，总共三次，得到

我们在作预测的时候就是将所有的分类机都执行一遍，对每个输入变量，我们选择最高可能性的输出变量最为最终的输出变量，这样就可以解决多类分类问题啦！
相关阅读:
Android学习关于setWidth()和setHeight()没反应的问题
 东芝c600T08B win7改装xp遇到的一些问题总结
 [转]java中long,int,short与byte数组之间的转换
 [转]简述STRUTS2 Convention零配置
 ie6下报错缺少标识符、字符串或数字问题解决
 Android学习解决Android Graphical Layout 界面效果不显示
 [原创]tomcat6.0+IIS6+jk的配置
 Oracle中NVARCHAR2与VARCHAR2的区别
 优化like查询
 RedHat linux下安装hadoop 0.20.2, 并在windows下远程连接此hadoop,开发调试
原文地址：https://www.cnblogs.com/kl2blog/p/7702809.html