• 斯坦福2014机器学习笔记四----逻辑回归


    一、纲要

        逻辑回归

      决策边界

      拟合逻辑回归的参数θ

      多类别分类问题(Multiclass classification)

    二、内容详述

      1、逻辑回归

      逻辑回归,实际上就是一种分类算法,它的性质是输出值应该在[0,1]这个区间,所以对于逻辑回归问题我们的函数h就不再跟前面线性回归的函数一样的形式了,我们这里根据逻辑函数来假设逻辑回归函数。逻辑函数g(z)和分类函数hθ(x)的曲线如下:

    因此,我们就可以把h控制在[0,1]区间内

    这里需要说明的是,hθ(x)的作用是对于给定输入变量,根据选择的参数计算输出变量等于1的概率,即hθ(x)=P(y=1|θ,x)。一定要注意这里说的是等于1的概率

      2、决策边界

      决策边界可以帮助我们理解逻辑回归中的假设函数做什么事情。根据上图,我们可以认为,当hθ(x)>=0.5时,y=1,当hθ(x)<0.5时,y=0。当把z换成θTx时

    所以,hθ(x)>=0.5我们可以替换成θTx>=0,y=1;θTx<0,y=0。逻辑回归中我们需要做的就是拟合参数θ0,θ1,...θn。我们举一个简单的例子说明什么是决策边界

    假设hθ(x)=g(θ01x12x2),且θT=[θ0,θ1,θ2]=[-3,1,1],那么带入θTx就变成了当-3+x1+x2>=0时,y=1;当-3+x1+x2<0时,y=0。如图所示

    那么这条线 x1+x2=3就是决策边界。当然这是个简单的决策边界,也可以有更复杂的决策边界,这里hθ(x)=g(θ01x12x23x1^2+θ4x2^2)且θ=[-1,0,0,1,1],同样的方法代入后我们会发现决策边界为x1^2+x2^2=1,是个圆。

    这里需要注意的是,决策边界是参数集θ的属性,就是当参数集[θ0,θ1,...θn]确定了之后,决策边界就确定了,而并非由训练数据集决定(并非由图上的OOXX形成的形状决定)

      3、拟合逻辑回归的参数θ

      在解决逻辑回归问题时,就不能再用线性回归的代价函数来寻找最优解,因为当我们将带入代价函数的时候,得到的将是这样的曲线,这就有太多的局部最优解因而不利于我们寻找全局最优解

               

    所以重新定义了代价函数如右上图,y轴为cost(h,y)的值。我们这里可以将两种条件下

    的cost(h,y)进行合并得到。代价函数J为。之后就是同样的J(θ)的最小化问题了。用梯度下降法代入梯度下降公式,我们发现代入梯度下降公式之后得到的与线性回归问题是相同的。

      4、多类别分类问题

      多类别说的是输出值大于2的情况像y=1,y=2,y=3...我们有个新的工具叫做逻辑回归分类器h(i)(x),表示第i个类别的输出,输出的为P(y=i|θ,x)即y=i的概率。假设这样一组数据集,共可以分出3类,y=1,y=2,y=3

    分类器就是先将某两个看成同一类,然后解决这个二元分类问题,然后再换另外两个为一类,再次循环,总共三次,得到

    我们在作预测的时候就是将所有的分类机都执行一遍,对每个输入变量,我们选择最高可能性的输出变量最为最终的输出变量,这样就可以解决多类分类问题啦!

  • 相关阅读:
    python入门
    二级域名分发
    检测网站日常运行
    为自己的网站添加天气显示
    基于linux下LNMP环境设置wordpress伪静态
    个人博客
    静态页跨页面传值
    微信小程序制作-随笔4
    中间带文字的分割线
    微信小程序制作-随笔3
  • 原文地址:https://www.cnblogs.com/kl2blog/p/7702809.html
Copyright © 2020-2023  润新知