• 机器学习中分类问题


    regression与线性回归(linear regression)

    线性回归(linear regression):

    • 有监督学习 => 学习样本为D={(xi,yi)}ª
    • 输出/预测的结果yi为连续值变量
    • 需要学习映射f:x~y
    • 假定输入x和输出y之间有线性相关关系    

    损失函数(loss function)

    我们要找到最好的权重/参数Θ

    怎么去衡量“最好”? 定义损失函数 

    最小化损失函数 梯度下降(Gradient descend)

    逐步最小化损失函数的过程

    如同下山,找准方向(斜率),每次迈进一小步,直至山底

    找到合适的学习率(步长),再进行训练,否则特征多,样本的多的情况下成本会很大的。

    数学和工程区别是工程找到大致可用的就可以了,数学是找打最优解。

    特征的工作,耗时很多。

    工业界最多的解决的是分类问题。

    线性回归不适合做分类,不够坚定,受噪声影响大。

    用得到的y值划定阈值来分类

    逻辑回归:把负无穷到正无穷压缩到0~1之间(可以看作概率域分布)

    常用sigmoid函数映射

    把线性回归转变成分类问题,找出一条判定边界

    线性的判定边界

  • 相关阅读:
    Redis安装与配置
    Mysql主从复制
    MySQL的基本使用
    如何理解 python 里面的 for 循环
    我在创业公司的 “云原生” 之旅
    linux 安装 kafka
    数据库性能优化
    Shell 中各种括号的作用
    DNS 配置实例-正反解析-主从同步-分离解析
    DHCP 中继转发配置(ensp 实现)
  • 原文地址:https://www.cnblogs.com/vincentqliu/p/regression.html
Copyright © 2020-2023  润新知