机器学习（四）logistics回归和线性模型

机器学习（四）logistics回归和线性模型

一、从最普通的线性模型说起

给定由$d$个属性描述的变量$x=(x_{1};x_{1};...;x_{d};)$，其中$x_{d}$是$x$的第$i$个属性的取值，线性模型（linear model）是试图学习到一个属性的线性组合来进行预测的函数：

$y=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}+b=w^{T}x+b$

所谓的学习，就是学习其中的$w$和b，学得参数后，模型就得以确定。

但是线性模型并不仅仅满足于去拟合预测值y，也许有可能线性模型可以逼近y的衍生物，意思就是说，$w^{T}x+b$除了可以描述$y$以外，还可以描述$y$的函数，比如$logy$，$y^{2}$等。上面的模型可以叫做多元线性回归。

接下来介绍一种对数线性回归，就是说，预测值可能是随指数增长的，这种情况现实中也很多见，比如传染病的传播，就是指数增长的，当前感染人数越多，就意味着下一阶段感染人数会激增，这种情况就是指数增长。那我们可以用$y=e^{x}$这个简单的指数函数来描述，但是这里没有线性组合啊，于是我们用线性组合去替换x，得到：

$logy=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}$

这里省去了b，这个式子可以叫做对数线性回归，因为它是用线性组合来拟合y的对数形式。

二、逻辑斯蒂回归/对数几率回归

还有一种模型，是用线性组合来拟合y的几率，叫做对数几率回归：

$logfrac{y}{1-y}=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}$

如果我们经过一个简单的变换的话，可以得到：

$y=frac{exp(wx)}{1+exp(wx)}$

$1-y=frac{1}{1+exp(wx)}$

我们发现一个神奇的事情，右式是小于1的数，且和为1，既然我们的线性回归可以用来拟合y值，为什么不把y看做是输出某值的概率呢？所以上式可以做一下替换：

$P(y=1mid x)=frac{exp(wx)}{1+exp(wx)}$

$P(y=0mid x)=frac{1}{1+exp(wx)}$

$logfrac{P(y=1mid x)}{P(y=0mid x)}=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}$

这个模型的参数估计也比较容易，因为我们已经明确的把概率分布给写了出来：
相关阅读:
go mod 安装依赖 unkown revision问题解决
 K8S学习笔记
 TCP time_wait close_wait问题（可能是全网最清楚的例子）
认识beanstalkd
【线上问题系列】DB字段类型变更导致核心服务不可用
 mysql 类型自动化转换问题
 curl 用法
 requests访问https站点证书告警问题
 博客目录
 工作随笔——elasticsearch数据冷热分离、数据冷备
原文地址：https://www.cnblogs.com/liuxiangyan/p/12614583.html

机器学习（四）logistics回归和线性模型

一、从最普通的线性模型说起

二、逻辑斯蒂回归/对数几率回归