Softmax

原文地址：http://blog.csdn.net/hungryof/article/details/50395062

简介

其实吧，一般在神经网络中用的最多的是sigmoid和tanh，当然也有用relu的。这是针对“是”和“否”的分类，但当进行多分类时，就要用到softmax 。

在logistic回归中，训练样本是：

在logistic回归中，激活函数是：

h θ (x) = 1 1 + e x p ( - θ T x )

训练

J (θ) = - 1 m [ \sum i = 1 m y ( i ) log h θ ( x ( i ) ) + ( 1 - y ( i ) ) log ( 1 -

我们要做的是分类，因此当然是想知道，当输入x是，x分别属于每一个类的概率，概率最大的那个就是我们认为的属于的类。
让输出为一个向量，并且有

h θ (x (i)) = ⎡⎣⎢⎢⎢⎢⎢ p (y (i) = 1 ∣ x (i); θ) p (y (i) = 2 ∣ x

这里的

上面的公式真难打。。
可以看出，我们将

softmax模型参数
softmax模型的参数是k个n+1维的

θ = ⎡⎣⎢⎢⎢⎢⎢ θ T 1 θ T 2 ⋮ θ T k ⎤⎦⎥⎥⎥⎥⎥

J (θ) = - 1 m ⎡⎣ \sum i = 1 m \sum j = 1 k 1 { y ( i ) = j } log e θ

J (θ) = - 1 m [ \sum i = 1 m ( 1 - y ( i ) ) log ( 1 - h θ ( x ( i ) ) ) + y ( log

p (y (i) = j | x (i); θ) = e θ T j x ( i ) \sum k l = 1 e θ T

\nabla θ j J (θ) = - 1 m \sum i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p (

虽然代价函数是上面形式，但是一般是添加一个权重衰减项

J (θ) = - 1 m ⎡⎣ \sum i = 1 m \sum j = 1 k 1 { y ( i ) = j } log e θ

\nabla θ j J (θ) = - 1 m \sum i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p ( y

相关阅读:
手机APP漏洞
测试用例的优先级的概念
测试出现BUG的理论逻辑
django-redis 中文文档
DRF单表序列化和反序列化
事件
QT文件操作
一道字符串题目
明日方舟六星出货率
简易图片查看器

原文地址：https://www.cnblogs.com/lzhu/p/8331259.html