深度学习——线性代数

深度学习——线性代数

1、标量、向量、矩阵、张量

1.1 标量(Scalar)

　　表示一个单独的数，通常用斜体小写字母表示，如$sin R$ 。

1.2 向量 (Vector)

　　表⽰一列数，这些数有序排列的，可以通过下标获取对应值，通常⽤粗体⼩写字母表⽰：$xin R^{n}$ ，它表⽰元素取实数，且有 n个元素，第⼀个元素表⽰为：$x_{1}$。将向量写成列向量的形式：

　　　　$x=egin{bmatrix}x_{1}\ x_{2}\ ...\ x_{n}end{bmatrix}$　　

　　有时需要向量的⼦集，例如第 1, 3, 6 个元素，那么我们可以令集合 S = {1, 3, 6} ，然后⽤ x_S 来表⽰这个⼦集。另外，我们⽤符号 - 表⽰集合的补集：x₋₁ 表⽰除 x₁ 外 x 中的所有元素，x_−S 表⽰除 x₁, x₃, x₆ 外 x 中的所有元素。

1.3 矩阵 (Matrix)

　　表⽰⼀个二维数组，每个元素的下标由两个数字确定，通常⽤⼤写粗体字母表⽰：$Ain R^{n imes m}$，它表⽰元素取实数的 m ⾏ n 列矩阵，其元素可以表⽰为：A_1,1, A_m,n。我们⽤ : 表⽰矩阵的⼀⾏或者⼀列：A_i,: 为第 i ⾏，A_:,j 为第 j 列。

　　矩阵可以写成这样的形式：

　　　　$egin{bmatrix}A_{1,1} & A_{1,2}\ A_{2,1} &A_{2,2}end{bmatrix}$

　　有时我们需要对矩阵进⾏逐元素操作，如将函数 f 应⽤到 A 的所有元素上，此时我们⽤ f(A)_i,j 表⽰。

1.4 张量 (Tensor)

　　超过二维的数组，我们⽤ A 表⽰张量，A_i,j,k 表⽰其元素（三维张量情况下）。

2、矩阵转置

　　矩阵转置 (Transpose) 相当于沿着对角线翻转，定义如下：

　　　　$A_{ij}^{T}=A_{ij}$

　　矩阵转置的转置等于矩阵本⾝:

　　　　$(A^{T})^{T}=A$

3、矩阵加法

　　加法即对应元素相加，要求两个矩阵的形状⼀样：

　　　　$C=A+B,C_{i,j}=A_{i,j}+B_{i,j}$

　　数乘即一个标量与矩阵每个元素相乘：

　　　　$D=acdot B+c,D_{i,j}=acdot B_{i,j}+c$

　　有时我们允许矩阵和向量相加的，得到⼀个矩阵，把 b 加到了 A 的每⼀⾏上，本质上是构造了⼀个将 b 按⾏复制的⼀个新矩阵，这种机制叫做⼴播 (Broadcasting)：
　　　　$C=A+b,C_{i,j}=A_{i,j}+b_{j}$

4、矩阵乘法

　　两个矩阵相乘得到第三个矩阵，我们需要 A 的形状为 m × n，B 的形状为 n × p，得到的矩阵为 C 的形状为 m × p：

　　　　$C=AB$

　　具体定义为:

　　　　$C_{i,j}=sum limits_{k}A_{i,k}B_{i,k}$

5、单位矩阵

　　为了引⼊矩阵的逆，我们需要先定义单位矩阵 (Identity Matrix)：单位矩阵乘以任意⼀个向量等于这个向量本⾝。记 In 为保持 n 维向量不变的单位矩阵，即：

　　　　$I_{n}=R^{n imes m},forall xin R^{n},I_{n}x=x$

　　单位矩阵的结构⼗分简单，所有的对⾓元素都为 1 ，其他元素都为 0，如：

　　　　$egin{bmatrix}1 & 0 &0 \ 0& 1& 0\ 0 & 0 & 1end{bmatrix}$

6、矩阵的逆

　　矩阵 A 的逆 (Inversion) 记作$A^{-1}$，定义为⼀个矩阵使得

　　　　$A^{-1}A=I_{n}$

　　如果 $A^{-1}$存在，那么线性⽅程组 Ax = b 的解为：

　　　　$A^{-1}Ax=I_{n}x=x=A^{-1}b$

7 、范数

　　通常我们⽤范数 (norm) 来衡量向量，向量的 L^p 范数定义为：
　　$left | x ight |_{p}=(sum limits_{i}|x_{i}|)^{p},pin R,pgeq1$

8、特征值分解

　　如果⼀个 n × n 矩阵 A 有 n 组线性⽆关的单位特征向量$left {v^{(1)}、v^{(2)}...v^{(n)} ight }$，以及对应的特征值 λ₁, . . . , λ_n。将这些特征向量按列拼接成⼀个矩阵：$V=left {v^{(1)}、v^{(2)}...v^{(n)} ight }$，并将对应的特征值拼接成一个向量$lambda =left {lambda_{(1)}、lambda_{(2)}...lambda_{(n)} ight }$。

9、奇异值分解

　　奇异值分解 (Singular Value Decomposition, SVD) 提供了另⼀种分解矩阵的⽅式，将其分解为奇异向量和奇异值。与特征值分解相⽐，奇异值分解更加通⽤，所有的实矩阵都可以进⾏奇异值分解，⽽特征值分解只对某些⽅阵可以。奇异值分解的形式为：
　　A = UΣV^T

　　若 A 是 m × n 的，那么 U 是 m × m 的，其列向量称为左奇异向量，⽽ V 是 n × n 的，其列向量称为右奇异向量，⽽ Σ 是 m × n 的⼀个对⾓矩阵，其对⾓元素称为矩阵 A 的奇异值。

　　事实上，左奇异向量是 AA^⊤ 的特征向量，⽽右奇异向量是 A^⊤A 的特征向量，⾮ 0 奇异值的平⽅是 A^⊤A 的⾮ 0 特征值。

因上求缘，果上努力~~~~ 作者：每天卷学习，转载请注明原文链接：https://www.cnblogs.com/BlairGrowing/p/14797937.html
相关阅读:
jps命令
 Collection
java.lang包中异常
 final关键字
 JVM运行时数据区域
 String详解
 哈希码
 Java虚拟机
 垃圾收集器与内存分配策略
 solr简介
原文地址：https://www.cnblogs.com/BlairGrowing/p/14797937.html

最新文章
linux 服务器挂在目录
 系统启动流程
 sudo详解
 网络管理
 软件管理
 LVM2
RAID
磁盘管理
 进程管理
 数据呈现

深度学习——线性代数

1、标量、向量、矩阵、张量

1.1 标量(Scalar)

1.2 向量 (Vector)

1.4 张量 (Tensor)

2、矩阵转置

3、 矩阵加法

4、 矩阵乘法

5、 单位矩阵

6、 矩阵的逆

7 、范数

8、特征值分解

9、奇异值分解

3、矩阵加法

4、矩阵乘法

5、单位矩阵

6、矩阵的逆