创建tensor
x = torch.empty(*sizes) #创建一个未初始化的tensor(后面用torch.nn.init中的一些函数进行初始化)
>>> torch.empty(2, 3)
tensor(1.00000e-08 *
[[ 6.3984, 0.0000, 0.0000],
[ 0.0000, 0.0000, 0.0000]])
x = torch.rand(5, 3) #返回一个范围为[0,1)、size为5*3的矩阵
tensor([[0.3380, 0.3845, 0.3217], [0.8337, 0.9050, 0.2650], [0.2979, 0.7141, 0.9069], [0.1449, 0.1132, 0.1375], [0.4675, 0.3947, 0.1426]])
x = torch.zeros(5, 3, dtype=torch.long)
tensor([[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]])
x = torch.ones(5, 3, dtype=torch.double)
tensor([[1., 1., 1.], [1., 1., 1.], [1., 1., 1.], [1., 1., 1.], [1., 1., 1.]], dtype=torch.float64)
x = torch.tensor([5.5, 3]) #Construct a tensor directly from data
tensor([5.5000, 3.0000])
tensor运算
torch.mm(tensor1, tensor2, out=None) #tensor的矩阵乘法matrix multiplication
torch.mul(tensor1, tensor2, out=None) #tensor的点乘Hadamard product
tensor相关操作
x.size() #取tensor的size,返回的是tuple
z = x.view(-1, 8) #和reshape功能一样,只是参数少了一层括号
x = x.clamp(min, max) #取最大最小值,和numpy.clip(a, a_min, a_max, out=None)类似
torch.max()
torch.max(Tensor) #对所有元素,取最大值,返回只有一个数的tensor
torch.max(input, dim, keepdim=False, out=None) #对dim维度上的元素取最大值,返回两个tensor,第一个是dim上的最大值,第二个是最大值所在的位置(argmax)
torch.cat(seq, dim=0, out=None) #concatenate,功能和numpy.concatenate((a1, a2, ...), axis=0, out=None)一样,格式也恰好一样
一个技巧:inputs = torch.cat(inputs).view(len(inputs), 1, -1) #先cat再view(reshape)
torch.stack( (a,b,c) ,dim = 2) #建立一个新的维度,然后再在该纬度上进行拼接
torch.stack VS torch.cat:cat是在已有的维度上拼接,而stack是建立一个新的维度,然后再在该纬度上进行拼接。
用其实现 x.append(in_tensor) 的功能:先构造已经append好的x(此时x为list),然后x = torch.stack(x, dim = 0)
可参考 https://blog.csdn.net/Teeyohuang/article/details/80362756
torch.unsqueeze(input, dim, out=None) #给input(一个tensor)在dim维度上增加一个维度
>>> x = torch.tensor([1, 2, 3, 4])
>>> torch.unsqueeze(x, 0)
tensor([[ 1, 2, 3, 4]])
>>> torch.unsqueeze(x, 1)
tensor([[ 1],
[ 2],
[ 3],
[ 4]])
b = a.numpy() #torch tensor转numpy array
b = torch.from_numpy(a) #numpy array转torch tensor(两种转都是没有复制,而是直接引用的)
tensor_a , idx_sort = torch.sort(tensor_a, dim=0, descending=True) #tensor排序,返回排序后的tensor和下标
tensor求导
x = torch.ones(2, 2, requires_grad=True) #创建时设置requires_grad为True,将x看成待优化的参数(权重)
model.zero_grad() #将每个权重的梯度清零(因为梯度会累加)
optimizer.zero_grad() #当optimizer=optim.Optimizer(model.parameters())时,其与model.zero_grad()等效
loss.backward() #求导,即对loss进行back propagation
optimizer.step() #在back propagation后更新参数
定义神经网络:
1. 定义网络架构(模型的forward,通常用一个继承自torch.nn.Module的类)
__init__():将nn实例化(每一个nn都是一个类),参数自己定义
forward(self, x):模型的forward,参数x为模型输入
self.add_module("conv", nn.Conv2d(10, 20, 4)) # self.conv = nn.Conv2d(10, 20, 4) 和这个增加module的方式等价
torch.nn.Embedding(num_embeddings, embedding_dim, ...) #是一个矩阵类,里面初始化了一个随机矩阵,矩阵的长是字典的大小,宽是用来表示字典中每个元素的属性向量,向量的维度根据你想要表示的元素的复杂度而定。类实例化之后可以根据字典中元素的下标来查找元素对应的向量。
2. 定义输入输出
3. 定义loss(如果用nn需要实例化才定义,否则用functional直接在训练中用)
4. 定义优化器
训练:
1. 初始化,如model.zero_grad()将一些参数初始化为0
2. 准备好输入
3. 将模型设置为train模式
4. 将模型forward
5. 计算loss和accuracy
6. back propagation并计算权重的梯度
7. 做validation
8. 打印Epoch、loss、acc、time等信息
(不一定所有步骤都有,可以看情况省略部分)
验证或测试:
1. 准备好输入
2. 将模型设置为eval模式
3. 将模型forward
4. 计算loss和accuracy
5. 打印loss、acc等信息
(train和test相比,主要多了bp相关的,包括zero_grad()和backward()等)
torch.
max
(input, dim, keepdim=False, out=None)