1.nn模块是神经网络模块
2.父类module,子类Sequential, Parallel和Concat
3.Linear:做线性变换
4.criterion 这个模块包含了各式各样的训练时的损失函数
5. torch中optim的sgd,全称Stochastic gradient descent(随机梯度下降)