学习Pytorch过程中,发现torchvision.transforms使用频率特别高,便专门学习了下。部分引用别人的总结。
torchvision是独立于pytorch的关于图像操作的一些方便工具库。
torchvision的详细介绍在:https://pypi.org/project/torchvision/
torchvision主要包括一下几个包:
torchvision.datasets: 几个常用视觉数据集,可以下载和加载,这里主要的高级用法就是可以看源码如何自己写自己的Dataset的子类
torchvision.models: 流行的模型,例如 AlexNet, VGG, ResNet 和 Densenet 以及 与训练好的参数。
torchvision.transforms:常用的图像操作,例如:随机切割,旋转,数据类型转换,图像到tensor ,numpy 数组到tensor , tensor 到 图像等等。
torchvision.utils:用于把形似 (3 x H x W) 的张量保存到硬盘中,给一个mini-batch的图像可以产生一个图像格网。
目前学习用的比较多的是torchvision.transforms,这篇文章对torchvision.transforms源码进行了解读,https://github.com/pytorch/vision/blob/master/torchvision/transforms/transforms.py,
(GitHub源码可以对某函数选中自动弹出引用该函数和函数的源码,真是做得好),源码才是学习的王道!看到了个大神的学习笔记,直接引用在此:torchvision.transforms用法介绍:https://www.jianshu.com/p/1ae863c1e66d