• Albumentations数据增强库


    0 过拟合与图像增强

    通常我们训练一个深度卷积神经网络需要足够多的数据来防止模型过拟合,然而收集任务所需的数据往往代价较大。因此我们需要另辟蹊径,而图像增强就是另一种简单可行的防止过拟合的方法。
    本质上,图像增强就是一个从已有的训练样本中创建新的训练样本的过程。要制作一个新样本,可以对原始图像进行轻微的更改。例如,你可以让一个新图像更亮一点;你可以从原始图像上切下一块;你可以通过镜像原来的图像来创建一个新的图像等等。
    现在图像增强(包含在广义的数据增强中)已经成为深度学习训练过程的标配,下面介绍今天的主角:又快又强的图像增强库——albumentations

    1 安装

    pip install albumentations
    

    2 使用

    给出一个简单的使用示例:

    import albumentations as A
    
    transform = A.Compose([
        A.RandomCrop(width=256, height=256),
        A.HorizontalFlip(p=0.5),
        A.RandomBrightnessContrast(p=0.2),
    ])
    
    image = cv2.imread("/path/to/image.jpg")
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    transformed_image = transform(image=image)["image"]
    

    注意图像需要先转化成numpy数组,针对opencv还需要将BGR格式转化为RGB格式。

    数据增强需要同时对图像和标签进行相同的操作,考虑到不同任务的标签不同,有以下几种使用对象:

    3 常用操作

    这个库支持的操作太多了,这里列出我个人常用的且实验确实有效的:

    • HorizontalFlip
    • VerticalFlip
    • Transpose
    • RandomResizeCrop
    • Rotate
    • PadIfNeeded

    训练时目标的大小(scale)很影响模型的泛化性能,增加scale上的数据增强有一定作用。
    这里的目标大小指的是:模型输入的图像目标相对于卷积核的大小,影响因素有输入图像尺寸及目标相对图像尺寸的大小。

  • 相关阅读:
    【转】linux清屏的几种方法
    【转】Ubuntu 64位系统安装交叉编译环境一直提醒 没有那个文件或目录
    【转】无法获得锁 /var/lib/dpkg/lock
    层级原理图设计方法
    【转】gcc 编译使用动态链接库和静态链接库
    【转】设置 vim 显示行号永久有效
    【转】VMware 全屏显示
    emwin之自绘制 BUTTON 图形的一些问题
    使用 sizeof 获取字符串数组的大小
    emwin之2D图形流位图显示的方法
  • 原文地址:https://www.cnblogs.com/tofengz/p/13401851.html
Copyright © 2020-2023  润新知