• 深度学习训练数据打标签过程


    深度学习训练数据打标签过程

    为了获取大量的图片训练数据,在采集数据的过程中常用视频的方式采集数据,但对于深度学习,训练的过程需要很多的有有标签的数据,这篇文章主要是解决视频文件转换成图片文件,并加标签,最后把数据存储到pkl文件中,为后续深度学习提供数据。

    1. video to image

    • 这个应用,主要是把视频切分成图片,并保存到本地,可以自定义切分的时间间隔;
    • 在深度学习中,由于场景的需要,有时候需要自己动手去做图片的标注,但是我们在采取数据的时候,多把数据保存成视频的形式,对于视频的信息不好进行标注。对于视频转换成图片,可以通过播放视频,然后通过截图的方式把所需要的图片保存到本地,但是这样子的话,工作效率很很低。所以,为解决这个麻烦的过程,我先把视频的数据一帧一帧的读取进来,并生成成图片保存到本地,节省了大量的时间。

    具体代码实现过程

    # 导入所需要的库
    import cv2
    import numpy as np
    
    # 定义保存图片函数
    # image:要保存的图片名字
    # addr;图片地址与相片名字的前部分
    # num: 相片,名字的后缀。int 类型
    def save_image(image,addr,num):
        address = addr + str(num)+ '.jpg'
        cv2.imwrite(address,image)
    
    # 读取视频文件
    videoCapture = cv2.VideoCapture("./input/chen6.30.mp4")
    # 通过摄像头的方式
    # videoCapture=cv2.VideoCapture(1)
    
    #读帧
    success, frame = videoCapture.read()
    i = 0
    while success :
        i = i + 1
        save_image(frame,'./output/img_',i)
        if success:
            print('save image:',i)
        success, frame = videoCapture.read()
    
    save image: 1
    save image: 2
    save image: 3
    save image: 4
    save image: 5
    save image: 6......
    

    2. 对于生成的图片添加label,并保存成pkl格式

    • 在这里只选择两张图片进行举例。
    import numpy as np
    from PIL import Image
    import pickle
    import matplotlib.pyplot as plt
    %matplotlib inline
    

    2.1 读取图片

    img_640 = Image.open('./output/img_640.jpg')
    img_910 = Image.open('./output/img_910.jpg')
    
    # 显示图片
    plt.imshow(img_640)
    
    <matplotlib.image.AxesImage at 0x15ece1330b8>
    

    png

    2.2 把图片数据转换成numpy.ndarray

    img_640_n = np.array(img_640)
    img_910_n = np.array(img_910)
    
    type(img_640_n)
    
    numpy.ndarray
    

    2.3 对数据进行保存

    # 创建一个空list,用于存储图像数据因为是两张图片说以创建2个(480, 640, 3)的矩阵。
    image_data = []
    
    # 把数据存放进来
    image_data.append(img_640_n)
    image_data.append(imgh_910_n)
    
    # 添加标签,假设这两张图片是两个类别,把他们标注为类型1和2
    image_data_label = np.empty(2)
    
    image_data_label[0] = 1
    image_data_label[1] = 2
    
    # 把标签的类型转换成int类型,为了方便出来也把data转换成numpy.ndarray类型
    image_data = np.array(image_data)
    image_data_label=image_data_label.astype(np.int)
    image_data_label
    
    array([1, 2])
    
    plt.imshow(image_data[1])
    
    <matplotlib.image.AxesImage at 0x15ece1845f8>
    

    png

    2.4 把数据保存到pkl文件中

    # 把数据合并成一个元组进行保存
    train_data = (image_data,image_data_label)
    
    # 把数据写入pkl文件中
    write_file=open('./input/train_data.pkl','wb')  
    pickle.dump(train_data,write_file)  
    write_file.close()
    

    3.读取图片标签和数据

    # 从pkl文件中读取图片数据和标签
    read_file=open('./input/train_data.pkl','rb')  
    
    (train_data,lab_data)=pickle.load(read_file)
    read_file.close() 
    
    
    # 查看读取出来的数据
    train_data.shape
    
    (2, 480, 640, 3)
    
    lab_data
    
    array([1, 2])
    
    plt.imshow(train_data[0])
    
    <matplotlib.image.AxesImage at 0x15ece1daa20>
    

    png

    到这里就完成了把图片加标签后存储与读取,为后续神经网络数据的输入做准备,当我们需要数据的时候,把pkl文件加载进来就可以。

    github地址

  • 相关阅读:
    进程和程序的关系
    进程和线程区别和联系
    什么是进程,进程的特征
    23.each和map函数
    22.仿淘宝五角星评论(链式编程、隐式迭代)
    19.阻止事件冒泡e.stopPropagation();
    18.阻止默认操作e.preventDefault();防止冒泡事件:e.stopPropagation()
    15.仿腾讯固定导航栏
    14.仿京东右侧边导航栏
    算法学习:树上差分
  • 原文地址:https://www.cnblogs.com/Zhi-Z/p/8822271.html
Copyright © 2020-2023  润新知