• 常用的20个计算机视觉开源数据集总结


    计算机视觉是人工智能的一个领域,它训练计算机解释和理解视觉世界。利用来自相机和视频的字图像以及深度学习模型,机器可以准确地识别和分类物体,然后对它们“看到的”做出反应。

    本文总结了常用的开源计算机视觉数据集,数据集很多如果放网址会被认定广告,所以请自行通过名字搜索,数据集按照字母顺序排序。

    1、COVID-19 X-Ray Dataset (V7)

    这是COVID-19的V7版本的数据集,包含6500张AP/PA胸部x光片图像,像素级的多边形肺分割。其中有517例COVID-19病例。

    每个图像都包含:

    两个“肺”分割掩码

    类型标签(病毒性、细菌性、真菌性、健康/无)

    如果患者患有COVID-19,则会附加标签说明年龄、性别、体温、位置、插管状态、ICU住院情况和患者预后。

    肺部注释是遵循像素级边界的多边形。可以将它们导出为COCO、VOC或Darwin JSON格式。每个注释文件都包含到原始全分辨率图像和缩小大小的缩略图。

    2、CIFAR-10 & CIFAR-100

    CIFAR-10和CIFAR-100是Alex Krizhevsky、Vinod Nair和Geoffrey Hinton收集的8000万张小图像数据集的标记子集。

    CIFAR-10包含60000张32x32彩色图像,包含10个类(动物和真实物体)。每个类有6000张图片。这个数据集有50000张训练图片和10000张测试图片。

    CIFAR-100包含100个类,每个类包含600个图像。每个类有500张训练图片和100张测试图片。

    3、ImageNet

    ImageNet是最受欢迎的图像数据集之一,拥有超过1400万张手工注释的图像。这个数据集就不用多介绍了

    4、Kinetics-700

    这是是一个大型视频数据集,包含650,000个剪辑,涵盖700个人类动作类。

    这些视频包括演奏乐器等人与物之间的互动,以及拥抱等人与人之间的互动。每个动作类至少有700个视频剪辑,每个剪辑都标注了一个持续约10秒的动作类。

    完整文章:

    https://avoid.overfit.cn/post/33f42dacef5b4ba49537a91c45cf216a

  • 相关阅读:
    html area标签 语法
    html applet标签 语法
    html address标签 语法
    html acronym标签 语法
    html abbr标签 语法
    html a标签 语法
    mysql MAX()函数 语法
    mysql LAST()函数 语法
    mysql FIRST()函数 语法
    mysql COUNT()函数 语法
  • 原文地址:https://www.cnblogs.com/deephub/p/16733850.html
Copyright © 2020-2023  润新知