本文目前汇总了常见的24个开源工业缺陷数据集,持续更新中
(欢迎大家留言补充,共同建设一个为大家提供便利的文章)
1、东北大学热轧带钢表面缺陷数据集
该数据集是东北大学的宋克臣等几位老师收集的,一共包含了三类数据,官网有时打不开,三种缺陷数据集我都我保存到了百度网盘里
百度网盘链接:
提取码:ibje
(1)NEU surface defect database
数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷,每种缺陷300张,图像尺寸为200×200。数据集包括分类和目标检测两部分,不过目标检测的标注中有少量错误,需要注意。部分示例如下:
(2)Micro surface defect database
微小型的带钢缺陷数据,缺陷只有约6×6个像素大小
(3)Oil pollution defect database
油污干扰的硅钢表面缺陷数据集
2、Kaggle中谢韦尔钢铁公司提供的带钢缺陷数据集
该数据集中提供了四种类型的带钢表面缺陷。训练集共有12568张,测试集5506张。图像尺寸为1600×256。
有如果有学术研究的需要,可以无限制使用,请将PAO Severstal(https://www.severstal.com/)指定为数据集所有者。
本来想传到百度网盘供大家下载的,奈何500个文件以上需要超级会员。。。上万张图片,数量实在是太多了,没法手动上传。
3、UCI Steel Plates Faults Data Set
该数据集包含了7种带钢缺陷类型。这个数据集不是图像数据,而是带钢缺陷的28种特征数据,可用于机器学习项目。
百度网盘链接:
提取码:9uv2
4、DAGM 2007数据集
该数据集是人为生成的,一共包含了10个class,图像大小为512×512。该数据集为部分示例如下:
百度网盘链接:
提取码:j9qz
5、磁瓦缺陷数据集
中国科学院自动所一个课题组收集的数据集,是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像,并做了语义分割的标注。
百度网盘链接:
提取码:ky8i
6、Kolektor 表面缺陷数据集
该数据集是Kolektor Group收集并标注的电子换向器缺陷数据集。数据集中包含了50种编写的电子换向器,每种有8张图片以及其语义分割的label。图像的大小为500×1240像素。为了更方便的训练,需提前将图像调整为512×1408。
百度网盘链接:
提取码:1zlb
7、铁轨表面缺陷数据集
RSDDs数据集包含两种类型的数据集:第一种是从快车道捕获的I型RSDDs数据集,其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集,其中包含128个具有挑战性的图像。
两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。
RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。
百度网盘链接:
提取码:nanr
8、水泥道路裂缝数据集
主要针对水泥路面的裂缝检测,可用于分类、分割和Detection
百度网盘链接:
提取码:7nzx
9、桥梁裂缝图像数据
桥梁裂缝的检测数据:
百度网盘链接:
提取码:z493
10、混凝土表面裂纹缺陷数据集
数据集包含带有和不带有裂纹的各种混凝土表面的图像。 图像数据在单独的文件夹中分为负片(无裂纹)和正片(无裂纹)两部分,用于图像分类。 每个类别有20000张图像,总共40000张图像,带227 x 227像素的RGB通道。
11、天池铝型材表面缺陷数据集
2018年阿里天池大赛,广东工业智造大数据创新大赛—智能算法赛中提供的数据集。
百度网盘链接:
提取码:i10s
12、天池纺织品表面异常数据集
在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵,每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类,其中,素色布数据约8000张,用于初赛;花色布数据约12000张,用于复赛。
百度网盘链接:
提取码:2j46
复制这段内容后打开百度网盘手机App,操作更方便哦
13、KTH-TIPS database
瑞典皇家理工学院提供的背景纹理数据集,类型包括砂纸、铝箔、发泡胶、海绵、灯芯绒、亚麻、棉、黑面包、橙皮和饼干共10类。
百度网盘链接:
提取码:am65
14、印刷电路板(PCB)瑕疵数据集
这是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。
官方链接:北京大学智能机器人开放实验室
15、AITEX数据集
该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像,每种类型的织物20个,除此之外,有105幅纺织行业中常见的不同类型的织物缺陷(12种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。Internet上的数据库还包含所有具有缺陷的图像的分割mask,使得白色像素表示缺陷区域,其余像素为黑色。
百度网盘链接:
提取码:z9yc
16、Kylberg Texture Dataset v. 1.0
28种纹理图像,每一种有160个独特的纹理。图像大小为576x576像素。
17、输电线路绝缘子数据集
数据集中,Normal_Insulators包含由无人机捕获的绝缘子图像,数量为600张。
Defective_Insulators包含有缺陷的绝缘体,绝缘子缺陷图像的数量为248张。
数据集中包括数据集和标签。
18、百度AI Studio中的数据集
百度AI Studio中有很多的数据集,可以直接去搜索
Baidu AI Studio - 人工智能学习与实训社区
例如:
布匹缺陷数据集:布匹缺陷数据集:
瓷砖缺陷数据集:瓷砖缺陷数据集
绝缘子自爆缺陷图像:绝缘子自爆缺陷图像
工业缺陷检测:工业缺陷检测
PCB缺陷检测:PCB缺陷检测
手扶电梯梯级缺陷:手扶电梯梯级缺陷
19、CV Datasets on the web
汇总了CV领域的常见数据集,与工业缺陷的关系不大。
欢迎大家留言补充,共同建设一个为大家提供便利的文章。