机器学习研究的数据集列表
维基百科,自由的百科全书
跳转到导航跳转到搜索
机器学习和
数据挖掘
内核Machine.svg
问题[显示]
监督式学习
(分类 • 回归)
[显示]
聚类[显示]
降维[显示]
结构化预测[显示]
异常检测[显示]
神经网[显示]
强化学习[显示]
理论[显示]
机器学习场地[显示]
相关文章[显示]
门户puzzle.svg 机器学习门户
v Ť Ë
这些数据集用于机器学习研究,并在同行评议的学术期刊中被引用。数据集是机器学习领域不可分割的一部分。这一领域的重大进展可能源于学习算法(如深度学习),计算机硬件的进步以及不太直观的高质量训练数据集的可用性。[1]用于监督和半监督的高质量标记训练数据集机器学习算法通常难以生产并且昂贵,因为标记数据需要大量时间。虽然他们不需要贴上标签,但用于无监督学习的高质量数据集也很难生成并且成本很高。[2] [3] [4] [5]
https://en.wikipedia.org/wiki/List_of_datasets_for_machine_learning_research
https://www.icpsr.umich.edu/icpsrweb/ICPSR/
https://blog.csdn.net/qy20115549/article/details/52912766