鸢尾花数据集 (Iris Flowers Dataset )(下载地址:http://t.cn/Rf8GeUq)
鸢尾花数据集采集的是鸢尾花的测量数据以及其所属的类别。每个类的观察值数量是均等的。一共有 150 个观察值,4个输入变量和1个输出变量。
测量数据包括:萼片长度(cm)、萼片宽度(cm)、花瓣长度(cm)、花瓣宽度(cm)。
类别共分为三类:Iris Setosa, Iris Versicolour, Iris Virginica。该数据集可用于多分类问题。
使用sklearn.datasets.load_iris即可加载相关数据集。
参数:
* return_X_y: 若为True,则以(data,target)形式返回数据;默认为False,表示以字典形式返回数据全部信息(包括data和target)。
加载示例:
>>> from sklearn.datasets import load_iris
>>> iris = load_iris()
>>> print(iris.data.shape)
>>> print(iris.target.shape)
>>> list(iris.target_names)
输出:
Out[7]: