• numpy数据集练习


     

    (1)安装scipy,numpy,sklearn包

    (2)从sklearn包自带的数据集中读出鸢尾花数据集data

    (3)查看data类型,包含哪些数据

    #加载numpy包
    import numpy
    #加载sklearn包
    from sklearn.datasets import load_iris 
    #读出鸢尾花数据集data
    data=load_iris()
    #查看data类型
    print(type(data))
    #查看数据内容
    print(data.keys())

    运行结果:

    (4)取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型

    #鸢尾花的四个特征#
    data_feature= data.feature_names
    iris_data=data.data
    print(data_feature)
    print(iris_data)
    #鸢尾花的三个类别#
    data_target =data.target_names
    print(data_target)
    iris_data=data.target
    print(iris_data)
    #数据类型#
    type(iris_data)

    运行结果:

    (5)取出所有花的花萼长度(cm)的数据

    #鸢尾花花萼长度的数据#
    sepal_length=numpy.array(list(len[0] for len in data['data']))
    print(sepal_length)

    运行结果:

    (6)取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

    #所有花花瓣的长度#
    data_petal_l=[x[2] for x in data['data']]
    #所有花花瓣的宽度#
    data_petal_w=[x[3] for x in data['data']]
    #所有花花瓣的长度和宽度
    data_petal_l_w=np.array([data_petal_l,data_petal_w])

    运行结果:

    (7)取出某朵花的四个特征和类别

    (8)将所有花分成三个组,每组50个

    (9)生成新的元祖,每组包括特征和类别

    #(7)某朵花的四个特征和类别#
    data_flower=(data['data'][0],data['target_names'][0])
    data_flower
    #(8)定义三个列表来存放不同类型花朵的类别#
    data_setosa=[]  #存放类为0的花朵
    data_versicolor=[] #存放类为1的花朵
    data_virginica=[] #存放类为2的花朵
    len(data['data'])
    for i in  range(0,150):
        if data['target'][i]==0:#类别为setosa
            datas=data['data'][i].tolist()
            datas.append('setosa')
            print(data_setosa.append(datas))
        elif data['target'][i]==1:#类别为versicolor
            datas=data['data'][i].tolist()
            datas.append('versicolor')
            data_versicolor.append(datas)
        else:
            datas=data['data'][i].tolist()#类别为virginica
            datas.append('virginica')
            data_virginica.append(datas)
    #(9)形成新的数组来存放三个类别的花朵#
    new_data=(np.array([data_setosa,data_versicolor,data_virginica]))
    print(new_data)

    运行结果:

     

  • 相关阅读:
    关于LEA指令(单周期就可以做简单的算术计算)
    说说字符集和编码(非常形象,非常有意思)
    类依赖项的不透明性和透明性
    构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(6)-Unity 2.x依赖注入by运行时注入[附源码]
    大端和小端
    Google C++测试框架系列:入门
    随机森林中的数学基础之大数定律
    K-means Algorithm
    JavaScript插件——按钮
    分布式系统设计(8)
  • 原文地址:https://www.cnblogs.com/moon2/p/9786142.html
Copyright © 2020-2023  润新知