• rapidminer 数据导入及几个算子简单应用


    rapidminer 数据导入及几个算子简单应用

    一、 数据集选择

    本次实验选择的数据集为: bank-data.csv 其中有600条数据 结构如下图:

    二、数据集文件格式转换

    Rapidminer 支持的导入数据格式有如下图所示:

    所以我们需要把下载的数据集文件格式进行转换,由于本次实验下载的文件本身已是csv格式,此处不做任何操作。

    三、数据集的导入保存

    1:选择 import csv file

    2:选择 Next

    3:选择 Next

    4:选择 Next

    5:选择 Next

     

    6:选择 Finish, 完成导入数据

    7:查看目录中生成的导入数据

     

    四、流程创建及简单算子测试

    1:选择 FileàNew Process 即可创建一个空白流程:

    2:将上述中导入的数据拖放到流程中并链接:

    运行查看结果:

    2:sample算子 使用

    在Data Transformation 中选择 sample 算子 拖到 流程中:此处设置选择100条数据

    运行,查看结果:

     

    3: 在Data Transformation 中选择 sort 算子拖到 流程中:此处设置 以income属性进行升序排序:

    运行查看结果:

    4: 在Data Transformation 中选择 selection 算子拖到 流程中:此处选择4个属性:

     

    运行查看结果:

     

    5: 在Data Transformation 中选择 filterexample 算子 拖到 流程中:此处过滤掉年龄小于30岁的数据:

     

    运行查看结果:

  • 相关阅读:
    ffmpeg-3.2.4-static-win32-for-XP-bin.tar.xz
    FFmpeg Scaler Options
    MinGW GCC 6.3.0 2017年3月份出炉啦
    ffmpeg-201701[10,16,21,23,25]-bin.7z
    ffmpeg-201612[01,08,10,17,21,27,30]-bin.7z
    Firefox Portable Developer 52.0.0.6176-6178
    DIR 按文件名中数字大小进行排序
    ffmpeg-20161104[07,10,16,21,22,27,30]-bin.7z
    gnuWin32-mini-2016.10.30
    gnu coreutils-8.25 for win32 static
  • 原文地址:https://www.cnblogs.com/wt869054461/p/5051337.html
Copyright © 2020-2023  润新知