Weka 入门1

本人也是借鉴网上他人资料。主要介绍使用java调用Weka库。

首先介绍weka，Weka的全名是怀卡托智能分析环境，是基于开源环境的机器学习和数据挖掘软件。我们可以去weka官网下载最新的Weka软件，目前最新版本是3.7.9。默认安装会保存

在C:Program FilesWeka-3-7目录下，目录下有一个data的文件夹，里面存放的是一些数据集，我们也可以把data文件拷到别的地方更方便调用，这里面的数据可以用于我们学习Weka的使用。我们以data文件夹中的一个.arff文件为例对文件格式进行说明，如下图：

（1）关系声明

格式为@relation <relation-name>在文件的第一行，关系名称不能有空格，如有空格需要用加上引号。

（2）属性说明

格式为@attribute <attribute-name> <data-type>

attribute-name是属性名称，区分大小写。data-type是数据类型，常用类型有numeric（数值型：整数，小数等）nominal（分类型：举个例子如@attribute outlook{sunny，overcast，rainy}，取值集合就是后面sunny，overcast，rainy）

（3）数据说明

数据信息以@data作为标志。

在@data下面的行中，每一行作为一个例子，包含了所以已经声明的属性，如果属性值为空则要求用“ ？”来代替

下面我们便使用java简单调用Weka使用，软件的使用在这里不介绍，这里只说明如何对weka进行2次开发。

Instances：我们可以认为它是数据集的实例集合。

package InstanceTest;
import weka.core.Instances;

import java.io.*;
public class InstanceTest {

/**
* @param args
*/

public static Instances GetInstance(String FileName)throws Exception
{
FileReader reader=new FileReader(FileName);
Instances data=new Instances(reader);
return data;
}

public static void main(String[] args) {
// TODO Auto-generated method stub
try
{
Instances date=GetInstance("D://train.arff");
// System.out.print(date); 全部输出数据集或者也可以使用numInstances循环输出
for(int i=0;i<date.numInstances();i++)
{
System.out.println(date.instance(i));

}

}
catch(Exception e)
{
e.printStackTrace();
}
}

}

从菜鸟走向大神，这是道路。

相关阅读:
洛谷 P2421 [NOI2002]荒岛野人
POJ 2115 C Looooops
POJ 3292 Semi-prime H-numbers
[网络流24题]负载平衡问题（费用流）
[网络流24题]骑士共存问题
POJ 3281 Dining
洛谷 1306斐波那契公约数
ELK+Filebeat 安装配置入门
一个JS内存泄露实例分析
Node.js 事件循环

原文地址：https://www.cnblogs.com/GuoJiaSheng/p/3832978.html