udacity 机器学习课程 project2

准确率

import sys
from class_vis import prettyPicture
from prep_terrain_data import makeTerrainData

import matplotlib.pyplot as plt
import copy
import numpy as np
import pylab as pl


features_train, labels_train, features_test, labels_test = makeTerrainData()


########################## SVM #################################
### we handle the import statement and SVC creation for you here
from sklearn.svm import SVC
clf = SVC(kernel="linear")
clf.fit(features_train, labels_train)

#### now your job is to fit the classifier
#### using the training features/labels, and to
#### make a set of predictions on the test data

predictions = clf.predict(features_test)

#### store your predictions in a list named pred

pred = predictions



from sklearn.metrics import accuracy_score
acc = accuracy_score(pred, labels_test)

def submitAccuracy():
    return acc

把非数字的列特征转换成数字

def preprocess_features(X):
    ''' Preprocesses the student data and converts non-numeric binary variables into
        binary (0/1) variables. Converts categorical variables into dummy variables. '''
    
    # Initialize new output DataFrame可
    output = pd.DataFrame(index = X.index)

    # Investigate each feature column for the data
    for col, col_data in X.iteritems():
        
        # If data type is non-numeric, replace all yes/no values with 1/0
        if col_data.dtype == object:
            col_data = col_data.replace(['yes', 'no'], [1, 0])

        # If data type is categorical, convert to dummy variables
        if col_data.dtype == object:
            # Example: 'school' => 'school_GP' and 'school_MS'
            col_data = pd.get_dummies(col_data, prefix = col)  
        
        # Collect the revised columns
        output = output.join(col_data)
    
    return output

X_all = preprocess_features(X_all)
print "Processed feature columns ({} total features):
{}".format(len(X_all.columns), list(X_all.columns))

相关阅读:
3+1>4 第十次作业：Beta冲刺 Scrum meeting 4
3+1>4 第十次作业：Beta冲刺 Scrum meeting 3
3+1>4 第十次作业：Beta冲刺 Scrum meeting 2
3+1>4 第十次作业：Beta冲刺 Scrum meeting 1
实验九团队作业5：团队项目编码与Alpha冲刺
 3+1>4 第九次作业：Alpha冲刺 Scrum meeting 7
3+1>4 第九次作业：Alpha冲刺 Scrum meeting 6
3+1>4 第九次作业：Alpha冲刺 Scrum meeting 5
3+1>4 第九次作业：Alpha冲刺 Scrum meeting 4
个人作业——软件工程实践总结&个人技术博客
原文地址：https://www.cnblogs.com/lixiang-/p/5661794.html

最新文章
day86
day85
day84
day83
day82
day81
day80
day79
day78
利用DNSQuery 进行DNS查询