• 感知器及其应用



    博客班级 AHPU机器学习
    作业要求 作业要求
    作业目标 熟练掌握代码编写
    学号 3180701209

    一.实验目的

    1.理解感知器算法原理,能实现感知器算法;

    2.掌握机器学习算法的度量指标;

    3.掌握最小二乘法进行参数估计基本原理;

    4.针对特定应用场景及数据,能构建感知器模型并进行预测。

    二.实验内容

    1.安装Pycharm,注册学生版。

    2.安装常见的机器学习库,如Scipy、Numpy、Pandas、Matplotlib,sklearn等。

    3.编程实现感知器算法。

    4.熟悉iris数据集,并能使用感知器算法对该数据集构建模型并应用

    三、实验报告要求

    1.按实验内容撰写实验过程;

    2.报告中涉及到的代码,每一行需要有详细的注释;

    3.按自己的理解重新组织,禁止粘贴复制实验内容!

    四.实验过程及结果

    实验代码及注释

    随即梯度下降法 Stochastic Gradient Descent
    随机抽取一个误分类点使其梯度下降。

    当实例点被误分类,即位于分离超平面的错误侧,则调整w, b的值,使分离超平面向该无分类点的一侧移动,直至误分类点被正确分类。

    (1)、

    import pandas as pd #Pandas是python的一个数据分析包
    import numpy as np
    from sklearn.datasets import load_iris #iris数据集
    import matplotlib.pyplot as plt
    %matplotlib inline
    

    (2)、

    %# load data
    iris = load_iris() #iris数据集
    df = pd.DataFrame(iris.data, columns=iris.feature_names)//获取列的属性值
    df['label'] = iris.target//增加一列为类别标签
    

    (3)、

    #columns是列名(列索引)
    df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'label']//将各个列重命名
    df.label.value_counts()value_counts//计算相同数据出现的次数
    

    (4)、

    %#画两分类散点图
    plt.scatter(df[:50]['sepal length'], df[:50]['sepal width'], label='0')//绘制散点图
    plt.scatter(df[50:100]['sepal length'], df[50:100]['sepal width'], label='1')
    plt.xlabel('sepal length')//给图加上图例
    plt.ylabel('sepal width')
    plt.legend()
    

    (5)、

    data = np.array(df.iloc[:100, [0, 1, -1]])//按行索引,取出第0,1,-1列
    

    (6)、

    X, y = data[:,:-1], data[:,-1]//X为sepal length,sepal width y为标签
    

    (7)、

    y = np.array([1 if i == 1 else -1 for i in y])//将两个类别设重新设置为+1 —1
    

    (8)、

    #数据线性可分,二分类数据,此处为一元一次线性方程
    class Model:
    def init(self)://将参数w1,w2置为1 b置为0 学习率为0.1
    self.w = np.ones(len(data[0])-1, dtype=np.float32) //data[0]为第一行的数据len(data[0]=3)这里取两个w权重参数
    self.b = 0
    self.l_rate = 0.1
    %# self.data = data
    
    def sign(self, x, w, b):
    y = np.dot(x, w) + b
    return y
    
    # 随机梯度下降法
    def fit(self, X_train, y_train)://拟合训练数据求w和b
    is_wrong = False//判断是否误分类
    while not is_wrong:
    wrong_count = 0
    for d in range(len(X_train))://取出样例,不断的迭代
    X = X_train[d]
    y = y_train[d]
    if y * self.sign(X, self.w, self.b) <= 0://根据错误的样本点不断的更新和迭代w和b的值(根据相乘结果是否为负来判断是否出错,本题将0也归为错误)
    self.w = self.w + self.l_ratenp.dot(y, X)
    self.b = self.b + self.l_ratey
    wrong_count += 1
    if wrong_count == 0://直到误分类点为0 跳出循环
    is_wrong = True
    return 'Perceptron Model!'
    
    def score(self):
    pass
    

    (9)、

    perceptron = Model()
    perceptron.fit(X, y)//感知机模型
    

    (10)、绘制模型图像,定义一些基本的信息

    x_points = np.linspace(4, 7,10)//x轴的划分
    y_ = -(perceptron.w[0]*x_points + perceptron.b)/perceptron.w[1]
    plt.plot(x_points, y_)//绘制模型图像(数据、颜色、图例等信息)
    plt.plot(data[:50, 0], data[:50, 1], 'bo', color='blue', label='0')
    plt.plot(data[50:100, 0], data[50:100, 1], 'bo', color='orange', label='1')
    plt.xlabel('sepal length')
    plt.ylabel('sepal width')
    plt.legend()
    

    (11)、

    from sklearn.linear_model import Perceptron//定义感知机(下面将使用感知机)
    

    (12)、

    clf = Perceptron(fit_intercept=False, max_iter=1000, shuffle=False)
    clf.fit(X, y)//使用训练数据拟合
    

    (13)、

    %# Weights assigned to the features.
    print(clf.coef_)//输出感知机模型参数
    

    (14)、

    %# 截距 Constants in decision function.
    print(clf.intercept_)//输出感知机模型参数
    

    (15)、

    x_ponits = np.arange(4, 8)//确定x轴和y轴的值
    y_ = -(clf.coef_[0][0]*x_ponits + clf.intercept_)/clf.coef_[0][1]
    plt.plot(x_ponits, y_)//确定拟合的图像的具体信息(数据点,线,大小,粗细颜色等内容)
    plt.plot(data[:50, 0], data[:50, 1], 'bo', color='blue', label='0')
    plt.plot(data[50:100, 0], data[50:100, 1], 'bo', color='orange', label='1')
    plt.xlabel('sepal length')
    plt.ylabel('sepal width')
    plt.legend()
    

    实验结果截图

    五.实验小结

    (1)psp表格

    psp2.1 任务内容 计划完成需要的时间(min) 实际完成需要的时间(min)
    Planning 计划 100 80
    Development 开发 200 250
    Analysis 需求分析(包括学习新技术) 20 40
    Design Spec 生成设计文档 30 50
    Design Review 设计复审 5 10
    Coding Standard 代码规范 3 5
    Design 具体设计 10 12
    Coding 具体编码 80 90
    Code Review 代码复审 60 70
    Test 测试(自我测试,修改代码,提交修改) 10 15
    Reporting 报告 9 6
    Test Report 测试报告 3 2
    Size Measurement 计算工作量 3 2
    Postmortem & Process Improvement Plan 事后总结,并提出过程改进计划 5 3

    (2)心得和经验

    了解、学到了很多知识,通过查阅书本、网上资料来理解实验代码。通过编译得到结果,实践与理论相结合。

  • 相关阅读:
    sql优化的几种方法
    webService使用
    Springboot 项目pom.xml 配置文件以及启动类的一些配置
    WebSocket消息推送(群发和指定到个人)
    有n级台阶,每次爬1或者2级台阶,用程序计算有多少种爬法
    对两个字符串进行比较,取出两个字符串中一样部分的长度
    java 日志 log4j
    进制转换
    java 调用第三方动态链接库
    如何使用 OpenFileDialog 组件
  • 原文地址:https://www.cnblogs.com/sunxianlan/p/14749917.html
Copyright © 2020-2023  润新知