• 标准化


    可以用StandardScaler函数进行标准化,好处是可以保存训练集中的参数(均值、方差)直接使用其对象转换测试集数据

    import numpy as np
    import pandas as pd
    import xlrd 
    from sklearn import preprocessing
    from pandas import DataFrame
    def standardScaler(path):
        table = xlrd.open_workbook(path).sheets()[0]#获取第一个sheet表
        row = table.nrows  # 行数
        col = table.ncols  # 列数
        datamatrix = np.zeros((row, col))#生成一个nrows行ncols列,且元素均为0的初始矩阵
        for x in range(col):
            cols = np.matrix(table.col_values(x))  # 把list转换为矩阵进行矩阵操作
            datamatrix[:, x] = cols # 按列把数据存进矩阵中
        #标准化
        scaler=preprocessing.StandardScaler().fit(datamatrix)
        return (scaler.transform(datamatrix))
        #返回的就是标准化好的矩阵了
    path = r'c:UsersLiugengxinDesktop	est.xlsx'
    data = standardScaler(path) #标准化好的矩阵存在了data中
    DataFrame(data).to_excel(r'c:UsersLiugengxinDesktop	est_end.xlsx')#写入test_end中

     

  • 相关阅读:
    display ntp-service sessions
    display ntp-service status
    MySQL与telnet安装
    YL_组播_IGMPv2-v3
    YL_组播_PIM-DM协议原理
    YL_组播_IGMP协议原理
    IIS发布站点问题
    css 定位及遮罩层小技巧
    MYSQL查询某字段中以逗号分隔的字符串的方法
    零度
  • 原文地址:https://www.cnblogs.com/Liu269393/p/10259128.html
Copyright © 2020-2023  润新知