• 数据预处理--标准化/归一化


    1. fit--transform--fit_transform区别

    • fit原义指的是使适合的意思,其实有点train的含义但是和train不同的是,它并不是一个训练的过程,而是一个适配的过程,过程都是定死的,最后只是得到了一个统一的转换的规则模型
    • transform:是将数据进行转换,比如数据的归一化和标准化,将测试数据按照训练数据同样的模型进行转换,得到特征向量。
    • fit_transform:可以看做是fit和transform的结合,如果训练阶段使用fit_transform,则在测试阶段只需要对测试样本进行transform就行了。

    2. 标准化归一化

    from sklearn import preprocessing
    #标准化
    std_scale = preprocessing.StandardScaler().fit(df[['Alcohol', 'Malic acid']])
    df_std = std_scale.transform(df[['Alcohol', 'Malic acid']])
    #归一化
    minmax_scale = preprocessing.MinMaxScaler().fit(df[['Alcohol', 'Malic acid']])
    df_minmax = minmax_scale.transform(df[['Alcohol', 'Malic acid']])
    
    #结果输出
    print('Mean after standardization:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_std[:,0].mean(), df_std[:,1].mean()))
    print('
    Standard deviation after standardization:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_std[:,0].std(), df_std[:,1].std()))
    print('Min-value after min-max scaling:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_minmax[:,0].min(), df_minmax[:,1].min()))
    print('
    Max-value after min-max scaling:
    Alcohol={:.2f}, Malic acid={:.2f}'
          .format(df_minmax[:,0].max(), df_minmax[:,1].max()))

  • 相关阅读:
    实验二
    个人简介及对未来的想法
    读《构建之法》心得体会
    作业2
    个人简介
    第六次作业
    第二次作业
    个人简历
    购物系统测试缺陷报告
    读《构建之法》心得体会
  • 原文地址:https://www.cnblogs.com/itbuyixiaogong/p/9848435.html
Copyright © 2020-2023  润新知