• 第二节 数值型特征进行归一化或标准化处理


    数值型特征处理:通过特定的统计方法将数据转换成算法要求的数据,归一化和标准化

    # 归一化的计算公式决定了其对异常值很敏感,一旦出现异常值会导致鲁棒性较差,所以归一化只适合传统精确小数据场景
    from sklearn.preprocessing import MinMaxScaler
    
    def mm():
        # feature_range指定归一化后的数据范围,不指定就是0-1之间
        mm = MinMaxScaler(feature_range=(2, 3))
    
        # fit_transform接收数组
        data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])
    
        print(data)
    
    
    if __name__ == "__main__":
        mm()

     

    # 标准化也是用来去除均数、离散程度量纲差异太大的影响,但是标准化对离群值的影响无能为力
    from sklearn.preprocessing import StandardScaler
    
    def stand():
        std = StandardScaler()
    
        # fit_transform接收数组
        data = std.fit_transform([[1, -1, 3], [2, 4, 2], [4, 6, -1]])
    
        print(data)
    
    
    if __name__ == "__main__":
        stand()
  • 相关阅读:
    JAVA 高级特性 JDBC
    C3P0 连接池
    JAVA WEB Servlet
    JAVAWEB JSP
    sed 命令
    shell 简单脚本编程
    从首页问答标题到问答详情页
    首页列表显示全部问答,完成问答详情页布局
    制作首页的显示列表
    发布功能完成
  • 原文地址:https://www.cnblogs.com/kogmaw/p/12566209.html
Copyright © 2020-2023  润新知