数据集之转换器以及估计器

数据集的结构：特征值+目标值（有些可以没有目标值）

数据集：uci kaggle

数据处理工具：pandas sklearn

缺失值重复值不需要处理

转换器是一类实现了特征工程的API：

估计器是一类实现了算法的API：

测试代码：

from sklearn.preprocessing import StandardScaler
# 转换器以及估计器
s = StandardScaler()
data = s.fit_transform([[1, 2, 3], [4, 5, 6]])
print(data)

ss = StandardScaler()
print(ss.fit([[1, 2, 3], [4, 5, 6]]))
print(ss.transform([[1, 2, 3], [4, 5, 6]]))

print(ss.fit([[2, 3, 4], [4, 5, 7]]))
print(ss.transform([[1, 2, 3], [4, 5, 6]]))

运行结果：

相关阅读:
vue----计算与监听属性
vue---条件与循环语句
vue--模板语法
git版本控制系统--介绍
HttpWebRequest使用总结
计算机专业的书普遍都这么贵，你们都是怎么获取资源的？
130 个相见恨晚的超实用网站，一次性分享出来
实现客户端与服务端的HTTP通讯
默认网关（地址）
.NET Reactor使用教程（加密源代码示例）

原文地址：https://www.cnblogs.com/shixinzei/p/10170899.html