本文对应《机器学习实战》第一章的笔记
今天看见字如面里面王小波写给李银河的信里有这么的话:
有很多的人,在从少年踏入成人的时候差了一步,于是生活中美好的一面就和他们永别了,真是可惜;在所有的好书中写得明明白白的东西,在人步入卑贱的时候就永远看不懂,永远误解了,真是可惜;在人世间,有一种庸俗势力的大合唱,谁一旦对他屈服,就永远沉沦了,真是可惜;有无数为人师表的先生们,在按照他们自己的模样塑造别人,真是可惜;有很多很多中国人活在世上什么也不干,只是在周围逡巡,发现了什么就一拥而上。
---这一切与我格格不入 王小波
数据类型
标称型和数值型
非均衡分类问题
一旦训练样本某个分类的数据多于其他分类的数据,就会出现非均衡分类问题。
有监督学习
分类和回归
无监督学习:
聚类 数据集合分成由类似的对象组成的多个类的过程
密度估计 寻找描述数据统计值的过程
开发机器学习应用程序步骤:
①收集数据
②准备输入数据
③分析输入数据
④训练算法
⑤测试算法
⑥使用算法
python现有库
Numpy、Scipy 向量矩阵操作
Matploitlib 绘制2D、3D图形
Pylab 集成Numpy、Scipy、Matploitlib
>>> from numpy import *
>>> random.rand(4,4) # 构造一个4*4的随机数组
# NumPy有两种数据类型 矩阵matrix和数组array
>>> randMat = mat(random.rand(4,4)) # mat()将数组转化为矩阵
>>> randMat.I # 矩阵求逆
>>> eye(n) # n阶单位矩阵