一. 欢迎参加《机器学习》课程
机器学习的应用:
1.数据挖掘:更好的理解用户
2.无法用编写程序解决:自动驾驶
3.个性化推荐
4.AI:像人类一样学习
二. 什么是机器学习?
机器学习定义:
Arthur Samuel对机器学习的定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域(有些陈旧,不正式)
Tom Mitchell:计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高
机器学习算法分类:
1. 监督学习:我们教计算机做某件事情
2. 无监督学习:我们让计算机自己学习
3. 强化学习:
4. 推荐系统:
三. 监督学习(supervised learning):
监督学习是指 我们给算法一个数据集,其中包含了正确答案。也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格即这个房子实际卖价,算法的目的就是给出更多的正确答案,例如为你朋友想要卖掉的这所新房子给出估价。
回归问题:结果是线性的(我们设法预测出一个连续值的结果)
分类问题:结果是离散的(我们设法预测出一个离散值的结果)
四. 无监督学习(unsupervised learning):
1. 聚类算法:针对数据集,无监督学习算法可能判定该数据集包含两个不同的聚集簇。这是一个,那是另一个,二者不同。是的,无监督学习算法可能会把这些数据分成两个不同的簇。
聚类和分类的区别:
分类:已知数据的类型,即在没有输入的时候,就知道输出的结果(如:肿瘤良性还是恶性)。
聚类:不知道数据的类型,只给数据一些特征,机器根据特征,将数据分开。
2. ‘鸡尾酒会算法’:使用无监督学习实现语音分离