斯坦福大学公开课-吴恩达-机器学习-第一节引言

斯坦福大学公开课-吴恩达-机器学习-第一节引言
引言

1.1欢迎

1.1.1应用
- 数据挖掘
- 医疗应用
- 计算生物学
- 手写识别
- 自然语言处理
- 计算机视觉
1.2机器学习是什么？

1.2.1定义
- Arthur Samuel：在进行特定编程的情况下，给予计算机学习能力的领域
- Tom Mitchell：一个程序被认为能从经验E中学习，解决任务T，达到性能度量值P，当且仅当，有了经验E后，经过P评判，程序在处理T时的性能有所提升
  - 例1：经验E就是程序上万次的自我练习的经验，而任务T就是下棋，性能度量值P呢，就是它在与一些新的对手比赛时，赢得比赛的概率
1.2.2学习算法
- 无监督学习:编程人员将教计算机如何去完成任务
- 监督学习:计算机自己进行学习，完成任务
- 其他：
  - 强化学习
  - 推荐系统
1.3监督学习

1.3.1定义
- 基本思想是，数据集中的每个样本都有相应的“正确答案”，算法依据这些样本做出预测。
1.3.2使用
- 每当想要根据给定输入，预测某个结果时，并且还有输入-输出对的示例时，都应该使用监督学习
1.3.3类别
- 回归:其目标预测一个连续值，推测一系列连续值属性
  - 例1:根据教育水平、年龄和居住地来预测一个人的年收入，预测的结果是一个金额数值
  - 例2:根据房子面积预测房价
- 分类:预测分类标签，这些标签来自预定义的可选列表，推出一组离散的结果
  - 例1:邮件系统，对垃圾邮件的识别
  - 例2:根据肿瘤的属性来对肿瘤进行分类，判断良性或者恶性
1.3.4几个小概念
- 泛化:如果一个模型能够对没见过的数据做出准确预测，我们就说它能够从训练集泛化到测试集，我们的目的是要构建一个泛化精度尽量高的模型
- 过拟合:过分关注训练集的细节，得到了一个在训练集上表现很好，但不能泛化到新数据上的模型，那么就存在过拟合现象
- 欠拟合：模型过于简单，可能无法抓住数据的全部内容以及数据中的变化。甚至可能模型在训练集上的表现也很差
1.3.5小测验

1.4无监督学习

1.4.1定义
- 没有提前告知算法一些信息，数据中没有任何的标签或者是相同的标签或者就是没标签，在数据集中找到某种结构，找到数据之间的关系
- 它是学习策略，交给算法大量的数据，并让算法为我们从数据中找出某种结构
1.4.2例子
- 新闻中的新闻分组，组成有关联的新闻
- DNA微观数据的分析，把个体聚类到不同的类或者不同类型的组
- 计算机集群协同工作，分组成更高效的组
- 社交网络的分析，自动给出朋友的分组
- 天文数据的分析
- 鸡尾酒问题，分离出声音
参考-黄海广博士
相关阅读:
Auto Generate Reflection Information for C++
面向嵌入式的JavaScript引擎
 如何在unity3d的UGUI中给Text添加材质和艺术字
 获取Unity GLES版本
 PBR原理
 Unity双开
 Unity Shader各种效果
 Redis是什么
 其他地方拷贝过来的VS项目一直报错不能启动IIS
IIS部署PHP项目并与mysql完美结合
原文地址：https://www.cnblogs.com/fangzhiyou/p/12544723.html

斯坦福大学公开课-吴恩达-机器学习-第一节 引言

引言

1.1欢迎

1.1.1应用

1.2机器学习是什么？

1.2.1定义

1.2.2学习算法

1.3监督学习

1.3.1定义

1.3.2使用

1.3.3类别

1.3.4几个小概念

1.3.5小测验

1.4无监督学习

1.4.1定义

1.4.2例子

斯坦福大学公开课-吴恩达-机器学习-第一节引言