• 斯坦福大学公开课-吴恩达-机器学习-第一节 引言


    引言


    1.1欢迎


    1.1.1应用

    • 数据挖掘
    • 医疗应用
    • 计算生物学
    • 手写识别
    • 自然语言处理
    • 计算机视觉

    1.2机器学习是什么?


    1.2.1定义

    • Arthur Samuel:在进行特定编程的情况下,给予计算机学习能力的领域
    • Tom Mitchell:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升
      • 例1经验E就是程序上万次的自我练习的经验,而任务T就是下棋,性能度量值P呢,就是它在与一些新的对手比赛时,赢得比赛的概率

    1.2.2学习算法

    • 无监督学习:编程人员将教计算机如何去完成任务
    • 监督学习:计算机自己进行学习,完成任务
    • 其他:
      • 强化学习
      • 推荐系统

    1.3监督学习


    1.3.1定义

    • 基本思想是,数据集中的每个样本都有相应的“正确答案”,算法依据这些样本做出预测。

    1.3.2使用

    • 每当想要根据给定输入,预测某个结果时,并且还有输入-输出对的示例时,都应该使用监督学习

    1.3.3类别

    • 回归:其目标预测一个连续值,推测一系列连续值属性
      • 例1:根据教育水平、年龄和居住地来预测一个人的年收入,预测的结果是一个金额数值
      • 例2:根据房子面积预测房价
    • 分类:预测分类标签,这些标签来自预定义的可选列表,推出一组离散的结果
      • 例1:邮件系统,对垃圾邮件的识别
      • 例2:根据肿瘤的属性来对肿瘤进行分类,判断良性或者恶性

    1.3.4几个小概念

    • 泛化:如果一个模型能够对没见过的数据做出准确预测,我们就说它能够从训练集泛化到测试集,我们的目的是要构建一个泛化精度尽量高的模型
    • 过拟合:过分关注训练集的细节,得到了一个在训练集上表现很好,但不能泛化到新数据上的模型,那么就存在过拟合现象
    • 欠拟合:模型过于简单,可能无法抓住数据的全部内容以及数据中的变化。甚至可能模型在训练集上的表现也很差

    1.3.5小测验


    1.4无监督学习


    1.4.1定义

    • 没有提前告知算法一些信息,数据中没有任何的标签或者是相同的标签或者就是没标签,在数据集中找到某种结构,找到数据之间的关系
    • 它是学习策略,交给算法大量的数据,并让算法为我们从数据中找出某种结构

    1.4.2例子

    • 新闻中的新闻分组,组成有关联的新闻
    • DNA微观数据的分析,把个体聚类到不同的类或者不同类型的组
    • 计算机集群协同工作,分组成更高效的组
    • 社交网络的分析,自动给出朋友的分组
    • 天文数据的分析
    • 鸡尾酒问题,分离出声音

    参考-黄海广博士

  • 相关阅读:
    Auto Generate Reflection Information for C++
    面向嵌入式的JavaScript引擎
    如何在unity3d的UGUI中给Text添加材质和艺术字
    获取Unity GLES版本
    PBR原理
    Unity双开
    Unity Shader各种效果
    Redis是什么
    其他地方拷贝过来的VS项目一直报错不能启动IIS
    IIS部署PHP项目并与mysql完美结合
  • 原文地址:https://www.cnblogs.com/fangzhiyou/p/12544723.html
Copyright © 2020-2023  润新知