• 机器学习第一讲


    机器学习课程包括四个部分:

    第一:监督式学习(supervised learning),有两种类型:回归和分类。采集了某地区的房屋价格和面积的一组数据,然后推测此地区面积为100平的房子个价格应该是多少?这就属于回归型监督式学习算法。然后另外一个根据肿块的大小,预测肿瘤是良性还是恶性,0表示恶性,1表示良性,这种问题就属于分类型监督式学习算法。分类(classification),对于一个classifier来说,就是告诉它”这个数据属于XX类“,然后classifier会在提供的训练集中"学习",然后具有对某个未知数据分类的能力,这种提供提供训练数据的过程称为监督式学习。监督式学习是已有正确答案。

    第二:学习理论(learning theory)

    第三:无监督学习(unsupervised learning)。聚类(clustering),就是把相似的东西集中到一起,聚类的时候,我们不关心某一类是什么,我们的目标是将相似的类聚在一起,因此一个聚类算法只需要知道如何计算相似度就可以开始了,并不提供训练数据,我们称这种为无监督学习。无监督式学习适合不知道正确答案的情况下,发现数据集的结构性。例如录音机录制了两个人一起说话的声音,无监督学习可以将两个声音分别提取出来。无监督学习还可以用于文本处理。

    第四:强化学习(reinforcement learning):被用在不必进行一次决策的情形之中,强化学习通常是在一段时间之内作出一系列的决策。在强化学习中有一个回报函数的概念。然后需要定义好的行为和坏的行为,肯定好的行为,程序会不断学习实现好的行为,以此获得好的回报。

    就像你说蹲下,旺财立即蹲下的时候你会说,”good dog“,否则,”bad dog“。旺财想听到夸奖,所以它会学习在你说出蹲下的时候立马蹲下。同样的对于采用了强化学习的直升机来说,当其摔下时,触发的坏的行为,它就会学习下次不再摔下,以此获得好的回报。

    强化学习经常用在机器人领域。

  • 相关阅读:
    ubuntu服务器全部署
    果蝇优化算法(FOA)
    小波神经网络(WNN)
    R语言预测实战(第二章--预测方法论)
    ARIMA模型--粒子群优化算法(PSO)和遗传算法(GA)
    R语言预测实战(第一章)
    卷积神经网络(CNN)
    RSS(简易信息聚合)和jieba(第三方分词组件)
    第四章--基于概率论的分类方法:朴素贝叶斯--新闻分类(三)
    第四章--基于概率论的分类方法:朴素贝叶斯--过滤垃圾邮件(二)
  • 原文地址:https://www.cnblogs.com/lz3018/p/4579787.html
Copyright © 2020-2023  润新知