• 机器学习的基本概念


    学习过程:

    发现新模式 -> 应用、泛化 -> 约束、修正 -> 固定模式

     

    人工智能大师H.A.Simon的观点:

    “学习”就是系统在不断重复的工作中对本身能力的增强或改进,结果是系统在下一次执行同样任务或类似任务时,比现在做得更好或效率更高。简而言之,“学习”指系统改进其性能的任何过程。

     

    机器学习系统:

    给定某类任务T、与T相关的性能P和经验E,计算机程序从经验E中学习,用学习的结果改善性能P,从而实现自我完善,则称该程序具有学习能力。

    影响学习系统设计的最重要因素是环境向系统提供的信息,即学习模型中的E

     

    机器学习方法分类:

    1.监督学习:利用有类别标识的训练样本集合和选定的模型来确定分类器的过程。

    对训练样本集中的每个样本都能提供其真实输出,有时还提供预测错误的代价。可以利用真实输出来评价学习结果的优劣。

    经典的学习算法有决策树、人工神经网络、贝叶斯网络、支持向量机等。

    监督学习可以用于分类问题和回归问题。

    监督学习系统通常涉及如下几个步骤:数据采集、属性选择和提取、模型选择、监督训练、分类器评价。

    在属性选择和提取过程中,我们总是希望发现那些容易提取,对不相关变形保持不变,对噪声不敏感,以及对区分不同类别的样本很有效的属性集。

     

    2.非监督学习:训练数据中没有样本的输出标识,是没有先验知识的学习,仅凭数据的自然聚类特性,进行“盲目”学习。

    非监督学习可以作为后续学习的预处理过程,也可以用于机器预测或决策。最常用的非监督学习室聚类分析。

    对于分类问题而言,监督法是先学习后分类;非监督法既可以先学习再分类,也可以边学习边分类。非监督学习与监督学习都是以样本的属性值作为学习的基础,学习算法也存在一些共性。

    有监督学习具有分类精细、准确的优点,但学习过程慢。无监督学习具有算法简练、学习速度快的优点,但学习准确率低。

     

    3.强化学习:以环境反馈为输入的、特殊的适应环境的机械式学习方法。又称再励学习或评价学习,它是从动物学习、自适应控制等理论发展而来的。

    强化学习过程是不断尝试错误,从环境中得到相应的奖惩,通过自主学习获得不同状态下哪些动作具有最大的价值,从而发现或逼近能够得到最大奖励的动作策略。可以说,强化学习类似于传统经验中的“吃一堑,长一智”。

    强化学习的目标就是寻找一个最优动作序列,使得运动中所获得的累积奖赏值最大。

     

  • 相关阅读:
    开发软件设计模型 visual studio UML
    to debug asp.net mvc4
    BeeFramework
    .net entity framework 泛型 更新与增加记录
    javascript debut trick, using the throw to make a interrupt(breakpoint) in your program
    C# dynamic
    webapi
    C# async / await
    NYoj 613 免费馅饼
    洛谷P1056:排座椅(贪心)
  • 原文地址:https://www.cnblogs.com/Acceptyly/p/3552732.html
Copyright © 2020-2023  润新知