• 机器学习1——概念入门


    一、人工智能、机器学习、深度学习各个名词之间的关系

    二、机器学习  

    机器学习是人工智能最重要的内容,先来看看它的一个定义(当然有很多不同的定义): “Machine learning is the idea that there are generic algorithms that can tell you something interesting about a set of data without you having to write any custom code specific to the problem. Instead of writing code, you feed data to the generic algorithm and it builds its own logic based on the data.” 这里面有几个重要的关键词,就是你不用写专门的业务逻辑代码而是通过输入大量的数据给机器,由机器通过一个通用的机制来建立它自己的业务逻辑,也就是机器“自我学习”了业务的逻辑,当然这种学习后的逻辑可以用来处理新的数据。这和人类的学习过程有些类似,如下图:

    三、有监督学习和无监督学习

    这两个概念也是刚刚接触机器学习经常碰到的概念,通俗/简单点来说,所谓有监督学习就是训练用历史数据是既有问题又有答案,而无监督学习就是训练用历史数据是只有问题没有答案。

    正式的说法一般是把答案称之为标签label 还有一种介于两者之间的混合学习方法,称为半监督学习。

    无监督学习中,主要是发现数据中未知的结构或者是趋势。虽然原数据不含任何的标签,但我们希望可以对数据进行整合(分组或者聚类),或是简化数据(降维、移除不必要的变量或者检测异常值)。

    因此无监督算法主要的分类包含: - 聚类算法 (代表:K均值聚类,系统聚类) - 降维算法 (代表:主成份分析PCA,线性判断分析LDA);

    有监督学习,可以根据预测变量的类型再细分。如果预测变量是连续的,那这就属于回归问题

    而如果预测变量是独立类别(定性或是定类的离散值),那这就属于分类问题了

    因此有监督学习主要的分类包含:

    - 回归算法 (线性回归,最小二乘回归,LOESS局部回归,神经网路,深度学习)

    - 分类算法(决策树,支持向量机,贝叶斯,K-近邻算法,逻辑回归,随机森林)

     这些所有的算法中,目前最热的恐怕是深度学习了,但要了解深度学习必须先了解它的前任(前生,父类)神经网络。

    关于监督学习和无监督学习的概念有个例子可以用来解释

    比如我们在教孩子认知世界时,会拿出一些关于鸟、鱼、飞机和轮船等的图片告诉他(她)们这些分别是什么,等他(她)们以后再次见到时则能准确地认出,这就叫监督学习

    无监督学习,则是我们并不会告知孩子们这些图片分别是什么,而是由他(她)们自己认知这些图片。

    他(她)们中或许有的将鸟和飞机归为一类,将鱼和轮船归为一类,因为这分别代表了天上飞的和水中游的;又或许有的能将鸟、鱼、飞机、轮船等分别归为一类;但是,他(她)们都不知道这些分别是什么。

    对于孩子而言,这些鸟、鱼、飞机和轮船等的图片相当于数据,我们告诉孩子们这些图片分别是什么则相当于对这些数据打上了标签。

    监督学习就是通过这些打上标签的数据去训练得到一个最优模型,而无监督学习则是仅仅利用这些数据而不利用标签去训练得到一个最优模型最后它们再利用这个模型对未来的数据进行一个判断输出,达到认知能力。  

    不难看出,在监督学习情况下,计算机学习到的模型性能更优(泛化能力更强)。但是,在大数据时代对海量数据都打上标签是不太现实的。例如,如今我们能轻易地收集到几十万或上百万张关于

    鸟、鱼、飞机和轮船等的图片,但要对每一张图片都打上标签的代价非常高,是一项耗时耗力的工作。

    在大数据时代,更多的情况则是海量未带标签数据伴随着少量带标签数据存在于人们的现实生产生活中。  

    半监督学习(Semi-SupervisedLearning)就是为解决上述问题所产生的,其目的在于利用海量未带标签数据辅助少量带标签数据进行学习训练,以增强计算机的学习能力。

    监督学习的目标往往是让计算机去学习我们已经创建好的分类系统(模型)。

    非监督学习目标不是告诉计算机怎么做,而是让它(计算机)自己去学习怎样做事情。

    四、神经网络

    ===================================================

    相关参考链接:

    这可能是最简单易懂的机器学习入门(小白必读):https://blog.csdn.net/qq_28168421/article/details/81351321

    我的AI进坑之路---深度学习和机器学习的一些基本概念:https://blog.csdn.net/qq_20073741/article/details/82228579

    一文读懂人工智能、机器学习、神经网络及深度学习关系:http://m.elecfans.com/article/673148.html

    一文读懂数据科学、机器学习和AI区别在哪里?:https://blog.csdn.net/dev_csdn/article/details/79127658

    机器学习系列(一)——机器学习简介:https://blog.csdn.net/hohaizx/article/details/80584307

  • 相关阅读:
    JVM 关于对象分配在堆、栈、TLAB的理解
    分布式唯一 ID 生成方案有哪些?
    JVM 栈帧之操作数栈与局部变量表 转
    C# TreeHelper帮助类
    Java:Top K问题的解法
    C#单例模式
    C#分组方式比较
    Vue实现登录
    git使用总结
    js实现无色彩球
  • 原文地址:https://www.cnblogs.com/grooovvve/p/10686777.html
Copyright © 2020-2023  润新知