• 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 1_Introduction and Basic Concepts 介绍和基本概念


    目录

    1.1 欢迎
    1.2 机器学习是什么

    1.2.1 机器学习定义

    1.2.2 机器学习算法

      - Supervised learning 监督学习

      - Unsupervised learning  无监督学习

      - Reinforcement learning 强化学习

      - Recommender systems 推荐系统

    1.2.3 课程目的

                如何在构建机器学习系统时,选择最好的实践类型决策、节省时间。
      1.3 监督学习

         1.3.1 Regression 回归问题

         1.3.2 Classification 分类问题

            1.3.3 回归和分类
      1.4 无监督学习

         1.4.1 聚类算法 Clustering algorithm

     1.2  机器学习是什么

       参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv

    1.2.1  机器学习定义

    • Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.  机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。

    Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.     卡内基梅隆大学Tom 定义:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P, 当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。

     

      例题,以垃圾邮件监测为例,解释Tom 定义中字母的对应

    1.2.2  机器学习算法

    1、常用:

      Supervised Learning 监督学习:学习数据带有标签

        Unsupervised Learning 无监督学习没有任何的标签,或者有相同的标签。已知数据集,不知如何处理,也未告知每个数据点是什么。

     

           (右侧的例子,无监督学习将数据划分为两个集合,也就是聚类clustering algorithm)

    2、其他:

        Reinforcement learning 强化学习, recommender systems 推荐系统

    1.2.3  课程目的

      If you actually tried to develop a machine learning system, how to make those best practices type decisions about the way in which you build your system. 如何在构建机器学习系统的时候选择最好的实践类型决策,节省时间。

    1.3 监督学习

    参考视频: 1- 3- Supervised Learning (12 min).mkv

    1.3.1  Regression回归问题:预测结果是连续的输出值

       在历史房价数据的基础上,预测房屋价格。可以使用直线拟合(粉色),也可以使用二次曲线拟合(蓝色)。

        

         监督学习:基于已有的正确结果。           回归问题:预测连续的输出值

    1.3.2  Classification分类问题:预测结果是离散的多个值

       

    下图是基于两个特征(两个维度)进行预测的例子, 右边是其他可能维度(维度可能有无穷多个)

    1.3.3  区分 “分类问题”和“回归问题”

        例题:

     

    1.4 无监督学习

      参考视频: 1 - 4 - Unsupervised Learning (14 min).mkv

     1.4.1  聚类算法clustering algorithm 在现实生活中的应用

      1、Google News 每天将爬来的网址分为一个个的新闻专题。

      2、基因信息分组。

        

    3、组织大型计算机集群。 社交网络的分析。市场分割。天文数据分析

        

      4、鸡尾酒party问题,将混在一起的多个音频源拆开。

    通过这个例子,特别强调了Octave和MATLAB这些软件的简洁之处,这个算法的实现在Octave里只需要一行代码

    [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

  • 相关阅读:
    SERVER2008下安装SQL SERVER 2005出现IIS功能要求 警告解决方案
    转:Windows Server 2008 IIS 7.0 图文安装详解
    (转)程序集System.Web.DataVisualization无法加载的解决方法
    C++ Primer Plus 读书笔记(第1, 2章)
    寒假就这样来了
    C++ Primer Plus 读书笔记(第8、9章)
    C++ Primer Plus 读书笔记(第6、7章)
    POJ1947 Rebuilding Roads 树形DP
    C++ Primer Plus 读书笔记(第4、5章)
    POJ2754 Similarity of necklaces 2 区间取下界操作+DP
  • 原文地址:https://www.cnblogs.com/maxiaodoubao/p/9856694.html
Copyright © 2020-2023  润新知