• 机器学习——01、机器学习的数学基础1 数学分析


    机器学习与数学分析

    机器学习概述

    什么是机器学习

    1.对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T和经验E;随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。

    2.这里最重要的是机器学习的对象:
    (1)、任务Task.T,一个或者多个。
    (2)、经验Experience.E。
    (3)、性能Performance.P。

    3.随着任务的不断执行,经验的累积会带来计算机性能的提升。

    简易表述

    机器学习是人工智能的一个分支。
    我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习。
    随着训练次数的增加,该系统可以在性能上不断学习和改进。
    通过参数优化的学习模型,能够用于预测相关问题的输出。

    思考:如何设计无人驾驶机动车?

    无人驾驶汽车

    汽车的无人驾驶模块已经成熟:全自动公共交通工具已经出现在了世界上的多个城市。

    问题:如何设计自动驾驶系统?

    人类的学习

    1.如何从完全“无知”到掌握知识

    2.有监督学习

    3.无监督学习

    4.增强学习

    机器学习的内涵与外延

    机器学习可以解决什么

    给定数据的预测问题:
    1.数据清洗/特征选择
    2.确定算法模型/参数优化
    3.结果预测
    ……

    不能解决什么

    大数据存储/并行计算
    做一个机器人
    ……
    在这里插入图片描述

    机器学习的一般流程

    数据收集——>数据清洗——>特征工程——>数据建模

    机器学习方法

    different assumption on data
    different scalability profiles at training time
    different latencies at prediction time
    different model sizes (embedability in mobile devices)

    思考:机器如何发现新词

    频数:Count(X)
    凝固程度

    X=A.B
    P(A)P(B) VS P(X)

    自由程度

    aXb
    信息熵H(a)、H(b)

    凝固程度和自由程度缺一不可,还需要调参。

    问题:给定某长文本,如何利用上述参数设计可行算法?

    机器学习的角度看数学

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    理解HMM框架

    在这里插入图片描述

    概率计算问题

    1.给定模型在这里插入图片描述和观测序列O={o1,o2,……ot},计算模型λ下观测序列O出现的概率P(O|λ)
    2.前向-后向算法——动态规划。

    学习问题

    1.已知观测序列O={o1,o2,……ot},估计模型在这里插入图片描述的参数,使得在该模型下观测序列P(O|λ)最大。
    2.最大似然估计(给定状态序列),Baum-Welch算法(状态序列未知)——EM算法。

    预测问题

    1.即解码问题:已知模型在这里插入图片描述和观测序列O={o1,o2,……ot},求对给定观测序列条件概率P(O|λ)最大的状态序列I。
    2.Viterbi算法——动态规划。

    数学分析

    在这里插入图片描述

    问题分析

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    导数与梯度

    导数

    1.简单的说,导数就是曲线的斜率,是曲线变化快慢的反应。

    2.二阶导数是斜率变化快慢的反应,表征曲线的凸凹性。二阶导数连续的曲线,往往称之为“光顺”的。

    3.根据在这里插入图片描述可以得到函数f(x)=ln x的导数,进一步根据换底公式、反函数求导等,得到其它初等函数的导数。

    常用函数的导数

    在这里插入图片描述

    方向导数

    在这里插入图片描述

    梯度

    在这里插入图片描述

    积分应用

    在这里插入图片描述
    在这里插入图片描述

    Taylor展式的应用

    在这里插入图片描述
    在这里插入图片描述

    Taylor公式的应用

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    概率论基础

    概率论

    在这里插入图片描述

    古典概型

    在这里插入图片描述

    解:

    在这里插入图片描述
    在这里插入图片描述

    概率公式

    在这里插入图片描述

    频率学派与贝叶斯学派

    在这里插入图片描述
    在这里插入图片描述

    贝叶斯公式

    在这里插入图片描述
    在这里插入图片描述

    常见概率分布

    两点分布

    在这里插入图片描述

    二项分布 Bernoulli distribution

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    考察Taylor展式

    在这里插入图片描述

    泊松分布

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    均匀分布

    在这里插入图片描述

    指数分布

    在这里插入图片描述
    在这里插入图片描述

    指数分布的无记忆性

    在这里插入图片描述

    正态分布

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    二元正态分布

    在这里插入图片描述

    总结

    在这里插入图片描述

    Sigmoid/Logistic函数的引入

    在这里插入图片描述

    Sigmoid函数的导数

    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    修复PLSQL Developer 与 Office 2010的集成导出Excel 功能
    Using svn in CLI with Batch
    mysql 备份数据库 mysqldump
    Red Hat 5.8 CentOS 6.5 共用 输入法
    HP 4411s Install Red Hat Enterprise Linux 5.8) Wireless Driver
    变更RHEL(Red Hat Enterprise Linux 5.8)更新源使之自动更新
    RedHat 5.6 问题简记
    Weblogic 9.2和10.3 改密码 一站完成
    ExtJS Tab里放Grid高度自适应问题,官方Perfect方案。
    文件和目录之utime函数
  • 原文地址:https://www.cnblogs.com/AlexKing007/p/12339365.html
Copyright © 2020-2023  润新知