• 高斯过程简单理解


     

    机器学习&数据挖掘笔记_10(高斯过程简单理解)

     

      前言:

      GP(高斯过程)是一种自然界中普遍存在且重要的随机过程,也叫正态随机过程,在ML等领域应用比较广泛。本次实验目的是简单理解下GP,特别是要体验到GP的一个sample不再是一个普通的点,而是一个函数。实验部分完成了常见的GP的一维和二维sample的显示,常见的GP有线性GP,布朗运动,指数GP,Ornstein-Uhlenbeck过程,对称和周期性的GP。参考资料全为视频http://www.youtube.com/playlist?list=PLD0Z06AA0D2E8ZZBA中相关的部分。

      实验基础:

      首先来看看GP的定义:

       

      GP是高斯函数的概率分布,给定S集合中的任意个自变量Si, Sj ,… Sk, 满足z(Si), z(Sj), …,z(Sk)是高斯随机变量,且z(Si), z(Sj), …,z(Sk)是多维高斯函数(可以有任意多个),记为Z,此时称随机变量集合z(Si), z(Sj), …,z(Sk)为S集合上的高斯过程。

      如果S集合中的元素个数是有限的,则Z是否为GP可以通过穷举判断其是否为多维高斯函数。如果S集合中元素的个数是无限的,则Z不能通过穷举获得,但是如果Z中变量和某个高斯变量有直接联系的话,则Z也有可能是S上的一个GP。

      下面来看看GP的存在性定理以及该怎样构造 GP:

       

      存在定理说明,对任意集合S中的单个元素都存在某个均值函数,以及对任意集合S中的2个元素都存在某个核函数(即协方差函数),则在S上一定存在一个高斯过程Z(t),其元素具有类似S形式的均值和方差。所以在给定集合S后,我们只需要给出一个一元的均值函数,一个二元的核函数表达式,就可以构造出一个高斯过程。常见的高斯过程有:

      Random planes, Brownian motion, squared exponential GP, Ornstein-Uhlenbeck, a periodic GP, and a symmetric GP.

      它们的均值函数和协方差函数分别定义如下:

         

      

      这里讲一下通常情况对高斯函数采样的方法:首先我们知道任何一个高斯函数都可以写成标准高斯函数的线性组合,因此只要能够对标准高斯函数进行采样就OK了。其方法

    为:计算出了标准高斯函数的分布函数,用[0,1]均匀分布随机发生器选择随机的值y,当做标准高斯函数的函数值,然后找到分布函数下对应的S就可以了,该点即为我们所需要的sample。

      程序中通过svd分解后的变量来重构z的理论暂时没有理解。

      实验结果:

      首先看看1d情况下的GP sample,其线性GP如下(图像表明,符合该条件的GP中的一个sample是一条直线):

       

      布朗运动的结果如下(有点随机游动的感觉):

       

      指数GP结果为(特点是很平滑):

       

      Ornstein-Uhlenbeck过程如下(和布朗运动类似):

       

      周期性的GP:

       

      对称性的GP:

       

      下面是2d情况下的结果。线性的GP(是一个平面):

       

      squared exponential:

       

      Ornstein-Uhlenbeck过程:

       

      2d的处理耗时和耗内存比较大,所以这里将显示的样本点个数减小了。

      实验主要部分代码及注释:

    GP_1d.m:

    复制代码
    % GP_1d.m
    
    % 选择核函数(协方差函数),其均值函数默认为常量0.
    kernel = 6;
    switch kernel
        case 1; k = @(x,y) 1*x'*y; %Linear
        case 2; k = @(x,y) 1*min(x,y); % Brownian  
        case 3; k = @(x,y) exp(-100*(x-y)'*(x-y)); %squared exponential
        case 4; k = @(x,y) exp(-1*sqrt((x-y)'*(x-y))); %Ornstein-Uhlenbeck
        case 5; k = @(x,y) exp(-1*sin(5*pi*(x-y)).^2); %A periodic GP
        case 6; k = @(x,y) exp(-100*min(abs(x-y),abs(x+y)).^2); %A symmetric GP
    end
    
    % 选择需显示的点x,即集合S的一部分
    x = (-1:0.005:1);
    n = length(x);
    
    % 构造协方差矩阵
    C = zeros(n,n);
    for i = 1:n
        for j = 1:n
            C(i,j) = k(x(i),x(j));
        end
    end
    
    % 对GP进行采样
    rn = randn(n,1);%产生n个0~1之间的随机数,满足正态分布
    [u,s,v] = svd(C); %svd分解rn矩阵,s为奇异值矩阵,u为奇异向量.C=usv'
    z = u*sqrt(s)*rn; %z为什么这么表示,理论是??
    
    % 画出GP的一个sample
    figure(1);hold on; clf
    plot(x,z,'.-');
    % axis([0,1,-2,2]);
    复制代码

    GP_2d.m:

    复制代码
    % GP_2d.m
    
    % 选择核函数(协方差函数),其均值函数默认为常量0.
    kernel = 1;
    switch kernel
        case 1; k = @(x,y) 1*x'*y; %Linear
        case 2; k = @(x,y) exp(-100*(x-y)'*(x-y)); %squared exponential
        case 3; k = @(x,y) exp(-1*sqrt((x-y)'*(x-y))); %Ornstein-Uhlenbeck
    end
    
    % 选择需显示的点points,二维的
    points = (0:0.02:1)';
    [U,V] = meshgrid(points,points);
    x = [U(:) V(:)]';
    n = size(x,2);
    
    % 构造协方差矩阵
    C = zeros(n,n);
    for i = 1:n
        for j = 1:n
            C(i,j) = k(x(:,i),x(:,j));
        end
    end
    
    % 对GP进行采样
    rn = randn(n,1);%产生n个0~1之间的随机数,满足正态分布
    [u,s,v] = svd(C); %svd分解rn矩阵,s为奇异值矩阵,u为奇异向量.C=usv'
    z = u*sqrt(s)*rn; %z为什么这么表示,理论是??
    
    % 画出GP的一个sample
    figure(2); clf
    Z = reshape(z,sqrt(n),sqrt(n));
    surf(U,V,Z);
    复制代码

      参考资料:

         http://www.youtube.com/playlist?list=PLD0Z06AA0D2E8ZZBA

     

    作者:tornadomeet 出处:http://www.cnblogs.com/tornadomeet 欢迎转载或分享,但请务必声明文章出处。

     

     

     

    分类: 机器学习
    标签: 机器学习

    Visual Studio 小技巧:自定义代码片断

    用鼠标点点Visual Studio,会发现有个代码片断菜单: 
     
     
    点开后发现,原来是常用的代码片断(Tab的快捷方式)的管理器:
     
     
    于是打开上面的文件夹路径:
     
     
    通过经验或者直觉可知:要自定义代码片断,只要把文件复制一份,改改名称和参数,然后导入就应该可以了:
     
    下面我就演示下MAction类来示例:
     
    我把if.snippet复制了一份,改名为maction.snippet,然后用vs打开,发现是个xml:
     
    复制代码
    <?xml version="1.0" encoding="utf-8"?>
    <CodeSnippets xmlns="http://schemas.microsoft.com/VisualStudio/2005/CodeSnippet">
    <CodeSnippet Format="1.0.0">
    <Header>
    <Title>if</Title>
    <Shortcut>if</Shortcut>
    <Description>if 语句的代码段</Description>
    <Author>Microsoft Corporation</Author>
    <SnippetTypes>
    <SnippetType>Expansion</SnippetType>
    <SnippetType>SurroundsWith</SnippetType>
    </SnippetTypes>
    </Header>
    <Snippet>
    <Declarations>
    <Literal>
    <ID>expression</ID>
    <ToolTip>要计算的表达式</ToolTip>
    <Default>true</Default>
    </Literal>
    </Declarations>
    <Code Language="csharp"><![CDATA[if ($expression$)
    {
    $selected$ $end$
    }]]>
    </Code>
    </Snippet>
    </CodeSnippet>
    </CodeSnippets>
    复制代码
     
     

    扫了一下,发现这xml很简单,只要修改Shortcut(敲打的前几个字母),和Code里的内容改成自己的就可以了,当然描述和参数和表达式,有需要自己也可以改:

     
     
     

    OK,改完就这样了,本来以为还要导入,却发现,在默认目录里复制是直接生效的。

     
    测试,直接敲ma:
     
     
     

    直接出来代码片断的提示了,双击Tab按钮,直接出来了代码片断:

     
                using (MAction action = new MAction(光标是定位在这里的))
                {
                    
                }
     
     

    是不是很简单的说,通过此方法,把常用的代码片断弄成2个字母快捷方式(Tab),可以提高平时的编码速度。

    不知道这个VS小技巧有多少人已经使用过了,知道并已使用的可点下反对,不知道或没使用的可以点下推荐。

  • 相关阅读:
    Funny Car Racing
    [LDUoj 倍增] 题解
    [HDU7073] Integers Have Friends 2.0 -随机大法好
    【spring】全局异常 globalexception 处理
    【maven】测试
    【spring】spring aop
    jvm常用排错命令
    idea tools
    idea插件
    【maven】搭建maven私服--基于CentOS7.6+docker
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/3136017.html
Copyright © 2020-2023  润新知