• IT发烧友,一个真正的技术交流群


    模拟退火

    (好久没有写博客,一写就是这么玄乎的东西......)

    前言

    • 对于这种十分神奇的近似算法(xjb随机算法) ,我一向觉得这十分不靠谱。
    • 然而,只有真正认真学习过这个(极其富有魅力)的算法的人,才知道这个算法是多么的强 (多么的不靠谱)
    • 那么,我就简单的介绍一下模拟退火。

    算法的物理原理 (没什么用)

    • PS:以下是摘自百度百科的物理原理介绍:

    模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e(-ΔE/(kT)),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。

    • 是不是发现,有点看不懂呢?甚至有一点点懵逼呢?
    • 其实,这些内容没什么太大意义只是用来看看的。
    • 唯一有点用的,可能就是那个平衡概率吧。

    算法在oi中的作用

    • oi中存在许多无法在多项式时间内解决的问题,如经典的TSP问题, 求费马点等多种问题。这也就是人们所熟知的np难问题。
    • 人们不能忍受在指数时间内达到正确的解。因为即使解是正确的,但可能到世界毁灭,这个解也跑不出。
    • 所以,人们期望有一种时间复杂度低,但是却能得到近似解的算法。即使这个算法得出的答案可能不是完全正确的。
    • 这时,模拟退火,爬山,遗传算法,蚁群算法就渐渐到了人们的关注中,显得尤为重要了。
    • 总而言之,模拟退火的作用就是:在较短的时间内,得到十分接近的答案,或者得到的就是答案。

    算法实现

    • 在知乎还是哪有一个特别有趣的比喻,在一定程度上说明了爬山算法与模拟退火的实现:
    1. 爬山算法:兔子朝着比现在高的地方跳去。它找到了不远处的最高山峰。但是这座山不一定是珠穆朗玛峰。这就是爬山算法,它不能保证局部最优值就是全局最优值。
    2. 模拟退火:兔子喝醉了。它随机地跳了很长时间。这期间,它可能走向高处,也可能踏入平地。但是,它渐渐清醒了并朝最高方向跳去。这就是模拟退火。
    • 从以上那毫无意义的物理原理,我们可以看出,模拟退火的主要步骤有几个:
    1. 设置初始温度(T),初始符合条件的答案;
    2. 通过某种神奇的方式,找到另一个符合条件的新状态;
    3. 分别将两个状态的答案计算出来,并作差得到(Delta E)
    4. 根据题目要求,贪心的决定是否更换答案。即:选择最优解。
    5. 如果无法替换答案,则根据一定概率替换答案。即运用到上述的平衡概率(exp(Delta E / T))随机的决定是否替换。
    6. 每一次操作后,进行降温操作。即:将温度(T)乘上某一个系数,一般是(0.985-0.999)随具体题目(随缘)定。

    我们可以根据上述过程写出一段伪代码:

    eps=1e-15;
    T=初始温度;
    while(T>eps)
    {
    	now=从当前最优状态随机更新的一个状态;
    	delta=calc(now)-calc(ans);
    	if(delta与题目要求的满足更优)ans=now;
    	else if(exp(delta/T)*RAND_MAX>rand())ans=now;//PS:这里的delta前面可能要加'-';
    	T*=t0;//t0一般在0.985-0.999之间,根据具体题目时间,随缘调试。。。
    }
    
    • 这就是模拟退火的具体实现方式,应该代码已经不难实现了。
    • PS:有一点需要注意的是,用平衡条件进行更新答案的时候,要根据题目判断(Delta E)前要不要加(-),如果实在判断不出,就两种都试一试。如果其中一种出现特别大的答案,或很奇怪的答案,那就用另一种吧。要么就把那一行注释掉,看看答案的变化大不大。
    • 那么,模拟退火就讲完了。具体的代码实现,就通过具体的题目来看吧。

    例题

    ( 题目打完了,还没写题解。最近一篇篇加进来吧。)

    [JSOI2004]平衡点

    hdu5017 Ellipsoid

  • 相关阅读:
    2.Spring Boot 有哪些优点?
    3.什么是 JavaConfig?
    4.如何重新加载 Spring Boot 上的更改,而无需重新启动服务器?
    Java中的异常处理机制的简单原理和应用。
    垃圾回收的优点和原理。并考虑2种回收机制。
    我们在web应用开发过程中经常遇到输出某种编码的字符,如iso8859-1等,如何输出一个某种编码的字符串?
    Request对象的主要方法:
    JSP的内置对象及方法。
    Servlet执行时一般实现哪几个方法?
    说说你所熟悉或听说过的j2ee中的几种常用模式?及对设计模式的一些看法
  • 原文地址:https://www.cnblogs.com/peng-ym/p/9158909.html
Copyright © 2020-2023  润新知