• 2012/3/4


    LQR(linearquadraticregulator)即线性二次型调节器,其对象是现代控制理论中以状态空间形式给出的线性系统,而目标函数为对象状态和控制输入的二次型函数。LQR最优设计指设计是出的状态反馈控制器K要使二次型目标函数J取最小值,而K由权矩阵Q与R唯一决定,故此Q、R的选择尤为重要。LQR理论是现代控制理论中发展最早也最为成熟的一种状态空间设计法。特别可贵的是,LQR可得到状态线性反馈的最优控制规律,易于构成闭环最优控制。而且Matlab的应用为LQR理论仿真提供了条件,更为我们实现稳、准、快的控制目标提供了方便。
    LQR Linear-quadratic regulator design for state space systems.

    [K,S,E] = LQR(SYS,Q,R,N) calculates the optimal gain matrix K
    such that:

    * For a continuous-time state-space model SYS, the state-feedback
    law u = -Kx minimizes the cost function

    J = Integral {x'Qx + u'Ru + 2*x'Nu} dt

    subject to the system dynamics dx/dt = Ax + Bu

    * For a discrete-time state-space model SYS, u[n] = -Kx[n] minimizes

    J = Sum {x'Qx + u'Ru + 2*x'Nu}

    subject to x[n+1] = Ax[n] + Bu[n].

    The matrix N is set to zero when omitted. Also returned are the
    the solution S of the associated algebraic Riccati equation and
    the closed-loop eigenvalues E = EIG(A-B*K).

    [K,S,E] = LQR(A,B,Q,R,N) is an equivalent syntax for continuous-time
    models with dynamics dx/dt = Ax + Bu

    纳什平衡
    其经典的例子就是囚徒困境。囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。 于是,两人同时陷入招供还是不招供的两难处境。 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点。 这时,个体的理性利益选择是与整体的理性利益选择不一致的。
    囚犯甲的博弈矩阵 囚犯甲
    招供 不招供
    囚犯乙 招供 各判刑两年 甲判刑十年,乙立即释放
    不招供 甲立即释放,乙判刑十年 各判刑半年


    基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。

    四轴飞行器的部分变种darganfly http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=3258454

  • 相关阅读:
    Making Pimpl Easy
    OpenCV学习资源
    openCV基础学习(1)
    fl2440原始linux代码的启动日志
    《s3c2440+lan91c111 vxworks驱动调试》疑惑
    使用并行的方法计算斐波那契数列 (Fibonacci)
    [译] SolidWorks的发展历史(1994~2007)
    翻译介绍一点CAD发展的历史
    使用fopen的两点注意事项
    四元数(Quaternions)简介
  • 原文地址:https://www.cnblogs.com/bowiehsu/p/2379176.html
Copyright © 2020-2023  润新知