2012/3/4 - 润新知

2012/3/4

LQR(linearquadraticregulator)即线性二次型调节器,其对象是现代控制理论中以状态空间形式给出的线性系统,而目标函数为对象状态和控制输入的二次型函数。LQR最优设计指设计是出的状态反馈控制器K要使二次型目标函数J取最小值,而K由权矩阵Q与R唯一决定,故此Q、R的选择尤为重要。LQR理论是现代控制理论中发展最早也最为成熟的一种状态空间设计法。特别可贵的是,LQR可得到状态线性反馈的最优控制规律,易于构成闭环最优控制。而且Matlab的应用为LQR理论仿真提供了条件,更为我们实现稳、准、快的控制目标提供了方便。
LQR Linear-quadratic regulator design for state space systems.

[K,S,E] = LQR(SYS,Q,R,N) calculates the optimal gain matrix K
such that:

* For a continuous-time state-space model SYS, the state-feedback
law u = -Kx minimizes the cost function

J = Integral {x'Qx + u'Ru + 2*x'Nu} dt

subject to the system dynamics dx/dt = Ax + Bu

* For a discrete-time state-space model SYS, u[n] = -Kx[n] minimizes

J = Sum {x'Qx + u'Ru + 2*x'Nu}

subject to x[n+1] = Ax[n] + Bu[n].

The matrix N is set to zero when omitted. Also returned are the
the solution S of the associated algebraic Riccati equation and
the closed-loop eigenvalues E = EIG(A-B*K).

[K,S,E] = LQR(A,B,Q,R,N) is an equivalent syntax for continuous-time
models with dynamics dx/dt = Ax + Bu

纳什平衡
其经典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑十年；如果两人均招供，将均被判刑两年。如果两人均不招供，将最有利，只被判刑半年。于是，两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳氏均衡点。这时，个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵囚犯甲
招供不招供
囚犯乙招供各判刑两年甲判刑十年,乙立即释放
不招供甲立即释放,乙判刑十年各判刑半年

基于经济学中“理性经济人”的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事实上，这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”（也叫非合作均衡），换言之，在此情况下，无一参与者可以“独自行动”（即单方面改变决定）而增加收获。

四轴飞行器的部分变种darganfly http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=3258454
相关阅读:
Making Pimpl Easy
OpenCV学习资源
 openCV基础学习（1）
fl2440原始linux代码的启动日志
 《s3c2440+lan91c111 vxworks驱动调试》疑惑
 使用并行的方法计算斐波那契数列 (Fibonacci)
[译] SolidWorks的发展历史(1994~2007)
翻译介绍一点CAD发展的历史
 使用fopen的两点注意事项
 四元数(Quaternions)简介
原文地址：https://www.cnblogs.com/bowiehsu/p/2379176.html