设计和实现控制技术以满足系统目标
最优控制是动态系统满足设计目标的一个条件。最优控制通过控制律实现,控制律遵循定义的最优性准则。一些广泛应用的最优控制技术有:
线性二次调节器(LQR)/线性二次高斯(LQG)控制
线性二次型调节器(LQR)是一种全状态反馈最优控制律\(u= -Kx\),它使调节控制系统的二次型代价函数最小化。
这个成本函数取决于系统状态\((x)\)和控制输入\((u)\),如下所示。
$ $ J (u) = \ int_ {0} ^ {\ infty} (x ^ T Qx + u ^ T俄文+ 2 x ^ Tν)dt $ $
根据性能指标,为该最优控制律设置权重因子Q、R、N,以确定系统状态调节与控制驱动成本之间的适当平衡。
在许多最优控制问题中,并不是所有的状态测量都是可访问的。在这些情况下,必须使用观察者来估计状态。这通常使用一个观察者来完成,例如卡尔曼滤波器。卡尔曼滤波器与LQR控制器组合构成线性二次高斯(LQG)控制器。
要了解更多,请查看这个MATLAB技术讨论等控制。
模型预测控制
模型预测控制(MPC)是用于最小化多输入多输出(MIMO)系统中受输入和输出约束的成本函数。这种最优控制技术使用一个系统模型来预测未来的设备输出。利用预测的工厂输出,控制器解决了一个在线优化问题,即二次规划,以确定一个可操作变量的最优调整,驱动预测输出到参考。MPC变体包括自适应、增益计划和非线性MPC控制器。MPC控制器的类型取决于预测模型(线性/非线性)、约束条件(线性/非线性)、成本函数(二次/非二次)、吞吐量和采样时间。想了解更多,请点击查看本次MATLAB技术讲座对MPC变体。
微处理器技术和高效算法的进步增加了这种最优控制方法在自动驾驶、航空航天应用中的最优地形跟踪等应用中的采用。
想了解更多,请点击查看这个MATLAB技术讲座系列模型预测控制。
强化学习
强化学习是一种机器学习技术,在这种技术中,计算机代理通过与动态环境的反复试错交互来学习最佳行为。代理使用来自环境的观察来执行一系列行动,目的是最大化代理对任务的累积奖励指标。这种学习不需要人工干预,也不需要显式编程。
这种最优控制方法可以用于决策问题,也可以作为一种非线性控制替代方案,用于使用传统控制方法的应用,如自动驾驶、机器人、调度问题和系统的动态校准。
想了解更多,请点击查看这个MATLAB技术讲座系列强化学习。
极值寻求控制
极值寻求是一种利用无模型实时优化自动调整控制系统参数使目标函数最大化的最优控制技术。该方法不需要系统模型,可用于参数和扰动随时间缓慢变化的系统。这种最优控制技术适用于控制中能容忍噪声的稳定系统,且只需要调整少量控制系统参数。
极值寻求控制的应用包括自适应巡航控制、太阳能阵列的最大功率点跟踪(MPPT)和防抱死制动系统(ABS)。
摘要针对合成
h -∞合成是设计单输入单输出(SISO)或MIMO反馈控制器以实现鲁棒性能和稳定性的最优控制工具/技术。与传统的控制技术如波德环路整形或PID整定相比,h -∞更适合于需要通道间交叉耦合的多变量控制系统。
当h无穷大时,控制目标用归一化闭环增益表示。h -∞合成自动计算一个控制器,该控制器通过最小化增益来优化性能。这是有用的,因为许多控制目标可以用收益最小化来表示。这包括诸如干扰抑制、噪声灵敏度、跟踪、环路成形、环路解耦和鲁棒稳定性等目标。h -∞合成的变化可用于处理固定结构或全阶控制器。
要了解更多,请查看这个MATLAB技术讨论摘要针对合成。
下表比较了上述最优控制方法:
最优控制方法 | 优化是否在运行时进行?(是/否) | 优化过程是如何为这个最优控制过程工作的? | 它能处理硬约束吗?*(是/否) | 它是否使用基于模型的技术?(是/否) | 吞吐量是什么?(高/低) |
---|---|---|---|---|---|
等/ LQG | 没有 | 使用封闭的解这适用于已知的线性时不变系统 | 没有 | 是的 | 高 |
隐式MPC(是的) | 使用一个预测模型,解决了一个在线优化问题计算最优控制动作 | 是的 | 是的 | 低(非线性MPC),高(线性MPC) | |
明确的政策委员会(没有) | 解决方案优化问题计算最优控制动作的方法离线计算 | 是的 | 是的 | 高 | |
强化学习 | 是的* * | 学习任务的最佳行为最大化奖励指标 | 没有* * * | 取决于训练算法 | 低(训练时),中-高(推理时) |
极值寻求控制 | 是的 | 扰动和适应控制参数使目标函数最大化 | 没有 | 没有 | 高 |
摘要针对合成 | 没有 | 自动计算控制器最小化归一化闭环增益 | 没有 | 是的 | 高 |
例子和如何
等/ LQG
模型预测控制
强化学习
极值寻求控制
摘要针对合成