基于学习的自适应控制:理论及应用
基本信息
- 作者: [美]穆哈辛·本奥斯曼 (Mouhacine Benosman)
- 丛书名: 工业控制与智能制造丛书
- 出版社:机械工业出版社
- ISBN:9787111651994
- 上架时间:2020-4-28
- 出版日期:2020 年4月
- 开本:16开
- 页码:218
- 版次:1-1
- 所属分类:工业技术 > 机械/仪表 > 工业自动化仪表、智能系统

内容简介
目录
前言
致谢
第1章基础数学工具
11范数的定义和性质
12向量函数及其性质
13动态系统的稳定性
14控制中的动态系统仿射
15几何、拓扑和不变集性质
16总结
参考文献
第2章自适应控制概述
21引言
22自适应控制问题描述
23基于模型的自适应控制
231基于模型的直接自适应控制
232基于模型的间接自适应控制
24无模型自适应控制
25基于学习的自适应控制
26总结
前言
Carr(2014,第3章)
这是一百年前首次展示的自适应和控制技术的硬件实现。从那以后,自适应控制成为控制理论的主要分支之一。尽管这个问题已得到充分研究, 但是仍然存在着活跃的研究前沿(见第2章)。本书关注一种特定类型的自适应控制,称为基于学习的自适应控制。
在第2章中,我们将看到自适应控制可以被划分为三个子类:经典的基于模型的自适应控制,它主要利用被控系统的物理模型;无模型自适应控制,它完全基于控制器和系统间的交互;基于学习的自适应控制,它同时采用基于模型和无模型技术来设计灵活但迅速稳定(即安全)的自适应控制器。本书所介绍的基于学习的模块化自适应控制的基本思想如图A所示。可以看到图中有两个主要的模块:基于模型的和无模型的。 基于模型的部分主要是为了确保在学习过程中的某类稳定性,而无模型(即学习)部分主要是通过在线调整某些基于模型的控制器的参数值来改善控制器性能。 由于是模块化设计,这两个模块可以安全地连接在一起,即不会损害整个系统的稳定性(在有界意义下)。
图A基于学习的模块化自适应控制框图
我们将证明,这类自适应控制器与其他自适应方法相比的一个最大优势是:既能保证系统的稳定性,又具有无模型学习算法的灵活性。一方面,基于模型的自适应控制器可以非常有效且稳定,然而它强加给模型及不确定性结构(例如:线性与非线性结构等)许多约束。另一方面,由于无模型自适应控制器并不依赖于任何模型,所以模型的结构可以具有很大的灵活性。然而,它缺少基于模型的自适应控制器所具备的稳定性保障。此外,由于没有任何关于系统的物理知识,即不使用系统的任何模型,无模型自适应算法不得不在一个很大的控制选择范围内去学习最优控制行为(或策略)。而基于学习的自适应控制对两者进行了平衡,它不仅具有基于模型部分所保障的稳定性,还能够比无模型自适应控制更快地收敛到最优性能。这是由于,尽管存在不确定性或者不完备性,但它采用了系统的某些初始知识和模型信息。
为了便于阅读,第1章回顾控制理论的主要概念和工具,其中包括向量空间、希尔伯特空间、不变集等经典概念,以及李雅普诺夫、拉格朗日稳定性和输入状态稳定性(InputtoState Stability,ISS)等。最后,我们给出了无源性和非最小相位的一些重要概念。
第2章给出关于自适应控制领域的总体综述。一些主要的相关结果将被分门别类地划分到自适应控制理论的一些子领域中。本章的主要目的是将本书中的成果在自适应控制的全局框架中进行定位,使得读者能够更好地理解这些成果,并明晰与其他成果的区别。
接下来的章节更多的是我们过去几年关于基于学习的自适应方面的成果,因此技术性会更强。
从第3章开始,我们关注基于学习的自适应中的一类非常具体的问题,称为迭代反馈整定(Iterative Feedback Tuning,IFT)。IFT 的主要目的是为线性或非线性反馈控制器自动地调整反馈增益。首先给出一些IFT研究成果的简要概述,然后介绍我们在此领域的工作。具体来说,我们将研究基于极值搜索的非线性IFT。本书主要关注非线性系统(除了第6章外),因为非线性结果通过一些简化可以轻松地应用于线性模型。不过我们并不准备明确推导这些简化方法,而是把这部分工作留给感兴趣的读者。
第4章给出非线性模型基于极值搜索的模块化自适应控制的一般形式。本章首先考虑系统模型或不确定性没有任何结构化约束(除了基本的光滑性条件)的一般非线性模型的情况。对于这一类相当广泛的模型,在输入状态可稳定(通过反馈)的假设下,我们可以设计基于学习的模块化间接自适应控制器,其中的无模型学习算法用来在线估计模型的参数不确定性。接着我们关注一类更具体的非线性系统,称为关于控制向量仿射的非线性系统。对于这样的非线性系统,我们给出了一个构建性控制设计,该设计能够保证ISS性质,然后为其补充一个极值搜索无模型学习算法来估计模型参数。
在第5章中,我们将学习非线性模型的实时辨识问题。我们所说的实时是指在系统执行标称任务时,不需要打断或者改变系统任务就能够在线辨识系统的某些参数。事实上,在实际工业生产中中断一个系统任务可能会带来巨大的经济损失。如果能够在线辨识并持续更新系统参数,那么就能够实时跟踪其漂移,比如由于系统老化或者标称任务的实时改变(根据不同质量移动机械臂的不同部位)而导致的,然后更新相应模型。
针对有限维常微分方程模型和无穷维偏微分方程(Partial Differential Equation,PDE),我们都研究了基于极值搜索的参数模型辨识问题。在第5章中,我们还研究了一个相关问题,即PDE的降维稳定。在这个问题中,我们采用无模型极值搜索器来自动整定镇定项,即封闭模型。该模型通过将PDE投影至一个有限维空间来镇定降维模型。
最后,作为本书所提出方法的附带结果,在第6章中,我们将研究含参数不确定性的线性模型的模型预测控制(Model Predictive Control,MPC)这一具体问题。这个问题可以看作第4章内容的一个特例,其控制器采用模型预测控制器的形式并能够确保ISS。我们还将运用本领域的近期成果设计一个具有ISS性质的MPC(近期有大量关于ISSMPC主题的文献,因此是一个相当标准的成果),然后谨慎且合理地为其补充一个无模型极值搜索器来迭代学习模型的不确定性并提高MPC的整体性能。
在“结论和进一步说明”中,我们总结了现有的成果,给出了书中成果的进一步延伸思路,同时提及了一些我们认为在将来自适应控制研究中非常重要的开放问题。
M. Benosman
美国马萨诸塞州剑桥市
2016年3月
媒体评论
主要内容如下:
·针对控制向量仿射的非线性模型,提出了迭代反馈增益整定方法,并将该方法应用到电磁执行器和刚性机械臂两个机电一体化的系统中。
·基于学习的间接自适应控制方法,提出了一种新型的模块化自适应控制器实现方法对比并融合了无模型和基于模型的学习算法。
·研究了实时系统辨识问题,提出了一种基于极值搜索的辨识算法。同时,研究了无限维系统模型简化问题,将偏微分方程形式的无限维模型简化为常微分方程形式的有限维模型。
·研究了具有结构不确定线性时不变系统的自适应控制问题,结合基于模型的控制器和无模型极值搜索学习算法,提出了一种基于极值搜索的迭代学习模型预测控制方法。