第14章 多机器人系统
2020-03-01 188浏览
- 1.机器人引论 第14章 多机器人系统
- 2.第14章 多机器人系统 o o o o o 14.1 多机器人系统的概述 14.2 多机器人系统的体系结构 14.3 多机器人系统的协调控制 14.4 网络机器人 14.5 多机器人系统的应用
- 3.14.1 多机器人系统的概述 o 典型的多机器人系统主要有以下几种: n 群智能机器人系统:由许多无差别的自治机器人组成的分 布式系统。它主要研究如何使能力有限的个体机器人通过 交互产生群体智能。 n 自重构机器人系统:以一些具有不同功能的标准模块为组 件,根据目标任务的需要,对这些模块进行相应的组合, 进而形成具有不同功能的系统。 n 协作机器人系统:由多个具有一定智能的自治机器人组成, 机器人之间通过通信实现相互间的协作以完成复杂的任务。 n 机器人足球赛:前述几类机器人系统中,机器人之间的关 系是合作的、互助的。而在机器人足球赛中,不同球队的 机器人之间的关系是对抗的、竞争的。同队的机器人之间 则是合作的、互助的。
- 4.o 多机器人系统的特点主要包括其空间分布、功能分布、 时间分布、信息分布和资源分布。利用多机器人系统的 目的主要是: n 利用多机器人系统的空间分布特性,通过各个机器人并行 工作以提高完成任务的效率。 n 利用多机器人系统内资源(信息、知识、物理装置等)的 共享来弥补个体能力的不足,扩大完成任务的能力范围。 n 利用系统内机器人资源的冗余性、各机器人功能的互补性 提高完成任务的可能性,增强系统的容错性、鲁棒性和灵 活性。 n 利用多机器人系统功能分布、资源分布的特点来降低单个 机器人系统的成本和系统设计的难度,减少执行危险任务 过程中机器人系统的损失。
- 5.o 多机器人系统中存在的问题包括: n 分布式的结构使多机器人系统在进行全局优化时存在一定 困难或无法找到最优解。 n 多机器人系统中各机器人之间由于资源的分配和使用不合 理可能发生冲突或死锁现象。 n 随着多机器人系统中机器人数量的增加,多个机器人之间 进行组织和相互协调协作的困难也随之以指数倍数增长。 n 多机器人系统中,功能、信息和资源的分布在增强机器人 系统灵活性、适应性的同时,也增加了机器人对可用功能、 信息、资源进行搜索和信息交换的时间。多机器人系统由 此而产生的通信问题为系统快速响应外界环境的变化造成 了一定的困难。
- 6.o 多机器人系统研究的主要内容包括: 群体体系结构: o 研究多机器人系统的群体体系结构是为了实现多个机器人相互间 的合作。 o 多机器人系统的群体体系结构可以分为集中式(centralized)和分散 式(decentralized)两种。 感知: o 机器人的感知包括感觉和理解两方面问题。 通信: o 通信是机器人之间进行交互和组织的基础。通过通信,多机器人 系统中各机器人了解其他机器人的意图、目标和动作以及当前环 境状态等信息,进而进行有效的磋商,协作完成任务。 o 一般来说,机器人之间的通信可以分成隐式通信和显式通信两类。
- 7.学习: o 多机器人系统的学习可以根据其结构的不同有所区别。集中式 体系机构中,学习发生在主控单元上,其过程类似于个体机器 人的学习;在分散式体系结构中,所有机器人都参与到学习中, 它们可能会相互影响。多机器人系统通过学习可以获得较强的 适应性和灵活性等智能特性。 o 多机器人系统的学习按学习过程划分为:独立学习和交互学习。 o 多机器人系统的学习按反馈类型划分为:监督式学习、增强式 学习和无监督式学习。 o 多机器人系统作为一个群体进行学习时,依据不同的学习目的 其内部存在以下几种学习类型:机器人某种特定能力的学习; 对群体组合特性的学习;对任务模式的学习;对环境特性的学 习。
- 8.协调协作机制: o 多机器人系统的协调协作机制与系统的群体体系结构、个体体 系机构、感知、通信和学习等方面的研究密切相关。 o 协调协作按主观意愿来划分,可以分为有意识协作和无意识协 作;按协作的类型来划分,可以分为合作型和竞争性。 o 多机器人系统的协调协作反映了在多机器人系统不同层次上对 系统控制与交互提出的不同要求。W.Rausch等提出多机器人系 统不同层次的协调协作:隐含协作关系,机器人按其自有的规 划模型考虑其它机器人规划的影响;异步协调关系,多个机器 人在同一环境下存在相互间干涉的条件下为完成各自目标而产 生协作;同步协作关系,多个机器人为完成一个共同目标而产 生的协作。
- 9.o 在多机器人系统的设计中,通常采用的是自顶向下的设计方 法。即将复杂的多机器人系统的功能和目标要求逐层分割分 解,逐步细化多机器人系统各功能模块,集成实现目标所必 需的控制算法和协作策略。 自顶向下设计方法的流程
- 10.14.2 多机器人系统的体系结构 o 体系结构主要研究如何组织和控制机器人的硬件和软件系统 来实现机器人所需完成的功能。体系结构通常分为群体体系 结构和个体体系结构。群体体系结构为实现预定的行为如何 把个体联系到一起的形式。它表示个体之间所能存在的问题: 知识、信息、控制等方面长远的、静态的关系模式,并从全 局角度定义每个个体在系统整体行为的高级观点,从而有助 于引导局部控制实现协作,增强系统的全局一致性。多机器 人系统是由个体机器人组成的。作为个体机器人的核心部分, 机器人控制系统决定了多机器人系统中机器人的协作能力。 机器人个体体系结构将决定其适应环境的能力及其智能的复 杂程度。
- 11.o 多机器人系统的体系结构可以分为集中式(centralized) 结构和分 散式(decentralized)结构两种。分散式结构又可以进一步划分 为分层式(hierarchical)结构和分布式(destributed)结构。 a集中式结构 b分布式结构 几种多机器人系统体系结构示意图 c分层式结构
- 12.o 集中式结构通常由一个主控单元掌握全部环境及受控机器人的信息, 运用规划算法和优化算法。主控单元对任务进行分解和分配,向各 受控机器人发布命令,并组织多个受控机器人共同完成任务。集中 式结构的优点在于,理论背景清晰,实现起来较为直观,但存在以 下缺点: o (1) 容错性差 一个机器人的简单错误可能会造成整个系统的瘫痪。 o (2) 灵活性差 系统中机器人的个数增加或者减少时,原有的规划结 果无效,需重新进行规划。 o (3) 适应性差 由于在实际环境中所有信息对于主控单元并不完全已 知,所以主控单元在复杂多变的环境中无法保证各受控机器人快速 响应外界的变化,以做出适当的决策,因此该结构不适合动态、开 放的环境。 o 另外集中式结构还存在主控单元和其它机器人之间的通信瓶颈问题。
- 13.o 相对于集中式结构来说,尽管分散式结构很难或者无法全局目 标的优化,但是它以故障冗余、可靠性等诸多优点引起人们对 分散式结构的兴趣。分布式的结构中没有主控单元,各机器人 之间的关系是平等的,各机器人均能通过通信手段与其它机器 人进行信息交流,自主进行信息交流,自主进行决策。这种方 式具有灵活性和适应性强的优点。但是,要注意避免各个个体 片面强调“个性”,过分强调自己任务的重要性,而导致过多占 有资源的情况,使得任务完成效率低下。分层式与分布式的区 别在于前者存在局部集中,它是介于集中式和分布式之间的一 种混合结构。 o 下面介绍几种较为典型的多机器人系统的体系结构。
- 14.14.2.1 分层式结构 o 面向多机器人协作系统(Multi-Robot Cooperative System, MRCS)为了满足自主性和协作性要求,多机器人体系分层式 结构设计成三层结构形式,分别为协作规划层(cooperation planning layer,CpPL)、协调规划层(coordination planning layer,CdPL)及行为控制层(behavior control layer,BCL)。
- 15.分层式体系结构框图
- 16.1 协作规划层 o 协作规划层是为了满足机器人的任务协作要求设计的。在MRCS 中,许多复杂的任务需要多个机器人协同完成,而协作层赋予机 器人协作能力、组织能力等。 o 协作层可以实现:1)任务的承接、分解和分配;2)机器人之间 的通信、协商等功能的管理。对于需要协作执行的任务,将任务 分解为若干子任务后,按某种协议与其它机器人磋商,制定联合 行动计划。若是决定独立执行,则将任务交给协调规划层处理。 o 协作规划层的各个模块:①协作通信模块(communication module of cooperation layer,CMCoL)负责机器人之间任务级的信息传递, 如任务的承接、发布等。 ②待规划的任务模块(task module of be panned,TMP)存放来自用户或其它机器人的招标任务。 ③待 发布任务模块(task module of be announced,TMA)存放任务分解 后需其它机器人协作执行的任务。
- 17.④组织知识库(organization knowledge base,OKB)组织模块中存放社会 规则、谈判策略以及组织结构重组等方面的知识。⑤领域知识库(domain knowledge base,DKB)领域问题求解知识,包括规划任务的规则、前提 数据等。⑥协作规划器(cooperation planner,CpP) 协作规划器是协作规 划层的核心,协作规 划器根据领域知识将 承接的任务分解(若 不需分解则将任务交 给协调层处理)。基 于确定的协商策略和 协商协议以协商方式 实现机器人之间任务 的动态分配,协调机 器人之间的合作,建 立机器人之间的协作 关系。 协作规划层结构框图
- 18.2 协调规划层 协调规划层是为了解决机 器人之间协作关系确定下 来以后具体的运动控制问 题,协作层确定了机器人 的任务/子任务后,机器人 根据当前目标(任务)、 自身状态、以往经验、传 感信息等来规划自身行为。 另外,它在动作执行的过 程中负责检查冲突和采取 有效的措施消解冲突。对 于协调层中无法处理的问 题,则返回协作规划层, 由协作规划层重新规划。 协调规划层结构框图
- 19.主要模块包括如下:①协调通信模块(communication module of coordination layer,CMCdL) 负责机器人之间运动规划信息的传递。 ②建模模块(modeling module,MM) 根据传感器信息和通信信息对 外部环境进行建模,目的是为了对其它机器人的运动状态做出预测,作 为自己动作的参考。其中建模模型包括世界模型和其它机器人的状态模 型。 ③冲突检测模块(conflict inspecting module, CIM) 随着时间的 推移及外部环境的变化,原来的计划在执行过程中可能会产生冲突。冲 突检测模块则检测冲突的发生、判断冲突发生的类型以及推测冲突发生 的原因等。 ④冲突识别库(conflict type base, CTB) 存放各种冲突类 型,如目标冲突、资源冲突等。⑤冲突消解模块(conflict reconciling module ,CRM) 根据冲突类型提供相应的冲突消解策略。⑥消解策略 库(conflict reconciling strategy base ,CRCS) 存放冲突消解策略。 ⑦协调规划器(coordination planner , CdP) 是协调层的核心,它负责 机器人运动协调的局部规划。根据任务(目标)、自身状态及外部环境 信息,规划自身的行为,产生近期的运动序列,并负责与机器人规划层 之间的协商,实现机器人之间冲突的消解。
- 20.3 行为控制层 o 行为控制层的设计有两个目的:一是为了使机器人对紧急情况或 简单任务迅速做出反应(如避障),它直接由传感信息映射到某种行 为,基本上不作推理或根据简单规则直接推理;二是执行协调规 划层产生的运动控制命令,产生相应的动作。 o 通过反应产生的运动具有最高的优先级,动作模块立即执行,而 将从协调规划层送来的动作中断。如果发生中断,则协调规划模 块将决定是否重新进行规划。f:(*)表示从传感信息到 运动控制的映射关系, 可以由神经网络、分类 器、规则推理等实现。 行为控制层结构框图
- 21.14.2.2 基于行为的混合分层式结构 基于行为的机器人混合分层式体系结构
- 22.o 行为模块层由多个行为模块组成。行为管理层的主要功能是根据机器 人当前任务、状态、周围环境及合作要求,对机器人的行为进行调整。 o 行为模式指的是机器人控制系统对所获信息的反应模式。行为模式决 定了控制系统在收到信息后,将做出何种行为决策。对行为模式的调 整包括改变行为模块激活状态、改变行为算法的参数、改变行为综合 方式和参数等。通过这种在线调整,可提高机器人的适应性,同时为 机器人之间协作的顺利进行提供一定的保证。行为综合层处于结构的 最下层,其目的是对各个激活的行为模块的输出做出综合决策,控制 机器人最终的运动。 行为管理层概念框图
- 23.14.2.3 任务级协作式结构 1 任务级协作 o 集中式任务分配 o 分布式任务分配 n 熟人网分配 n 合同网分配 o 将熟人网和合同网结合在一起可以形成一种更加灵活的多机 器人系统任务分配机制。一般来说,熟人/合同网任务分配 机制比较适合小型的多机器人系统。为了使这两种机制能够 适应于大型机器人群体系统,系统应该具有一定的组织形式, 创建一种分层式组织形式可分三步进行:
- 24.n (1) 对于一个多机器人系统,根据机器人所具有的技能等 因素将其分解为数目相当的若干小组,同时各个小组选 出自己的管理者作为系统的最底层的管理成员,并且各 个小组管理者建立自己的熟人表; n (2) 对各小组管理者继续分组,选出各个新组的管理者作 为上一层成员并建立下属表(一种简单的熟人表,只包 含下属机器人的名称); n (3) 循环执行步骤2,直到该层所有机器人个数n满足 125.2 具体设计 o 控制体系结构包括系统 监控层、协作规划层和 行为控制层三个层次。 通信是协作的机器人之 间交互的基本手段,机 器人之间相互交换的信 息包括任务、有关的内 部状态和一些运动数据 等。 多移动机器人系统框架结构26.系统监控层(system-monitoring,SML) o 当系统发生不可预见的情况使得协作规划层和行为控制层都无法 解决时,由系统监控层通知操作人员处理这些异常、冲突和死锁, 如改变任务的执行状态和机器人运动的方向。另外,操作人员可 以通过系统监控层直接对任务或者运动规划进行干预。 协作规划层(coorperation planning layer,CpPL) o 协作规划层的主要功能是建立机器人之间的分层式组织关系,根 据任务的要求创建和组织合适的机器人群体,解决多机器人之间 的任务级协作问题。它还承担处理一些异常、无法解决的冲突和 死锁,同时作为系统监控层和行为控制层信息传递的媒介。27.协作规划层结构框图28.行为控制层 采用基于行为的方 法,根据当前的任 务状态,综合感知 模块检测到的环境 信息,通过通信获 得的相关信息及来 自上层的有关命令, 结合对工作环境的 了解进行决策,为 机器人规划出具体 的运动方向和运动 速度,实现具体的 运动控制。 行为控制层结构框图29.14.2.4 并行处理 混合式结构 基于多DSP并行处 理的混合式体系结 构利用DSP高速的 数字信号处理能力 来提高机器人的响 应速度,有助于提 高机器人运动的平 稳性。基于这种体 系结构设计制造的 轮式移动机器人 CASIA-I。 CASIA-I体系结构30.14.3 多机器人系统的协调控制 14.3.1 协调控制策略 1 多机器人协调合作的主要研究方法 o 协商和反应式方法 o 分布式人工智能方法 o 学习与进化方法31.2 多机器人协调合作的一些知名模型 o 最著名的就是Bratman 等人提出的BDI ( Belief –Desire –Intention) 模型。Cohen和Levesque又将“承诺( Commitment )”和“公约 (Convention )”的概念补充进来,后又经Jennings, Wooldridge等 人的进一步发展,形成了一套目前最为系统和成熟的多智能体 协调理论框架—联合意图理论。 n 基本要点是:多个智能体在完成一个共同任务时会形成一个共同 承诺,如果不出现“任务已完成”、“任务无法完成”和“任务不必 完成”三种情况之一,智能体就应该遵守公约,即坚持承诺,直 到成功完成共同任务;否则,智能体就会设法通知正在合作执行 共同任务的其它智能体,自己将要退出承诺。这样,其它智能体 就能够适时做出调整。 n 该理论只是侧重于智能体在完成任务时的一致性参与及坚持承诺 上面,没有提出具体分工上的协作,所以该理论只是提出了一个 框架,针对不同的问题还应该有相关的领域问题需要解决。32.o V1OSZ等提出了共享计划理论,它是建立在一种联合精神状态 之上的,其中最重要的概念就是它引入的概念算子:“打算”( Intention that)和“打算做”( Intention to ),它们通过一系列原子 操作符定义,引导智能体采取包括通信在内的行动来使得个体 、子团体和整个合作团体能够协调一致的执行所赋予的任务。 o 对策论(Game Theory)的研究始于上个世纪四十年代,多智能体 系统中对基于对策论的协商模型也展开了广泛的研究。最早提 出基于对策论协商模型的是Rosenschein,他首先应用对策论来 分析MAS的协商过程。 o Shoham等人提出为智能体制定一套社会规则(Social Laws ),要 求每个主体都必须遵守,而且相信别的主体也会遵守。利用社 会规则可以大量减少求解问题时的搜索空间,降低控制的复杂 度,而且减少了智能体间的交互,但同时也会伴随着一些合理 解的丢失。33.o 合同网模型是针对资源不足的多智能体动态环境的情况,采 用了任务分解、任务分配、任务监督和任务评价等要素构成 的一种协商策略。合同网模型源于1980年Smith提出的合同 网协议,合同网包括三个节点:管理者、投标者和合同者。 o 基于行为主义的多智能体系统的协调机制是以Brooks的基于 行为的系统分析与设计方法为基础的。行为主义者认为智能 体只需具有最基本的动作行为,智能体的智慧表现来源于对 外界环境和变化的及时反应。这种协调机制也在许多方面得 到了成功的应用,典型的应用就是多机器人的编队。34.14.3.2 协调控制平台 o 针对协调控制问题,人们开发了多种协调控制平台。这些平 台主要有两类。一类是针对集中式协调控制策略,另一类是 针对分布式协调控制策略。随着网络技术的发展,基于网络 的协调控制平台得到了很大的发展。人们希望通过网络实现 多机器人的协调行为,并且融合不同机器人的智能,基于对 多机器人系统建立的模型和网络平台实现多机器人系统的智 能协调行为。 o 例如,本书作者之一的研究小组开发了一种基于知识模型的 智能协调网络平台K-ICNP (Knowledge Model-Based Intelligent Coordinative Network Platform)。该平台采用Java编程语言进 行开发。基于这一网络平台并采用知识模型的方法,可以有 效地实现了多机器人系统的智能协调控制。35.14.3.3 协调控制中的学习 o 多机器人协调系统是一个极其复杂非线性动态系统,不可能 具有完备的先验知识,而必须依赖其自学习和自适应能力。 通过自学习和再励学习建模,动态调整控制参数来优化系统 性能适应环境变化。有不少文献对多机器人协调系统的自学 习和再励学习作了研究,并提出了一些学习算法。大致可分 为四类:个体再励学习、群体再励学习、基于遗传算法的学 习算法和基于模糊神经元的学习算法。 o 多机器人学习方法中还包括行为控制参数的学习、增强式学 习和学习分类器系统。行为控制参数的学习又有基于遗传算 法的行为控制参数学习和基于案例的空间时间推理的行为参 数学习。36.14.4 网络机器人 14.4.1 网络机器人的组成与特点 o 把标准通信协议和标准人-机接口作为基本设施, 再将它们与 有实际观测操作技术的机器人融合在一起,即可实现无论何 时何地,无论是谁都能使用的远程环境观测操作系统,这就 是网络机器人。 o 基于Web服务器的网络机器人技术以Internet为构架, 将机器 人与Internet连接起来, 采用客户端/服务器(C/S) 模式, 允许用 户在远程终端上访问服务器, 把高层控制命令通过服务器传 送给机器人控制器, 同时机器人的图像采集设备把机器人运 动的实时图像再通过网络服务器反馈给远端用户, 从而达到 间接控制机器人的目的, 实现对机器人的远程监视和控制。37.1 网络机器人的 硬件结构 网络机器人硬件结构图38.2 网络机器人的软件结构 o 自主机器人 基于网络的自主机器人软件结构39.o 网络服务器 网络服务器的软件结构40.o 客户 客户的软件结构41.3 网络机器人的特点 o (1) 基于网络的机器人技术涵盖了现代网络技术和机器人控制 技术两方面的内容, 并且将两者有机地结合起来; o (2) 基于网络的机器人建立在Internet的基础上, 相应地具有 Internet特有的一些功能, 拥有良好的人机界面,可以实现人 机交互功能; o (3) 基于网络的机器人以HTTP作为控制系统的标准通信协议, 其系统控制软件具有良好的可移植性和互用性,可以使用一 个服务器供不特定的多个用户在网络上任意使用; o (4) 由于网络的存在,网络机器人技术使得机器人系统中必需 的多数控制软件可以分散配置,机器人的软件开发也可以分 散进行,更容易实现。42.14.4.2 网络机器人的控制 网络机器人远程实时控制框架43.o 最上层为智能与人机交互层,用于进行人机交互、任务规划、 与CAD系统的联接以及视觉、语音等信号的处理。该层形成了 机器人运动所需的空间直线、圆弧的特征参数,其中空间直线 只需要起点和终点的位姿参数,空间圆弧只需要起点、终点和 一个中间点的位姿参数。 o 其次是运动规划层,根据空间直线、圆弧的特征参数,进行在 线运动规划、逆运动学求解、选出控制解等,形成各关节电机 的位置。 o 下一层为运动控制层,给定从运动规划层接收到的关节电机位 置,反馈测量到的关节电机的实际位置,通过插值和D/A转换 形成模拟量的速度信号。该层实现位置闭环控制。 o 最下层为伺服控制层,给定运动控制层的速度信号,反馈以测 量到的关节电机的实际速度,由伺服控制与放大器实现速度伺 服控制。44.14.4.3 网络机器人的应用 o 虽然网络和机器人的结合才刚刚开始, 但网络机器人 技术在工业、空间、海洋、战场等远程控制方面, 以 及远程教学等领域有着广泛的应用前景。 o o o o 远程制造 遥操作 娱乐领域 远程健康监控45.10.5 多机器人系统的应用 14.5.1 机器人足球 o 机器人足球比赛已经成为当前人工智能和机器人领域的 研究热点之一,其目的是通过提供一个标准的、易于评 价的比赛平台,促进多智能体系统、分布式人工智能及 机器人学等领域的研究与发展。机器人足球比赛要解决 分散存在的多智能体在复杂动态环境下,通过相互通信 和协调,以实时方式进行的知识处理问题。 o 目前,举办全自主机器人足球比赛的国际组织有两个: RoboCup联合会和FIRA组织。46.1 足球机器人控制系统的体系结构 单机器人系统的体系结构 o 在中型组比赛中,单个机器人的控制系统广泛采用混合式的体 系结构,控制系统的上层采用规划技术,底层采用基于行为的 反应是控制技术,这样既保证了系统的鲁棒性和快速性,又使 系统具有较高的决策智能。 单机器人系统的体系结构47.多机器人系统的体系结构 o 各队普遍采用基于无线局域网(遵守IEEE802. 11标准)的通信 技术。每个机器人和场外计算机作为网络的节点,共同构成 一个无线局域网络系统。 本文将球队的 体系结构分为 两种:集中与 分布式结合的 混合型结构和 完全分布式的 结构。 机器人系统的体系结构(完全分布式的结构)48.o 多机器人的协作是指多个机器人通过协调各自的行为,合作 完成共同目标。机器人的协作策略在很大程度上决定了一支 球队的强弱,也是机器人智能的一个集中体现。 2 足球机器人目前存在的难题 o (1) 如何充分利用多个机器人的传感器信息以获得对环境相 对完整的感知; o (2) 如何设计协作策略以提高机器人球队的整体性能; o (3) 如何通过学习技术来获得或发展单机器人的控球技巧甚 至多个机器人的配合策略,并应用于真实的机器人系统。49.14.5.2 多移动机器人协作围捕 o Yamaguchi提出一种包含反馈控制和反应式控制的混合框架系 统,将反馈控制律用于协调多个移动机器人的运动,采用队形 矢量控制群体队形。韩学东等提出一种快速收敛的机器人部 队包围“入侵者”的队形分布式控制算法。Denzinger等利用最 邻近规则(nearest-neighbor rule)对当前状态进行分类,对每一 个状态用遗传算法搜索为实现围捕智能体应当采取的最优动 作。Osawa提出metalevel协调策略,协作抓捕智能体实现围 捕。 o 作者提出一种在连续未知环境中实现围捕任务的整体方案。 用强化学习实现机器人的包围行为,通过和其它行为的综合 实现多个机器人围捕共同目标实现围捕任务的整体方案。50.围捕流程图51.14.5.3 多机器人协作装配 o 基于多智能体概念实现的多机器人协作装配系统——MRCAS (Multi-Robot Cooperative Assmbly system )由组织级计算机、 三台工业机器人和一台全方位移动小车(ODV )组成,采用分 层递阶体系结构。 MRCAS系统体系结构
- 25.2 具体设计 o 控制体系结构包括系统 监控层、协作规划层和 行为控制层三个层次。 通信是协作的机器人之 间交互的基本手段,机 器人之间相互交换的信 息包括任务、有关的内 部状态和一些运动数据 等。 多移动机器人系统框架结构
- 26.系统监控层(system-monitoring,SML) o 当系统发生不可预见的情况使得协作规划层和行为控制层都无法 解决时,由系统监控层通知操作人员处理这些异常、冲突和死锁, 如改变任务的执行状态和机器人运动的方向。另外,操作人员可 以通过系统监控层直接对任务或者运动规划进行干预。 协作规划层(coorperation planning layer,CpPL) o 协作规划层的主要功能是建立机器人之间的分层式组织关系,根 据任务的要求创建和组织合适的机器人群体,解决多机器人之间 的任务级协作问题。它还承担处理一些异常、无法解决的冲突和 死锁,同时作为系统监控层和行为控制层信息传递的媒介。
- 27.协作规划层结构框图
- 28.行为控制层 采用基于行为的方 法,根据当前的任 务状态,综合感知 模块检测到的环境 信息,通过通信获 得的相关信息及来 自上层的有关命令, 结合对工作环境的 了解进行决策,为 机器人规划出具体 的运动方向和运动 速度,实现具体的 运动控制。 行为控制层结构框图
- 29.14.2.4 并行处理 混合式结构 基于多DSP并行处 理的混合式体系结 构利用DSP高速的 数字信号处理能力 来提高机器人的响 应速度,有助于提 高机器人运动的平 稳性。基于这种体 系结构设计制造的 轮式移动机器人 CASIA-I。 CASIA-I体系结构
- 30.14.3 多机器人系统的协调控制 14.3.1 协调控制策略 1 多机器人协调合作的主要研究方法 o 协商和反应式方法 o 分布式人工智能方法 o 学习与进化方法
- 31.2 多机器人协调合作的一些知名模型 o 最著名的就是Bratman 等人提出的BDI ( Belief –Desire –Intention) 模型。Cohen和Levesque又将“承诺( Commitment )”和“公约 (Convention )”的概念补充进来,后又经Jennings, Wooldridge等 人的进一步发展,形成了一套目前最为系统和成熟的多智能体 协调理论框架—联合意图理论。 n 基本要点是:多个智能体在完成一个共同任务时会形成一个共同 承诺,如果不出现“任务已完成”、“任务无法完成”和“任务不必 完成”三种情况之一,智能体就应该遵守公约,即坚持承诺,直 到成功完成共同任务;否则,智能体就会设法通知正在合作执行 共同任务的其它智能体,自己将要退出承诺。这样,其它智能体 就能够适时做出调整。 n 该理论只是侧重于智能体在完成任务时的一致性参与及坚持承诺 上面,没有提出具体分工上的协作,所以该理论只是提出了一个 框架,针对不同的问题还应该有相关的领域问题需要解决。
- 32.o V1OSZ等提出了共享计划理论,它是建立在一种联合精神状态 之上的,其中最重要的概念就是它引入的概念算子:“打算”( Intention that)和“打算做”( Intention to ),它们通过一系列原子 操作符定义,引导智能体采取包括通信在内的行动来使得个体 、子团体和整个合作团体能够协调一致的执行所赋予的任务。 o 对策论(Game Theory)的研究始于上个世纪四十年代,多智能体 系统中对基于对策论的协商模型也展开了广泛的研究。最早提 出基于对策论协商模型的是Rosenschein,他首先应用对策论来 分析MAS的协商过程。 o Shoham等人提出为智能体制定一套社会规则(Social Laws ),要 求每个主体都必须遵守,而且相信别的主体也会遵守。利用社 会规则可以大量减少求解问题时的搜索空间,降低控制的复杂 度,而且减少了智能体间的交互,但同时也会伴随着一些合理 解的丢失。
- 33.o 合同网模型是针对资源不足的多智能体动态环境的情况,采 用了任务分解、任务分配、任务监督和任务评价等要素构成 的一种协商策略。合同网模型源于1980年Smith提出的合同 网协议,合同网包括三个节点:管理者、投标者和合同者。 o 基于行为主义的多智能体系统的协调机制是以Brooks的基于 行为的系统分析与设计方法为基础的。行为主义者认为智能 体只需具有最基本的动作行为,智能体的智慧表现来源于对 外界环境和变化的及时反应。这种协调机制也在许多方面得 到了成功的应用,典型的应用就是多机器人的编队。
- 34.14.3.2 协调控制平台 o 针对协调控制问题,人们开发了多种协调控制平台。这些平 台主要有两类。一类是针对集中式协调控制策略,另一类是 针对分布式协调控制策略。随着网络技术的发展,基于网络 的协调控制平台得到了很大的发展。人们希望通过网络实现 多机器人的协调行为,并且融合不同机器人的智能,基于对 多机器人系统建立的模型和网络平台实现多机器人系统的智 能协调行为。 o 例如,本书作者之一的研究小组开发了一种基于知识模型的 智能协调网络平台K-ICNP (Knowledge Model-Based Intelligent Coordinative Network Platform)。该平台采用Java编程语言进 行开发。基于这一网络平台并采用知识模型的方法,可以有 效地实现了多机器人系统的智能协调控制。
- 35.14.3.3 协调控制中的学习 o 多机器人协调系统是一个极其复杂非线性动态系统,不可能 具有完备的先验知识,而必须依赖其自学习和自适应能力。 通过自学习和再励学习建模,动态调整控制参数来优化系统 性能适应环境变化。有不少文献对多机器人协调系统的自学 习和再励学习作了研究,并提出了一些学习算法。大致可分 为四类:个体再励学习、群体再励学习、基于遗传算法的学 习算法和基于模糊神经元的学习算法。 o 多机器人学习方法中还包括行为控制参数的学习、增强式学 习和学习分类器系统。行为控制参数的学习又有基于遗传算 法的行为控制参数学习和基于案例的空间时间推理的行为参 数学习。
- 36.14.4 网络机器人 14.4.1 网络机器人的组成与特点 o 把标准通信协议和标准人-机接口作为基本设施, 再将它们与 有实际观测操作技术的机器人融合在一起,即可实现无论何 时何地,无论是谁都能使用的远程环境观测操作系统,这就 是网络机器人。 o 基于Web服务器的网络机器人技术以Internet为构架, 将机器 人与Internet连接起来, 采用客户端/服务器(C/S) 模式, 允许用 户在远程终端上访问服务器, 把高层控制命令通过服务器传 送给机器人控制器, 同时机器人的图像采集设备把机器人运 动的实时图像再通过网络服务器反馈给远端用户, 从而达到 间接控制机器人的目的, 实现对机器人的远程监视和控制。
- 37.1 网络机器人的 硬件结构 网络机器人硬件结构图
- 38.2 网络机器人的软件结构 o 自主机器人 基于网络的自主机器人软件结构
- 39.o 网络服务器 网络服务器的软件结构
- 40.o 客户 客户的软件结构
- 41.3 网络机器人的特点 o (1) 基于网络的机器人技术涵盖了现代网络技术和机器人控制 技术两方面的内容, 并且将两者有机地结合起来; o (2) 基于网络的机器人建立在Internet的基础上, 相应地具有 Internet特有的一些功能, 拥有良好的人机界面,可以实现人 机交互功能; o (3) 基于网络的机器人以HTTP作为控制系统的标准通信协议, 其系统控制软件具有良好的可移植性和互用性,可以使用一 个服务器供不特定的多个用户在网络上任意使用; o (4) 由于网络的存在,网络机器人技术使得机器人系统中必需 的多数控制软件可以分散配置,机器人的软件开发也可以分 散进行,更容易实现。
- 42.14.4.2 网络机器人的控制 网络机器人远程实时控制框架
- 43.o 最上层为智能与人机交互层,用于进行人机交互、任务规划、 与CAD系统的联接以及视觉、语音等信号的处理。该层形成了 机器人运动所需的空间直线、圆弧的特征参数,其中空间直线 只需要起点和终点的位姿参数,空间圆弧只需要起点、终点和 一个中间点的位姿参数。 o 其次是运动规划层,根据空间直线、圆弧的特征参数,进行在 线运动规划、逆运动学求解、选出控制解等,形成各关节电机 的位置。 o 下一层为运动控制层,给定从运动规划层接收到的关节电机位 置,反馈测量到的关节电机的实际位置,通过插值和D/A转换 形成模拟量的速度信号。该层实现位置闭环控制。 o 最下层为伺服控制层,给定运动控制层的速度信号,反馈以测 量到的关节电机的实际速度,由伺服控制与放大器实现速度伺 服控制。
- 44.14.4.3 网络机器人的应用 o 虽然网络和机器人的结合才刚刚开始, 但网络机器人 技术在工业、空间、海洋、战场等远程控制方面, 以 及远程教学等领域有着广泛的应用前景。 o o o o 远程制造 遥操作 娱乐领域 远程健康监控
- 45.10.5 多机器人系统的应用 14.5.1 机器人足球 o 机器人足球比赛已经成为当前人工智能和机器人领域的 研究热点之一,其目的是通过提供一个标准的、易于评 价的比赛平台,促进多智能体系统、分布式人工智能及 机器人学等领域的研究与发展。机器人足球比赛要解决 分散存在的多智能体在复杂动态环境下,通过相互通信 和协调,以实时方式进行的知识处理问题。 o 目前,举办全自主机器人足球比赛的国际组织有两个: RoboCup联合会和FIRA组织。
- 46.1 足球机器人控制系统的体系结构 单机器人系统的体系结构 o 在中型组比赛中,单个机器人的控制系统广泛采用混合式的体 系结构,控制系统的上层采用规划技术,底层采用基于行为的 反应是控制技术,这样既保证了系统的鲁棒性和快速性,又使 系统具有较高的决策智能。 单机器人系统的体系结构
- 47.多机器人系统的体系结构 o 各队普遍采用基于无线局域网(遵守IEEE802. 11标准)的通信 技术。每个机器人和场外计算机作为网络的节点,共同构成 一个无线局域网络系统。 本文将球队的 体系结构分为 两种:集中与 分布式结合的 混合型结构和 完全分布式的 结构。 机器人系统的体系结构(完全分布式的结构)
- 48.o 多机器人的协作是指多个机器人通过协调各自的行为,合作 完成共同目标。机器人的协作策略在很大程度上决定了一支 球队的强弱,也是机器人智能的一个集中体现。 2 足球机器人目前存在的难题 o (1) 如何充分利用多个机器人的传感器信息以获得对环境相 对完整的感知; o (2) 如何设计协作策略以提高机器人球队的整体性能; o (3) 如何通过学习技术来获得或发展单机器人的控球技巧甚 至多个机器人的配合策略,并应用于真实的机器人系统。
- 49.14.5.2 多移动机器人协作围捕 o Yamaguchi提出一种包含反馈控制和反应式控制的混合框架系 统,将反馈控制律用于协调多个移动机器人的运动,采用队形 矢量控制群体队形。韩学东等提出一种快速收敛的机器人部 队包围“入侵者”的队形分布式控制算法。Denzinger等利用最 邻近规则(nearest-neighbor rule)对当前状态进行分类,对每一 个状态用遗传算法搜索为实现围捕智能体应当采取的最优动 作。Osawa提出metalevel协调策略,协作抓捕智能体实现围 捕。 o 作者提出一种在连续未知环境中实现围捕任务的整体方案。 用强化学习实现机器人的包围行为,通过和其它行为的综合 实现多个机器人围捕共同目标实现围捕任务的整体方案。
- 50.围捕流程图
- 51.14.5.3 多机器人协作装配 o 基于多智能体概念实现的多机器人协作装配系统——MRCAS (Multi-Robot Cooperative Assmbly system )由组织级计算机、 三台工业机器人和一台全方位移动小车(ODV )组成,采用分 层递阶体系结构。 MRCAS系统体系结构