一种面向多任务的长航程AUV自主决策方法,其特征在于,包括以下步骤:
步骤A、执行基本任务序列,所述基本任务序列包括规划任务、避障任务、跟踪任务、控制任务和应急任务,以确保长航程AUV一般状态下的任务执行;
步骤B、采用数据指标对长航程AUV的触发事件进行表示,并设计任务触发机制对相应的任务序列进行触发;
步骤C、构建自主决策系统并进行动态自适应的规划,所述自主决策系统包括控制变量映射模块、AUV状态预测模块和任务序列效果评价模块,具体包括;C1、基于控制变量映射模块,根据AVU状态产生控制变量;C2、基于AUV状态预测模块,根据控制变量和当前时刻AUV状态计算下一时刻AUV状态;C3、基于任务序列效果评价模块,构建效用函数对控制变量进行评价并判断当前任务序列是否为最优任务序列,具体包括:1)根据当前AUV状态输出近似性能指标函数:其中U(x(i),u(i))为效用函数,γ为折扣因子,且0<γ≤1;其中,V(i)为航行器在第i时刻的航行速度;ts为航行器接收到反馈到作出动作所需的反应时间,设置为常数;DB(i)为i时刻航行器与障碍物之间的距离;MDT为任务起始点到任务结束点的距离;DT(i)为i时刻航行器与任务结束点之间的距离;2)对当前任务序列进行判断在判断当前任务序列是否为最优任务序列时,设定最优目标,即寻找决策序列u(i),i=k,k+1,…,N-1,使性能指标函数最小;假设从k+1时刻开始所有AUV状态x(k+1)的最优的性能指标函数值为J*(x(k+1)),从k+1时刻开始的最优决策序列为u*(k+1),u*(k+2),…,u*(N-1),k时刻性能指标函数表示为:U(x(k),u(k))+γJ*(x(k+1));其中x(k)是k时刻的状态,x(k+1)由系统方程确定,根据最优化原理,k时刻的最优性能指标函数值表示为:得到的最优解u*(k)为:即在k时刻的最优决策为u*(k),u*(k)即为最优的任务序列,由此得到长航程AUV当前需要执行的最优任务序列;步骤D、最后根据任务序列触发结果和评价结果执行最优的任务序列。