便携式应急电源
镀铜焊丝的缺陷检测方法、装置、设...
电码的自动识别方法及存储介质
基于强化学习的楼栋摆放方法、装置...
用于观测水下生物的系统及其方法
一种电子设备的空中固件差分升级方...
一种印刷模切张力自动控制系统及其...
低功耗状态监控设备
一种利用RTP扩展头部解决视频帧...
一种高衍射效率相位型空间光调制器...
一种家装板材运输用包装机器人
航空发动机精密管路及其航空发动机...
宽光谱吸收的薄膜太阳能电池及光伏...
一种基于磁通压缩的脉冲磁体装置及...
一种总线访问仲裁装置及方法
一种处理网络抖动的方法及装置
基于光芯片的数据处理方法、装置、...
一种基于小基线条件下的大畸变广角...
一种自动识别设备间网络拓扑结构的...
基于光芯片的数据处理方法、装置、...
企业介绍页面,左右侧内容分别复制到相应容器即可,起始结束位置代码已作标注
专利名称一种基于多智能体强化学习的路径规划方法
申请日2018-09-05
申请号/专利号CN201811032979.5
专利权人北京航空航天大学
申请人北京航空航天大学
发明人/设计人曹先彬;杜文博;李碧月;李宇萌;刘瑜
公告日2019-04-26
公告号CN109059931B
法律状态有效
专利类型发明
行业分类

摘要

本发明公开了一种基于多智能体强化学习的路径规划方法,属于飞行器技术领域。首先建立空中飞行环境的全局状态划分模型,初始化全局状态转移表Q‑Table1,随机选择某行的全局状态,作为起始状态s1。在当前状态s1所有的列中,利用ε‑greedy算法选择某个列记为行为a1;利用选定的行为a1,在全局状态转移表Q‑Table1中得到当前状态s1的下一个状态利用Q‑Learning算法的转移规则更新全局状态转移表Q‑Table1中,当前状态s1以及行为a1所对应的具体元素值;更新进入内层循环,采用Q‑Learning算法得到更新后的状态s1所对应的局部规划路径。外层循环的迭代次数自增1直到N1,完成飞行器在空中的全局路径规划。本发明使得飞行器能适应不同环境的要求,提高飞行器的生存率和任务完成率,提高强化学习的收敛速度。
  关于我们  | 帮助中心  |  服务清单  |  发展历程 |  网站地图  |  手机访问

Copyrights 2016-2020  

南京锐阳信息科技有限公司 版权所有

苏ICP备17027521号-1

地址: 南京市秦淮区永智路5号五号楼3层