基于混合域注意力的深度强化学习交叉口信号控制方法An Intersection Signal Control Method with Deep Reinforcement Learning Based on Mixed Domain Attention
李忠华, 何子登 下载量: 134 浏览量: 262
计算机科学与应用 Vol.14 No.4, April 19 2024, PDF, HTML, XML DOI:10.12677/csa.2024.144088 被引量
基于奇异摄动强化学习的时变系统线性二次零和博弈研究Singular Perturbation-Based Reinforcement Learning for Time-Varying Linear Quadratic Zero-Sum Games
刘明相 下载量: 270 浏览量: 400
人工智能与机器人研究 Vol.12 No.4, November 29 2023, PDF, HTML, XML DOI:10.12677/AIRR.2023.124040 被引量
基于强化学习的生成式对话系统研究Research on Generative Dialogue System Based on Reinforcement Learning
颜 永, 白宗文 下载量: 239 浏览量: 539 科研立项经费支持
数据挖掘 Vol.13 No.2, April 28 2023, PDF, HTML, XML DOI:10.12677/HJDM.2023.132018 被引量
基于长短期兴趣的深度强化学习推荐模型A Deep Reinforcement Learning Recommendation Model Based on Long and Short Term Interest
王世罡, 牛连强 下载量: 261 浏览量: 458
计算机科学与应用 Vol.13 No.5, May 25 2023, PDF, HTML, XML DOI:10.12677/CSA.2023.135101 被引量
结合注意力机制的多智能体深度强化学习的交通信号控制Traffic Signal Control Using Multi-Agent Deep Reinforcement Learning Combined with Attention Mechanism
徐晴晴 下载量: 133 浏览量: 209
运筹与模糊学 Vol.14 No.2, April 16 2024, PDF, HTML, XML DOI:10.12677/orf.2024.142143 被引量
基于深度强化学习的电力网–信息网–路网耦合系统韧性分析Resilience Analysis of Power-Information- Road Network Coupling System Based on Deep Reinforcement Learning
罗 浩, 张 巍 下载量: 340 浏览量: 531
建模与仿真 Vol.12 No.2, March 24 2023, PDF, HTML, XML DOI:10.12677/MOS.2023.122136 被引量
浅析强化理论在单词记忆软件中的应用——以百词斩为例A Study on the Application of Reinforcement Theory in Word Memory Software—Taking “Baicizhan” as an Example
杨 维, 王 飞 下载量: 83 浏览量: 161
创新教育研究 Vol.12 No.5, May 9 2024, PDF, HTML, XML DOI:10.12677/ces.2024.125278 被引量
仓储中基于多智能体深度强化学习的多AGV路径规划Multi-AGV Path Planning in Warehousing Based on Multi-Agent Deep Reinforcement Learning
王梅芳, 关 月 下载量: 293 浏览量: 604
建模与仿真 Vol.12 No.6, November 14 2023, PDF, HTML, XML DOI:10.12677/MOS.2023.126481 被引量
基于深度强化学习的机械臂视觉抓取控制优化方法Visual Grasp Control Optimization Method and System for Manipulator Based on Deep Reinforcement Learning
林 邦, 周 伟, 范江波, 李 锐 下载量: 1,688 浏览量: 7,863
人工智能与机器人研究 Vol.7 No.4, November 29 2018, PDF, HTML, XML DOI:10.12677/AIRR.2018.74024 被引量
时间尺度多样性结合强化学习促进囚徒困境博弈中的合作Time Scale Diversity Combined with Reinforcement Learning to Promote Cooperation in Prisoner’s Dilemma Game
李卓君, 王书博, 杨 梅, 程贞敏 下载量: 139 浏览量: 214
运筹与模糊学 Vol.14 No.1, February 18 2024, PDF, HTML, XML DOI:10.12677/ORF.2024.141012 被引量