|
[1]
|
Sutton, R.S. and Barto, A.G. (1998) Reinforcement Learning: An Introduction. IEEE Transactions on Neural Networks, 9, 1054. [Google Scholar] [CrossRef]
|
|
[2]
|
申铠瑶. 基于强化学习的序列决策在两栖无人车跨域的应用研究[D]: [硕士学位论文]. 北京: 军事科学院, 2025.
|
|
[3]
|
赵星宇, 丁世飞. 深度强化学习研究综述[J]. 计算机科学, 2018, 45(7): 1-6.
|
|
[4]
|
陈刚, 王志坚, 徐胜超. 基于强化学习的移动边缘计算任务卸载方法[J]. 计算机测量与控制, 2023, 31(10): 306-311.
|
|
[5]
|
梁俊斌, 张海涵, 蒋婵, 等. 移动边缘计算中基于深度强化学习的任务卸载研究进展[J]. 计算机科学, 2021, 48(7): 8.
|
|
[6]
|
刘亮, 荆腾祥, 段洁, 等. 空天地一体化网络中基于联邦深度强化学习的边缘协作缓存策略[J]. 通信学报, 2025, 46(1): 93-107.
|
|
[7]
|
陈超美, 陈悦, 侯剑华, 等. CiteSpaceII: 科学文献中新趋势与新动态的识别与可视化[J]. 情报学报, 2009, 28(3): 401-421.
|
|
[8]
|
王鹏, 程思儒. 人工智能高质量数据集的发展趋势及热点——基于CiteSpace的知识图谱分析[J]. 技术经济与管理研究, 2025(4): 43-48.
|
|
[9]
|
陈伊高, 黄楚新. 人工智能技术与出版深度融合的焦点透视与趋势展望——基于CiteSpace的可视化分析[J]. 科技与出版, 2024(4): 112-120.
|
|
[10]
|
吴岩, 王光政. 基于CiteSpace的配电网韧性评估与提升研究综述与展望[J]. 中国电力, 2023, 56(12): 100-112+137.
|
|
[11]
|
毛国君, 顾世民. 改进的Q-Learning算法及其在路径规划中的应用[J]. 太原理工大学学报, 2021, 52(1): 91-97.
|
|
[12]
|
杨志鹏, 李波, 甘志刚, 等. 基于深度强化学习的四旋翼无人机航线跟随[J]. 指挥与控制学报, 2022, 8(4): 477-482.
|
|
[13]
|
邓柏荣, 陈俊斌, 丁巧宜, 等. 融合电网运行场景聚类的多任务深度强化学习优化调度[J]. 电网技术, 2023, 47(3): 978-990.
|
|
[14]
|
易佳豪, 王福杰, 胡锦涛, 等. 基于行为克隆的机械臂多智能体深度强化学习轨迹跟踪控制[J]. 计算机应用研究, 2025, 42(4): 1025-1033.
|
|
[15]
|
蔡玉, 官铮, 王增文, 等. 基于多智能体深度强化学习的车联网区分业务资源分配算法[J]. 计算机工程与科学, 2024, 46(10): 1757-1764.
|
|
[16]
|
钟子山, 唐建航, 金柯兵, 等. 基于深度强化学习的混合数字孪生边缘部署[J/OL]. 计算机工程: 1-12. 2026-01-23.[CrossRef]
|
|
[17]
|
Chen, Y., Chen, C.M., Liu, Z.Y., et al. (2015) The Methodology Function of Cite Space Mapping Knowledge Domains. Studies in Science of Science, 33, 242-253.
|