ORF  >> Vol. 14 No. 1 (February 2024)

运筹与模糊学
Operations Research and Fuzziology
Vol.14 No.1(2024), Paper ID 80769, 8 pages
DOI:10.12677/ORF.2024.141012

时间尺度多样性结合强化学习促进囚徒困境博弈中的合作
Time Scale Diversity Combined with Reinforcement Learning to Promote Cooperation in Prisoner’s Dilemma Game

李卓君,杨 梅,程贞敏:贵州大学数学与统计学院,贵州 贵阳;
王书博:华润电力投资有限公司中西分公司,河南 郑州

版权 © 2017 李卓君, 杨 梅, 程贞敏, 王书博。本期刊文章已获得知识共享署名国际组织(Creative Commons Attribution International License)的认证许可。您可以复制、发行、展览、表演、放映、广播或通过信息网络传播本作品;您必须按照作者或者许可人指定的方式对作品进行署名。

How to Cite this Article


李卓君, 王书博, 杨梅, 程贞敏. 时间尺度多样性结合强化学习促进囚徒困境博弈中的合作[J]. 运筹与模糊学, 2024, 14(1): 131-139. https://doi.org/10.12677/ORF.2024.141012