时间尺度多样性结合强化学习促进囚徒困境博弈中的合作

运筹与模糊学
Operations Research and Fuzziology
Vol.14 No.1(2024), Paper ID 80769, 8 pages
DOI:10.12677/ORF.2024.141012

时间尺度多样性结合强化学习促进囚徒困境博弈中的合作
Time Scale Diversity Combined with Reinforcement Learning to Promote Cooperation in Prisoner’s Dilemma Game

李卓君,杨梅,程贞敏：贵州大学数学与统计学院，贵州贵阳；
王书博：华润电力投资有限公司中西分公司，河南郑州

How to Cite this Article

李卓君, 王书博, 杨梅, 程贞敏. 时间尺度多样性结合强化学习促进囚徒困境博弈中的合作[J]. 运筹与模糊学, 2024, 14(1): 131-139. https://doi.org/10.12677/ORF.2024.141012

为你推荐

友情链接