1. 引言
马尔可夫链是生物学、物理学、数理金融等领域的基础工具。针对遍历性的研究是该领域重要研究方向。学者们利用遍历性发展出马尔可夫决策过程等重要算法模型。针对遍历性的研究关键的问题在于计算转移概率收敛到平稳分布的速度,其中几何遍历性(即以指数速度收敛至平稳分布)是常用的定性收敛特征。对于可数状态空间马尔可夫链而言,几何遍历性的研究已相当深入,形成了丰富的理论体系和应用成果,研究体系趋于完善。然而,一般状态空间马尔可夫过程的几何遍历性研究仍有不完善的地方。本文聚焦于一般状态空间下自由跳马尔可夫过程,包括向上自由跳和向下自由跳两类过程。这类过程的本质特征是:当系统处于某一状态时,若未遍历所有中间状态,则无法直接跃迁至“更高”或“更低”的状态。自由跳马尔可夫过程的早期研究可追溯至20世纪八十年代排队论中的生灭过程和金融数学中的二叉树模型[1],其中自由跳性质显著降低了路径复杂度。Latouche等人[2]于1984年在二维自由跳马尔可夫过程研究中取得关键进展,提出的状态降维递推算法不仅将传统线性方程组求解复杂度降低一个数量级,更通过分层递推策略首次显式导出首达时的k阶矩表达式。进入21世纪后,自由跳过程研究已取得较为系统的成果,涵盖算法优化、遍历性条件以及特定过程的判据等多个维度。Mao和Zhang (2004) [6]针对单生过程给出显式、可计算的指数遍历的充分条件。Roberts团队(2004) [3]将几何遍历性引入反射边界随机游走模型,结合Lyapunov函数量化收敛速率,推动了理论向工程领域的渗透;Viskov (2006) [4]通过重新阐释经典拉格朗日公式,建立自由跳过程与Lévy测度间的显式代数映射,证明了自由跳随机游走的首次到达时间与临界击中点的概率分布具有无限可分性。算法创新方面,Bauer和Claus (2010) [5]基于广义斐波那契数列提出新算法,用于求解描述自由跳过程的稳态模型,为数值解法开辟新路径。白晶晶等人(2015) [6]通过离散时间单生过程的泊松方程解和最小非负解理论,系统构建自由跳过程研究框架,给出常返性、正常返性、强遍历性、l-遍历性及几何遍历性的显式判据,同时提出返回概率、平稳分布、返回时间矩的计算方法,并建立随机单调性判据。Choi M C H和Patie P (2019) [7]在可数状态空间下发展了涵盖位势理论与波动理论的自由跳马尔可夫链一般性理论。张余辉(2020) [8]介绍了关于单死过程击中时的显式表示和一些数字特征的概率意义,在此基础上给出单死过程遍历性和强遍历性的判别准则,常返性和指数遍历性的充分或必要条件,以及灭绝概率的表示等。尽管国内外对自由跳马尔可夫过程的研究存在一定关注度,但多数成果仍局限于简化假设的可数状态模型,研究范畴多围绕遍历性的判别条件、平稳分布的计算等层面展开,收敛速度的计算多停留于存在性证明,精确表达式与可计算上界的缺失制约了算法优化与实时控制的应用;针对一般状态空间下自由跳过程的几何遍历性的判定条件和遍历速度仍然有研究的空间。
本文旨在研究一般状态空间下自由跳过程的几何遍历性的判定条件及收敛速率,建立紧致的几何遍历判据与显式收敛速率估计框架,揭示了自由跳性质对收敛速率上界和边界函数的优化机制,突破了传统几何遍历条件对隐式参数的依赖。第二节首先给出随机游走型马尔可夫过程几何遍历的判定条件,第三节针对向上自由跳随机游走过程给出几何遍历性判定条件并估计其几何收敛速率。第四节将理论成果应用于M/G/1嵌入排队模型,通过数值模拟验证收敛速率的上界。
2. 随机游走型马尔可夫过程
设
为定义在状态空间
上的离散时间马尔可夫过程,其中
为一般状态空间,
表示
上可数生成的
-代数。定义
为马尔可夫过程的转移核,
为n步转移核,即
其中
和
分别表示链在初始条件
下的概率与期望。
对于任意非负函数
,定义
对任意(符号)测度,记
。
定义集合
的首次返回时间
。称马尔可夫链
为
-不可约的,如果存在一个在
上的测度
,使得对于任意满足
的集合
,都有
对所有
成立。如果
是
-不可约的,则存在一个最大不可约测度
,使得对于任何其他不可约测度
,都有
。我们将符号
保留用于表示这样的最大不可约测度,并且我们将
表示为所有满足
的可测子集
的集合。称马氏链是Harris常返的,如果它是
-不可约的且对任意的集合
都满足
。
假设2.1 假设
是Harris常返、
-不可约且非周期的,并具有唯一不变分布
。
假设2.1确保了过程的平稳性,在过程平稳的前提下,我们可以考虑转移概率收敛到平稳分布的速度,即遍历性。遍历性的经典问题通常涉及以下两个核心议题:
(1)
(2)
其中
为几何收敛速率。
对于集合
,若存在
及定义在
上的非平凡测度
,使得对
中所有
,均有
,则称
为小集。基于此,我们引用一下引理(详见文献[9]):
引理2.1 假设马尔可夫链
是
-不可约且非周期的。若存在一个细集
、常数
、参数
,以及一个在某个
处有限的函数
,满足
(3)
则对任意
,存在
,使得该马尔可夫链是几何遍历的,且对于首次返回时间
,有
(4)
在本文中,我们将研究随机游走型马尔可夫过程(Random-walk type Markov Process)的几何遍历性。随机游动型马尔可夫过程的定义是对任意
,存在常数
,使得对所有
,转移概率满足
其中
表示欧几里得空间上以
为中心,
为半径的开球,这个定义等价于增量
是紧集。
随机游走型马尔可夫过程包含以下形式的结构:
(5)
其中,
为独立同分布的随机变量序列,且
和
。特别地,定义在半直线
上的经典随机游走也属于此类过程,其形式为:
(6)
其中,
,且
是与初始状态
独立的独立同分布随机变量序列。记
为一般增量变量,其分布函数用
表示。
我们先考虑随机游走型马尔可夫过程特殊情形的一些基本结果,下述结果来自文献[10]。
引理2.2 若
且
,即
(7)
假设增量变量
服从对称分布,其密度函数在区间
上处处为正且区间外为零。则
是Harris常返的当且仅当
。
根据引理2.2,我们首先得到特殊情形的随机游走型马尔可夫过程几何遍历的判定条件。
定理2.1 对于(7)中的随机游走型马尔可夫过程,假设
具有处处正的密度,则当
时,函数
是式(3)的解,其对应集合
。进一步地,存在
使得
(8)
即该过程是几何遍历的。
证明:根据式(3),我们有
因此由引理2.1可以得到式(8)的结果。
对于一般形式的式(5),我们有如下推广结果。
定理2.2 对于式(5)中的随机游走型马尔可夫过程,若存在常数
使得
则函数
是式(3)的解。进一步地,存在
使得
(9)
即该过程是几何遍历的。
证明:根据式(3),我们有
3. 自由跳随机游走过程
现在我们给出向上自由跳随机游走过程的定义。
定义3.1 若随机游走
的增量变量
的分布函数Γ满足存在某一常数
使得
(10)
则称该随机游走为向上自由跳随机游走过程。
基于漂移条件我们可以给出一般状态空间下该过程几何遍历性的条件及转移概率收敛到平稳分布的收敛速度上界
的精确表达式。
定理3.1 设
是
上的向上自由跳随机游走过程,假设其增量变量
满足
且对某一
有
。记
,
。若
,
是使
为最小值时取得的值,并且如果
则对任意
及
,有
(11)
此外,
(12)
其中
。
证明:记
,则有
和
,这意味着存在一个
使得
。显然
,当
趋近于
时,该值趋向于无穷大。因此,
在区间
内至少有一个局部最小值。如定理中所述,我们将其定义为
和
。
现在设
,根据文献[10],对于半直线上的随机游动,所有紧集都是小集,因此
是小集。我们将证明存在某一合适的函数
和
,使得满足以下不等式:
(13)
首先注意,对于
,
接下来,对于
,
在这种情况下,我们将对式(13)分别定义在
和
上的界限常数
,并写成:
假设
其中最后的等式是随机单调性的结果。
的假设通常可以被放宽,因为对于某些
,我们有
,并且在这种情况下我们可以使用
-骨架:但为了方便起见,我们假设
。
我们按照文献[11]中定理6.1概述的方法构造函数
:
则有
其中
且
该构造保持了
的单调性(如果
是单调的),因此结果成立。应用引理2.1,可以得到对于
,有
,并且
。
接下来,我们将引用下面的引理来获得可数状态空间
下的向上自由跳随机游走过程的精确收敛速率和可计算的收敛上界。
引理3.2设
是定义在可数状态空间上的路径有序的不可约马尔可夫链,若存在
和
使得
,则存在平稳分布
满足
对任意
成立,其中
证明:
的存在性及几何遍历性由
在
时的有限保证,详见文献[9]的第15章。此处我们关注同一收敛速率
给出的结果。为此,构造两个分别从
和
出发的耦合过程
,并定义在
处的耦合时间为
由路径有序性可知,当初始值较大的链进入
时,初始值较小的链也必然已在
中,因此
(14)
其中
为
的分布且
服从
分布。随机单调性将二维的
计算约化为一维的
尾概率计算。在正常耦合下利用
的平稳性及式(14),对任意
有
该式右侧具有上界
首项由假设保证有限。利用[12]中定理3.6的注记并整理项可得
由随机单调性显见此式有限,故得所需结论。
以下引理可直接由文献[13]的定理1.1推导得出:
引理3.3 设
是定义在可数状态空间上的向上自由跳马尔可夫链,即转移概率
满足当
且
时,
。假设过程不可约且常返,则
且
其中
且
证明:文献[13]给出了向上自由跳过程关于
矩阵的首返时间矩的具体表达式。由[14]中的定理4.30式(2)可知,当且仅当由
矩阵
生成的过程常返时,转移矩阵
才具有常返性。由此即得所需结论。
为便于描述,本文将使用以下两个序列:
及
应用以上引理,我们给出该节的主要结果。该结果不仅给出了更具体的几何遍历判别标准,还给出了对所有
成立的一致显式上界
。
定理3.2设
是可数状态空间上不可约且常返的向上自由跳随机游走过程,若
,则
是几何遍历的,且对任意收敛速率
有
且
对任意
成立,其中
证明:由[14]中定理4.44中式(3)知,该随机游走是强遍历的当且仅当
,即
。显然可以得出该随机游走也是几何遍历的且
,其中
。显然
,故得
。
取
,则
,对任意
有
当
时,
,故得
。
注释3.1 定理3.2给出了比引理3.2更精确且可计算的结果。因为模型的无跳跃性质,我们得到了仅依赖一步转移概率的几何遍历条件和对任意初始点都成立的一致上界。
4. 嵌入式M/G/1队列
对于M/G/1队列,顾客到达时间服从参数为
的泊松过程,服务时间
是独立同分布的随机变量,服从指数分布
。定义
及系统负载指标
,当
时,系统存在稳态分布;
时队列将无限增长。令
表示队列长度,即
时刻队列中的顾客数。设
,
为第
个顾客离开系统的时刻。定义
及嵌入马尔可夫链
,其中
表示第一个忙期开始时的顾客数。则
是M/G/1队列的嵌入马尔可夫链。
令
表示第
个顾客服务期间到达的顾客数,则
是独立同分布的随机变量,其分布为:
已知
满足如下递推关系:
该链
是定义在可数状态空间
上的离散时间马尔可夫链,其转移矩阵
不可约且非周期,形式为:
已知链
遍历的充要条件为
,我们有下述结论。
命题4.1 若M/G/1队列嵌入马尔可夫链,则当服务时间分布属于某
对应的
(其中
表示非负随机变量的分布函数)类时,该链也是几何遍历的。
证明:显然,
是式(3)关于
的解。现假设服务时间分布
,令
表示一个服务期间到达
个顾客的概率。因为
,对
,转移概率为
取
,则
当
时,上述积分有限。由此即得结论。
对于嵌入的M/G/1队列,若平均服务时间
、到达率
及队列中最大顾客数
取特定值,则可通过显式构造截断随机游走首返时间的矩,应用定理3.2得到其收敛速率
的界限及一致收敛上界
。固定
,在状态空间
上定义转移矩阵
如下:
进一步定义:
以及递推关系:
记
根据定理3.2,可得几何收敛速率
及收敛上界
的显式表达式:
基于以上结果,我们建立递推计算体系(见附表1),并针对不同截断水平
与流量强度
开展系统性数值实验。表1~3分别展示了关键参数
、收敛速率
及一致收敛上界
的定量结果。
Table 1. Values of the
under different truncation levels and traffic intensities
表1. 不同截断水平与流量强度下的
参数值
ρ |
0.9 |
0.7 |
0.5 |
0.2 |
0.1 |
N = 5 |
9.5 |
8.5 |
7.5 |
6 |
5.5 |
N = 10 |
19 |
17 |
15 |
12 |
11 |
N = 15 |
28.5 |
25.5 |
18 |
18 |
16.5 |
N = 20 |
38 |
34 |
30 |
24 |
22 |
N = 25 |
47.5 |
42.5 |
37.5 |
30 |
27.5 |
N = 30 |
57 |
51 |
45 |
36 |
33 |
Table 2. Numerical results of the convergence rate
表2. 收敛速率
的数值结果
ρ |
0.9 |
0.7 |
0.5 |
0.2 |
0.1 |
N = 5 |
1.10043 |
1.02378 |
1.04913 |
1.11388 |
1.11621 |
N = 10 |
1.03117 |
1.05183 |
1.02666 |
1.01207 |
1.08236 |
N = 15 |
1.01749 |
1.01928 |
1.02095 |
1.04919 |
1.05007 |
N = 20 |
1.01256 |
1.0174 |
1.00121 |
1.02213 |
1.0393 |
N = 25 |
1.0111 |
1.01963 |
1.00922 |
1.00151 |
1.00309 |
N = 30 |
1.00265 |
1.00213 |
1.02062 |
1.01012 |
1.03022 |
Table 3. Numerical results of the uniform convergence bound
表3. 一致收敛上界
的数值结果
ρ |
0.9 |
0.7 |
0.5 |
0.2 |
0.1 |
N = 5 |
485.455 |
533.897 |
622.545 |
1103.71 |
1953.66 |
N = 10 |
497.005 |
544.007 |
631.274 |
1110.47 |
1959.79 |
N = 15 |
510.34 |
555.481 |
641.018 |
1117.84 |
1966.42 |
N = 20 |
25.908 |
568.616 |
651.965 |
1125.91 |
1973.62 |
N = 25 |
544.319 |
583.798 |
664.352 |
1134.77 |
1981.46 |
N = 30 |
566.432 |
601.549 |
678.484 |
1144.55 |
1990.02 |
根据表的结果我们进行参数演化规律分析:
截断效应:表1显示
,验证理论预测
;
误差增长:表3中
随
超线性增长,符合
经验公式;
收敛速度分析(表2):
对于固定截断水平
,当
时,
随负载降低而增大,表明低负载下收敛较快;当
时,
呈现显著非线性特征;尽管系统负载较高,
并非始终最差。例如在
时
,比一些低负载情况下还要大,说明高负载并不一定导致更差的收敛速度,可能由于截断对概率分布尾部的影响更加显著。
对于固定负载
,随
增加,
趋于1,说明无论负载高低,截断层数越大,算法或估计的收敛速度越慢。在中高负载(如
)下,
的下降更明显。例如,从
到
,
从1.10043降到1.00265,说明在高负载下截断影响更大,需要较小的
才能达到较好收敛。在低负载(如
)下,
虽然也下降,但变化不一定规律。例如从
到
,
变化较不稳定(先下降后上升),可能是由于低负载下状态概率下降极快,导致数值波动。
为验证模型的几何收敛性,需确认
。从上表分别选取高负载和低负载情形时的
与
值,绘制
随
增大的变化曲线:
Figure 1. Decay curve of the normalized error
图1. 标准化误差
衰减曲线
图1显示无论是高负载还是低负载,当迭代次数
达到一定次数后,
呈指数衰减趋于0,验证了系统的几何收敛性。
基金项目
湖南师范大学计算与随机数学教育部重点实验室开放课题(202504),西安电子科技大学学科交叉拓展特支计划项目(TZJH2024004),陕西省自然科学基础研究计划青年项目(2025JC-YBQN-078)。
附 录
Table 1. M/G/1 queue simulation algorithm
附表1. M/G/1队列模拟算法
M/G/1队列模拟算法 |
输入:
(到达率),
(服务率),
(队列最大顾客数) 输出:
1:计算流量强度
2:if
then 3: 报错:系统不稳定(需选择
和
使
) 4:end if 5:计算转移概率
: 6:for
do 7:
8:end for 9:构造转移概率矩阵
: 10:for
do 11: if
或
then 12:
13:
14: else 15:
16:
17: end if 18:end for 19:
20:
21:计算
: 22:for
do 23:
24:end for 25:计算
: 26:for
do 27:
28:end for 29:计算
: 30:
31:计算
: 32:
|
33:计算
: 34:
35:生成随机数
36:
37:计算
: 38:
|
39:return
|
NOTES
*通讯作者。