1. 引言
随着社会的不断进步,人们的生活水平也在不断提高,生活中因排队等待的现象屡见不鲜。在排队的时候会发生很多复杂的难以预料的情况,所以排队论有相当的研究深度,研究模型也比较复杂,排队论是一个新兴方向,有很大的研究意义。在过去的几十年里,越来越多的学者热衷于从博弈论和经济学角度研究排队系统,这项研究可以追溯到Naor [1] 学者的开创性论文,他分析了可见情形下M/M/1排队系统中顾客决策与服务器定价策略问题,在此前提下顾客会自己选择加入系统或离开,顾客的最优策略即确定阈值,当队伍中的人数小于该值,则新到的顾客选择加入,反之选择离开。每一位选择加入的顾客都会被收取等额费用,这种策略能够最大化获得社会收益,但无法保证服务器可以获得最大的利润。Edelson等 [2] 补充了Naor [1] 的不可见情形,并发现在不可见情形下,顾客在计算等待时间的期望值时,会使用到排队系统的其他的参数,最后再结合服务器的定价是否符合顾客预期收益的前提下做出相应决策。在这种不可见情形下,顾客并不是只能采取纯策略,也有可能采取混合策略。该文献还证明了存在着由顾客收益决定的唯一的均衡策略。从那时起,许多学者以此为基础,开始研究包含不同特征的各种排队系统的均衡策略型问题。
Economou等 [3] 首先考虑了完全可见和几乎可见情形下带有故障和维修的马尔可夫单服务器队列的平衡阈值策略,推导出了不同信息水平下的顾客均衡策略,并分析了这些策略下的社会收益。Guo和Hassin [4] 研究了具有N策略的M/M/1队列中的社会收益和顾客策略行为,其中包含加入或止步行为。Liu [5] 等研究了可见情形下单休假M/M/1排队系统,该模型在系统为空时,服务器只能进行一次休假,并推导出了在均衡状态下的阈值策略,并在相应的策略下分析了平稳系统的行为。Zhang [6] 等和Sun和Li [7] 研究了多重工作假期的M/M/1排队系统顾客的均衡策略,还计算出了社会最优加入策略和社会最优收益。然后,Tian [8] 等研究了三种不同信息(可见情形、几乎可见情形、完全不可见情形)下具有多个工作假期和假期中断的M/M/1队列的顾客均衡策略和社会最优策略。Li等 [9] 讨论了具有工作休假和休假中断的M/M/1排队模型,根据系统动态变化,其服务速率在低值和高值之间切换,给出了顾客均衡策略和系统在这些策略下的平衡行为。关于带假期的战略排队系统的全面而优秀的研究,读者可参考Hassin著作的第10章 [10] 。在不同排队系统中,探究顾客均衡策略与社会最优策略问题离不开对该系统的性能分析,众多学者根据系统的不同特点采用不同的方法。Servi [11] 受多个波长的WDM光接入网络的启发,首次在研究M/M/1排队系统时加入了多重工作休假机制,并以系统稳态为前提进行性能分析,得到平均队伍长度的母函数与平均等待时间的Laplace变换。后来,Liu等 [12] 用拟生灭过程与矩阵几何解的方法得到了M/M/1排队系统处于稳态下的各项指标的显式解及其随机分解结构。Xu等 [13] 利用拟生灭过程和矩阵几何解方法通过求解工作休假M/M/1排队系统,得到稳态排队系统中顾客数量的概率分布,同时得到排队系统中各种稳态信息的随机分解。张和王 [14] 对正规忙期和工作休假期服务的顾客数服从不同分布的M/M/1排队模型进行分析,用GI/M/1型马尔可夫过程建模,求解除系统稳态的分布及队长的随机分解结构。Baba [15] 研究了到达过程为一般分布的GI/M/1工作休假模型,求解了顾客数的稳态分布与顾客平均逗留时间。
本文将延迟假期和工作休假相结合从系统管理者与服务器的角度研究了延迟工作休假M/M/1系统背景下的社会最优策略,补充了赵 [16] 仅从顾客角度的研究;且不同于Tian [17] 所研究的延迟休假下的社会最优策略,本文将延迟假期与工作休假相结合,研究其社会最优策略。本文的前提为顾客在到达排队系统时并不知道系统中所有顾客的数量,并且顾客只能选择立即加入排队系统或者离开系统。将顾客到达时对服务器的了解情况分为以下两种:1) 几乎不可见情形:在进入排队系统前顾客并不清楚服务器的状态,服务器的状态只能在顾客在到达排队系统的那个时刻得知。2) 完全不可见情形:顾客始终无法知道服务器的状态。本文分别探究了两种情形下对应的社会效益最优策略。本文分为如下部分:第2节对几乎不可见情形与完全不可见情形下的社会最优策略进行了相关研究,并研究了在最优策略下的利润最大化问题。在第3节中,本文通过对不同数值例子比较说明了主要参数对社会最优策略的影响。最后,在第4节总结了本文的研究成果。
2. 模型介绍
考虑延迟工作休假M/M/1系统。顾客的到达数服从参数为
的泊松分布,工作状态下的顾客服务时间服从参数为
的负指数分布,工作休假状态下的顾客服务时间服从参数为
的负指数分布,延迟时间服从参数为
的负指数分布,工作休假的时间服从参数为
的负指数分布。本文假设顾客的到达间隔,服务器的服务时间和服务器处于休假状态下的服务时间三个变量之相互独立。服务器符合先进先出原则。用
表示系统在时间t的顾客数量,令
(1)
则
是一个状态空间为
的过程。
本文假设顾客个体之间是相互独立的,不会受彼此影响。服务器为一个顾客服务完成后,该顾客得到R个单位的收益,并且顾客的每时间单位等待成本为C。由此,顾客的收益包括接受服务的收益减去基于线性成本结构的等待成本。顾客是风险中立的,即单位时间的期望收益等价于单位时间内确定的收益,并最大化他们的预期净收益。最后,我们假设没有拒绝顾客的重试,也没有拒绝等待顾客。
2.1. 几乎不可见情形
顾客可使用四种纯策略,即在状态
时加入队列或不加入队列。纯策略或混合策略的加入概率可以用
表示,即服务器处于状态
时加入的概率,则到达顾客的有效到达率为
,转换图如图1。

Figure 1. Transition rate diagram in almost invisible situation
图1. 几乎不可见情形下的转换速率图
转移概率矩阵Q可以写成下列分块三对角形式
, (2)
其中
(3)
这个结构表明
是一个拟生灭过程,Neuts [18] 经过研究得到了一种称为矩阵几何解的分析方法。对此进行分析QBD过程,设过程Q正常返,当且仅当矩阵方程
. (4)
最小非负解R的谱半径
,R称为率阵,Neuts [19] 给出了R的概率解释,且Neuts [18] 给出了详细的证明。因为系数(4)都是上三角矩阵,我们可以假设R具有相同的结构
, (5)
将
和R代入(4),我们得到以下结果
, (6)
和
, (7)
其中由于R的谱半径小于1,而
较大根大于1,所以取较小根,则
(8)
定义极限概率为
, (9)
. (10)
定理2.1:转移概率矩阵形如(2)的马尔可夫链
正常返,假设
和
则平稳概率如下
, (11)
, (12)
其中
. (13)
证明:系统的稳态概率向量满足
,由Neuts [17] 的矩阵几何理论可知
, (14)
以及
满足方程
, (15)
其中
。求解(15),并令
,可得
, (16)
经过(15)和(16),我们获得
, (17)
, (18)
最后,
可以通过正规化条件
确定。证毕。
从(11)和(12),我们得到服务器处于状态
的稳态概率,记为
,将(17)和(18)代入,可得
, (19)
(20)
则有效到达率是
, (21)
将(19),(20)代入,可得
(22)
其中
。
记
为系统的稳态队长的母函数,则
, (23)
将(17),(18)代入,可得
(24)
其中
。
通过随机分解理论,得到了系统中顾客的平均数量,记为
,可得
, (25)
其中
,
,
。
因此,可以使用利特尔定律获得决定在某一顾客到达时进入的顾客的平均逗留时间:
, (26)
将(22),(25)代入,可得
(27)
其中
,
,
。
现在可以计算出所有顾客都遵循混合策略
时的社会收益
, (28)
将(22),(25)代入,可得
(29)
其中
,
,
。
系统管理者的目标是最大化整体社会收益。即求解非线性规划问题
(
)的最大值,即可以获得社会最优策略
以最大化社会收益。令
, (30)
, (31)
则f,g关于
,
的一阶导分别为
(32)
, (33)
(34)
(35)
将(30),(31)代入
和
,可得
(36)
, (37)
所以社会收益
可以表示为
(38)
其中
,
,
。
则
中
和
的关于
和
的一阶偏导数可以表示为
(39)
(40)
, (41)
, (42)
因此,
的偏导数可以表示为
, (43)
, (44)
, (45)
, (46)
. (47)
由于目标函数表达式比较复杂,我们只提供了一个特定的充分条件来保证社会收益
是一个凸函数,在这种情况下我们能够得到最优加入概率
的值。
定理2.2:如果
且
,则关于
优化的问题是一个凸最大化问题,并且存在唯一的最优加入策略
,
。
证明:
的优化问题有3个约束:
和
,且它们都是实值线性函数。因此,约束集是凸的。
令
为目标函数的Hessian矩阵,其形式为
. (48)
根据Boyd和Vandenberghe [20] 里凸函数最大化问题的理论,如果
且
且
是负定的,则目标函数
在可行域内应该是严格凸的,这导致
的优化问题是一个凸函数求最大值的问题。凸函数的特点是有且仅有一个最大值。
根据上面的讨论,最优
,
的显式形式太长太复杂,本文只依图给出后面的数值结果。具体的求解方法可以参考Boyd和Vandenberghe等人 [20] 的研究,本文不再详细描述。图2表明社会收益
是严格的凸且最大值为9.98。同时我们还可以得到社会最优策略为
。

Figure 2. Social welfare in almost invisible situation, when R = 20, C = 1, λ = 1.2, μ = 1.5, η = 0.6, θ = 0.8, ξ = 1
图2. 几乎不可见下的社会收益,当R = 20,C = 1,λ = 1.2,μ = 1.5,η = 0.6,θ = 0.8,ξ = 1
2.2. 完全不可见情形
有两种纯策略可供顾客使用,即加入队列或不加入队列。一个策略可以用一个加入概率
来描述,加入率为
。过渡图表如图3所示。

Figure 3. Transition rate diagram in completely invisible situation
图3. 完全不可见情形下的转换速率图
当所有顾客都遵循给定策略q时,在几乎不可观察的队列中系统的平稳分布可以通过取
。所以我们有
, (49)
, (50)
其中
(51)
可以得到平均队列长度,表示为
,如下:
(52)
根据利特尔定律,可求出顾客到达后决定进入的平均逗留时间
, (53)
将(52)代入,可得
, (54)
因此,单位时间的社会收益可以计算为
, (55)
将(54)代入,可得
(56)
令
表示社会最优加入概率,并令
为一阶最优条件的根
。他们具有以下关系:
定理2.6:若
且
,则
;若
且
或
,则
。
在下面的分析中,本文为了保证函数(56)是严格的凸函数,有且仅有一个最大值,将提供一个具体的假设.在这种情况下我们得到了最优的加入概率。
定理2.7:假设
。如果
且
,则
1) 社会收益
在
中是单峰且严格凸的,其中
. (57)
2) 如果
,则
。否则
。
证明:让
。平均逗留时间
的前两阶导数由下式给出,令
, (58)
, (59)
其中
。
则
关于
的一阶导数为
, (60)
关于
的二阶导数为
, (61)
可计算出社会收益的二阶导数为
. (62)
因此,若
,则
,那么社会收益
在
中是单峰且严格凸的。
在图4,我们观察到
首先随着q增加然后减少,并且在
处具有最大值。因此,我们有
。

Figure 4. Social welfare in completely invisible situation, when R = 20, C = 1, λ = 1.2, μ = 1.5, η = 0.6, θ = 0.8, ξ = 1
图4. 完全不可见情形下的社会收益,当R = 20,C = 1,λ = 1.2,μ = 1.5,η = 0.6,θ = 0.8,ξ = 1
3. 数值例子
在本节中,我们提出了一些数值分析来研究社会最优加入概率的敏感性顾客和系统参数的社会最优收益。我们分析两个信息水平下最优策略下的社会收益。在图5,当λ超过一定的值时,社会收益会先增加,原因是到达率λ较小时,顾客的等待时间更短,这使得社会收益提高。而当到达率λ变大时,由于顾客的不断到达,系统会造成拥堵,此时顾客的等待时间会相对延长,那么社会收益就会开始下降,且对几乎不可见情况影响较大。图6和图7表明社会收益总是随着服务率μ和休假率θ而增加,这是直观的。这是因为顾客个人的收益变大了,社会收益也提高了。图8表明社会收益是与延迟时间ξ相关的,并呈现略微下降的趋势。这是因为较短的延迟时间会导致过多的顾客进入假期,从而导致系统拥塞并降低社会收益。图9表明社会收益是与工作休假的服务率η相关的,但社会收益随着工作休假的服务率η增大而有减小的趋势,但是对于几乎不可见影响较小,可以认为稳定,而对完全不可见影响较大,此时服务器应选择合适的η。
从这些参数的变化,我们可以发现在正常情况下
,但同时我们也能发现,有些参数不是越大越好(例如λ)或越小越好(例如η),若参数选取的不恰当,很有可能会造成负的社会收益。所以为了得到更多社会收益,系统管理者可以适当地向顾客披露服务器的状态信息。
最后,我们关注延迟工作休假。以完全不可见队列为例,进行延迟工作休假和普通休假这两种机制的比较工作,主要对比哪种机制在控制平均队列长度和提高社会收益方面效果更好。图10表明无论是哪种机制平均队列长度
都相对于q增加,并且社会收益
先增加后减少并且有一个最大值,如图11。另一方面,图10和图11表明普通假期的队列的平均排队长度总是小于延迟工作假期的队列,延迟工作假期的队列的社会收益总是小于普通假期的队列。

Figure 5. Social welfare, when R = 20, C = 1, μ = 1.5, η = 0.6, ξ = 1, θ = 0.8
图5. 社会收益,当R = 20,C = 1,μ = 1.5,η = 0.6,ξ = 1,θ = 0.8

Figure 6. Social welfare, when R = 20, C = 1, λ = 1.2, η = 0.6, ξ = 1, θ = 0.8
图6. 社会收益,当R = 20,C = 1,λ = 1.2,η = 0.6,ξ = 1,θ = 0.8

Figure 7. Social welfare, when R = 20, C = 1, λ = 1.2, μ = 1.5, η = 0.6, ξ = 1
图7. 社会收益,当R = 20,C = 1,λ = 1.2,μ = 1.5,η = 0.6,ξ = 1

Figure 8. Social welfare, when R = 20, C = 1, λ = 1.2, μ = 1.5, η = 0.6, θ = 0.8
图8. 社会收益,当R = 20,C = 1,λ = 1.2,μ = 1.5,η = 0.6,θ = 0.8

Figure 9. Social welfare, when R = 20, C = 1, λ = 1.2, μ = 1.5, ξ = 1, θ = 0.8
图9. 社会收益,当R = 20,C = 1,λ = 1.2,μ = 1.5,ξ = 1,θ = 0.8

Figure 10. Queue length in delayed working vocations and normal vocations, when R = 20, C = 1, λ = 1.2, μ = 1.5, η = 0.6, θ = 0.8, ξ = 1
图10. 延迟工作休假与普通休假排队的队长,当R = 20,C = 1,λ = 1.2,μ = 1.5,η = 0.6,θ = 0.8,ξ = 1

Figure 11. Social welfare in delayed working vocations and normal vocations, when R = 20, C = 1, λ = 1.2, μ = 1.5, η = 0.6, θ = 0.8, ξ = 1
图11. 延迟工作休假与普通休假排队的社会收益,当R = 20,C = 1,λ = 1.2,μ = 1.5,η = 0.6,θ = 0.8,ξ = 1
我们又对比了Tian [17] 学者研究出的延迟休假的平均队长和社会收益发现,延迟休假是优于普通休假的,这是因为在假期排队时,当系统是空的,服务器立即开始休假,顾客等待更长的时间和更大的等待成本,同时在延迟休假的队列中,系统空了之后到达的一些顾客在延迟时间内得到服务。但本文发现普通休假优于延迟工作休假。综合表明,我们给予系统一个延迟时间然后再休假是合理且高效的,但是休假期间如果维持低速率服务,那么实际上,它的平均队长会更长,社会收益会更低,甚至还不如普通的休假。总而言之,延迟休期在一定程度上缓解了系统拥堵问题,增加了社会收益,但延迟工作休假会减少社会收益。
4. 结论
在本文中,我们讨论了在几乎和完全不可见的M/M/1延迟工作假期排队系统中服务器的社会最优策略。我们在两种不同的情况下获得稳态性能指标和社会收益,用数值例子比较了在几乎可见和完全不可见的情况下各种参数对社会最优策略的影响,表明,我们给予系统一个延迟时间然后再休假是合理且高效的,从中观察到系统信息的披露对系统管理者有一定的好处。此外更为推广的研究是相对应的非马尔可夫队列。