1. 引言
重症疾病(例如癌症)的相关医疗资源的优化配置和最优控制是医疗资源合理配置和使用的重要组成部分,随着中国经济的不断发展,医疗资源的发展水平也是衡量社会发展的重要组成部分。随着现代医疗管理水平的提高,医疗设备的购买,医疗人力资源的分配逐步走向精细化管理。针对重症(例如癌症)疾病患者,其在住院等待期间、手术期间和化疗期间所需求的医疗资源都是非常昂贵的。每多设计一个需要的床位所带来的医疗成本都是巨大的。另一方面,尽可能满足病人的需求也是医疗资源合理设计和使用的关键。不同于只从医院的角度出发来降低成本,或者只从病人角度出发无限量增加医疗资源,从资源社会最优利用的角度对重症医疗资源的最优设计和控制提出了更高的要求。如何对一个病人到达速率和治疗时间均具有随机性的重症医疗系统进行最优设计和控制?针对上述问题,本文将综合利用排队理论、马尔可夫报酬过程理论和排队博弈理论来进行分析研究。利用排队理论,也称随机系统服务理论可以刻画具有随机性的重症医疗系统,并通过到达过程的随机性和病人在手术和化疗阶段的随机性反应出实际真实的场景。利用马尔可夫随机系统的稳态分析得到系统的各项性能指标,例如在手术室前期准备和化疗室前期准备的病房中等待的病人数量的均值,进而确定最优的病床数及其相关的医疗资源的需求量。在医疗资源确定的重症医疗系统中,需要根据病人病情的严重程度来确定相关病人进入该重症医疗系统的准入率。通过病人均衡速率的控制,降低病人的损失,即没有通过事先沟通,到达医院后被迫转院或者只能接受部分治疗而带来的巨大的健康和经济损失。
本文主要关注一个二阶段的重症医疗随机服务系统。随机到达的重症病人到达时均需要床位,在分配好床位之后,病人需要依次通过两个治疗步骤:手术和化疗。因为重症病人入院初始情况和手术后的治疗情况均不相同,因此,这两个治疗步骤所花费的时间也具有随机性。如图1所示,该二阶段随机系统可以由一个具有双服务台的排队系统来描述和刻画。

Figure 1. Two-stage intensive care queueing system
图1. 二阶段重症医疗排队系统
在该重症医疗系统中,不同部门的医生需要在手术或者化疗治疗间隙开会,讨论和确定病人的下一步治疗方案。由于手术阶段往往比化疗阶段更加繁忙,因此,当手术部门处于全空的状态时,化疗部门的部分医务人员会和手术部门的医务人员联合开会和讨论,此时化疗部门的服务速率会低于常规的服务速率。
重症医疗资源的设计是医疗资源设计的重要组成部分,长期以来得到众多研究者的关注。下面从重症医疗资源的需求现状、重症医疗资源的优化设计方法和重症医疗资源均衡使用及相关扩展性研究对现有文献加以简述。重症(癌症)对医疗资源的需求仍然是非常大的,包括术前术后高配置病房、手术阶段和化疗阶段对医务人员及相关医疗资源的需求 [1] [2] [3] 。在医疗资源设计方面,主要利用大数据和统计模型来对现有的医疗资源进行宏观分析并提出相关建议 [4] 。基于统计模型,估算全国不同地区的城市与农村在增加一定医疗资源后,病人看病难的问题会得到多大程度的缓解 [5] ,以及基于不同的地址位置来研究医疗资源的优化配置 [6] 。医疗资源的优化配置和使用依然是当前的研究热点。在医疗资源已经确定的情形下,研究主要集中在如何最优地使用资源,例如手术室和其他医疗资源的优化分配使用 [7] [8] [9] [10] ,以及考虑存在交通时间的跨区域就医调度优化问题 [11] 。
与现有的研究相比,本研究的特色主要体现在:a) 利用随机服务系统模型,构建了需要两阶段治疗方式的重症医疗系统;b) 通过基于具有乘积解的扰动排队系统的马尔可夫报酬过程,在病人到达率给定的情况下,实现了对每个阶段随机系统中病人数量期望的快速逼近;c) 通过排队博弈论建立收益损失模型,在给定的收益、损失参数下,确定系统的均衡加入率,从而实现对系统的最优控制,完整的解决了重症医疗系统的最优设计和控制问题。
2. 重症病人的排队治疗模型
排队系统是刻画具有随机性的服务系统的首选模型。本文首先建立二阶段排队模型。以重症中的癌症为例,统计检验表明病人的到达过程一般为泊松过程,因此,本文假设病人的到达过程是速率为
的泊松过程。如图1所示,在病人到达重症医疗系统时,如果第一阶段(手术阶段)的服务台是空的,病人可以立即接受手术治疗。如果病人达到时发现第一阶段(手术阶段)的服务台处于忙碌状态,则病人需要在手术前的高配置病房住院等待。假设手术台每次只能同时处理一名病人,在实际问题中系统可能拥有多个手术室,但是在建模过程中,可以通过成倍数的提高服务速率来模拟现实中的多个手术室。在病人完成手术治疗后,将进入第二阶段(化疗阶段)。当病人手术结束后达到第二阶段(化疗阶段)时,如果第二阶段(化疗阶段)的服务台是空的,病人可以立即接受化疗治疗。如果病人到达时发现第二阶段(手术阶段)的服务台处于忙碌状态,则病人需要在手术后、化疗前的高配置病房住院等待。类似的,假设化疗室每次只能同时处理一名病人,在实际问题中系统可能拥有多个化疗室,但是在建模过程中,可以通过成倍数的提高服务速率来模拟现实中的多个化疗室。假设病人在第一阶段(手术阶段)的治疗时间是参数为
的指数随机变量,在第二阶段(化疗阶段)的治疗时间是参数为
的指数随机变量。由于手术阶段往往比化疗阶段更精细更复杂且消耗更多人力物力,因此,本文假设手术阶段的服务率要小于化疗阶段的服务率,即
。另外,如前文所述,当手术部门处于全空状态时,即没有病人需要处理时,化疗部门的部分医务人员会和手术部门的医务人员联合开会和讨论,因此,当随机系统第一阶段为空时,第二阶段的治疗时间为参数为
的指数随机变量且满足
,易验证 [12] ,系统的稳定性条件为
。用i表示在第一阶段(手术阶段)中的病人数,其中
,该人数包含可能正在手术室接受手术的人数。用j表示在第二阶段(化疗阶段)的人数,其中
,该人数包含可能正在接受化疗的人数。通过模型描述,易知 [13] 可以用一个二维连续时间马尔可夫链来刻画以上定义的二阶段重症医疗排队系统,该二维马尔可夫链的状态空间S为第一象限内的格点,即
。
2.1. 转化成二维随机游动问题
为了求解该二维连续时间马尔可夫链,本文首先对该连续模型进行离散化处理。不失一般性,假设
,这是因为如果
,可以选择满足
的一致化系数X对系统进行一致化处理,即令所有的转移速率除以一致化系数来得到对应的等价二维离散马尔可夫链,即二维随机游动问题 [13] 。因此,如图2所示,本文把原二阶段重症医疗系统问题转化成了一个二维随机游动问题,并定义该随机游动为R。

Figure 2. The corresponding two-dimensional random walk of the two-stage intensive care queueing system
图2. 二阶段重症医疗排队系统对应的二维随机游动
2.2. 判断二维随机游动是否具有乘积解
对二维随机游动的稳态分布直接求解的难度是非常大的。目前直接求解最新的结果是将二维随机游动的稳态分布表示成一个黎曼边界问题的解 [14] [15] ,但是该结果不具有显示的表达式,且很难应用在具体计算中。因此,本文主要考虑一种特殊形式的系统稳态分布,乘积解,用
表示系统达到稳定的情形下,系统中的第一阶段(手术阶段)中有i个病人,同时第二阶段(化疗阶段)中有j个病人的概率。如果该二维随机游动具有乘积解,则系统的稳态概率可以表示为:
(1)
其中
由概率分布的归一性确定。首先来分析二维随机游动R的稳态分布是否为乘积解。
定理1二维随机游动R的稳态分布不具有乘积解形式。
证明二维随机游动R的状态为第一象限内的格点,各状态需要满足如下平衡方程:
当
,稳态概率需要满足状态空间内部的平衡方程:
(2)
当
,稳态概率需要满足x轴上的平衡方程:
(3)
当
,稳态概率需要满足y轴上的平衡方程:
(4)
原点的平衡方程由式(2)~(4)可以验证。如果二维随机游动的稳态概率为乘积解,将式(1)乘积解带入到平衡方程(2)可得
(5)
代入到第平衡方程(3)可得
(6)
联立式(5)与式(6),解得,
,
,将该稳态分布代入式(4),其中令
且
,由式(4)推导出
,这与系统稳定性条件矛盾,所以当
时,二维随机游动R的稳态分布不具有乘积解形式。
因为二维随机游动R的稳态分布不具有乘积解形式,因此不能直接计算各类性能指标,例如在第一阶段系统中的平均病人数和第二阶段系统中的平均病人数。因此,接下来,本文将介绍使用具有乘积解的扰动的随机游动和基于马尔可夫报酬过程的逼近策略来得到二维随机游动R的各项性能指标的逼近。
2.3. 基于马尔可夫报酬过程的性能指标的逼近
本文使用基于马尔可夫报酬过程的逼近策略 [16] [17] 。具体来说,基于具有乘积解的扰动的随机游动,本文构造依赖于二维随机游动R中每个状态可能的转移概率的马尔可夫报酬过程,然后将其转化成一个线性规划来得到满足约束条件的最紧的上下界控制函数,进而得到各项性能指标最优的逼近。该方法可以用来计算我们关心的任意一个系统性能指标,包括系统为空的概率、第一阶段系统的平均人数和第二阶段系统的平均人数等。本文用G表示我们关心的某一系统性能指标:
(7)
由于基于马尔可夫报酬过程的逼近策略 [16] [17] 中方法的线性假设,定义非负函数
,如下
其中常数
就可以定义各项性能指标。例如,如果要计算系统为空的概率则定义
,其它的常数都为0。如果要计算第一阶段系统的平均人数,则定义
,其它的常数都为0。如果要计算第二阶段系统的平均人数,则定义
,其它的常数都为0。
最后,为了使用基于马尔可夫报酬过程的逼近策略 [16] [17] ,本文仍需要找到一个扰动的随机游动。与二维随机游动R相比,该扰动的随机游动中的转移概率只能在x轴和y轴上的状态发生变化。利用定理1证明中的平衡方程,如果选择
,易验证,则该扰动的随机游动,本文称之为
,的稳态分布为乘积解
(8)
其中
,
。利用基于马尔可夫报酬过程得到的线性规划 [16] [17] ,可以计算出二阶段重症医疗排队系统中第一阶段平均病人数的上界
和下界
,以及第二阶段平均病人数的上界
和下界
。因为在系统设计中,总是需要考虑较差的情形,因此在二阶段重症医疗排队系统中第一阶段需要配备的床位数为
,第二阶段需要配备的床位数为
。两个上界都需要减1是因为需要排除正在接受手术和正在接受化疗的病人,除了床位,医疗系统还需要配备与床位数相匹配的医护人员和医疗器械、药品等资源。
接下来,本文考虑当二阶段重症医疗系统中的医疗资源已经确定配置好的情形下,应该如何根据病人的实际情况控制病人的到达率以达到系统性能最优。
3. 控制病人到达率的最优策略
在实际重症医疗系统中,到达到该重症医疗系统的病人的情况一般都是较严重的。因此,如果当病人到达时发现第一阶段(手术阶段)没有床位,且在第二阶段(化疗阶段)有空余床位时,病人将跳过第一阶段先进入第二阶段,在高配置床位接受保守治疗及等待化疗控制病情。该决定是与病人情况比较严重,往往需要高配置病房立即进行支持治疗密切相关。因为公共医疗资源除了盈利之外还承担有重大的社会责任,当病人到达时发现第一阶段或者第二阶段都满员而被迫在该医疗系统减少治疗程序和被迫转院都会带较大的损失。另外,本文所考虑的二阶段重症医疗系统往往是一个城市医疗资源的某一部分,因此,在已知每个系统资源固定的情形下,可以根据病人具体的严重程度来调控每一个具体医疗系统的病人到达率,尽量降低让病人随机访问某一医疗系统时发现没有床位而造成的损失。
基于排队博弈论 [18] [19] ,本文从收益损失的角度构建模型来找到系统到达率的最优均衡策略。本文所考虑的为具有较好医疗资源的重症医疗系统,由于病人对高级医疗资源的需求仍然是巨大的,所以病人接受跳过满员的阶段而先接受下一阶段的治疗,或者整个系统都满员时再寻找其他的医疗资源完成治疗。病人在每个阶段都有因为系统满员而被拒绝的风险,该损失将会由损失函数来刻画。接下来先介绍如图3所示具有满员就跳过排队准则的二阶段重症医疗排队系统。
3.1. 满员就跳过排队准则
具有满员就跳过准则的二阶段重症医疗排队系统的稳态分布为乘积解 [20] ,但是该系统的乘积解与上一节扰动的随机游动的乘积解不同,该系统的乘积解中的归一化系数会发生改变。令两个阶段能容纳的最大病人数量分别为
,
,因为手术室和化疗室均能再容纳1位病人。易验证,具有满员就跳过准则的二阶段重症医疗排队系统的稳态分布
为
(9)
其中,
,
,
,
。此时的到达率
为可以变化且可以动态调整的,注意到在该系统中,虽然两个阶段并不独立,但是仍然具有乘积解的形式。接下来计算每个阶段中病人

Figure 3. Two-stage intensive care queueing system with “overtake full stations” protocol
图3. 具有满员就跳过准则的二阶段重症医疗排队系统
数的稳态概率,该稳态概率即为具有满员就跳过准则的二阶段重症医疗排队系统的稳态联合分布的边际概率。因此,对第一个阶段来说,系统里有i位病人,
,的稳态概率为
(10)
此时,第一阶段系统中的平均队长为
(11)
对于第二阶段来说,系统里有j位病人,
,的稳态概率为
(12)
此时,第二阶段系统中的平均队长为
(13)
3.2. 收益函数
每当一位病人成功的进入系统并在各个阶段完成治疗将会形成系统的收益,即系统的收益由二阶段随机系统每个阶段所处理的平均病人数所决定。这是因为只有当医疗资源被使用时,我们才会认为实现了医疗资源的社会和经济效益。定义单位时间内第一阶段(手术阶段)每位病人的收益为
,单位时间内第二阶段(化疗阶段)每位病人的收益为
,则单位时间内具有满员就跳过准则的二阶段重症医疗排队系统的平均收益R为到达率
的函数:
(14)
3.3. 损失函数
在每一阶段,病人能否进入系统的概率可由PASTA原理(Poisson arrivals see time average)确定 [21] 。因此,当到达为泊松过程时,病人在第一阶段(手术阶段)被拒绝加入的概率为
,其中
,即在病人到达时,该阶段所有的等待床位和手术室均被占用的概率。虽然第一阶段(手术阶段)的离开过程不是泊松过程,但是因为该二阶段重症医疗系统是稳定的,所以第一阶段离开过程的平均速率依然是
。且因为该系统的稳态分布为乘积解,因此,可以近似的认为第一阶段的离开过程,即第二阶段(化疗阶段)的到达过程仍然为速率为
的泊松过程。此时,病人在第二阶段(化疗阶段)被拒绝加入的概率为
,其中
,即在病人到达第二阶段时,该阶段所有的等待床位和化疗室均被占用的概率。如果顾客在第一阶段(手术阶段)被拒绝,此时的损失为
,如果顾客在第二阶段(化疗阶段)被拒绝,此时的损失为
。针对病情状况不同的病人,该损失参数是不同的。易验证,单位时间重症医疗系统因为病人被拒绝加入而带来的损失C为到达率
的函数:
(15)
3.4. 病人到达率的控制策略
由系统的收益和损失函数,本文定义单位时间内系统的平均收益为
,其中
。因为系统是通过控制病人的到达率来优化整体收益,所以此时系统单位时间的平均收益为到达率
的函数。
定理 2若系统的整体收益为正,则病人到达率
需要满足,
(16)
其中
,
。
证明易验证,单位时间内系统的平均收益
为
若系统的整体收益为正,则系统中病人的到达率需要满足
。
接下来分析单位时间平均收益函数
为
的单峰函数。当二阶段重症医疗系统中病人的到达率从0开始增加时,系统单位时间的平均收益会逐渐增加,在增加到一定值时,当病人到达率继续增加,因为病人被重症医疗系统拒绝的概率将不断增大,系统的损失也将增大。因此,单位时间系统的收益函数
是关于病人到达速率
的一个单峰函数。
4. 数值分析
本节将利用数值实例,利用本文提出的模型确定重症医疗系统最优容量和最优病人到达率来验证模型的有效性。
4.1. 确定重症医疗系统最优容量
令二阶段重症医疗排队系统中
,因为此时
,可以利用一致化得到等价的离散的二维随机游动。利用具有乘积解的扰动的随机游动和基于马尔可夫报酬过程的逼近策略计算可得:
.
因此,为了考虑到较坏的情形,向上取整确定
。
4.2. 确定病人到达率的均衡
在上节所讨论的数值实例中,当该重症医疗系统的资源已经确定时,即已知
时,利用收益损失模型确定病人到达率的均衡。因为第一阶段(手术阶段)对病人的效果更显著,因此,在该阶段的收益和被拒绝加入该阶段的损失参数均大于第二阶段(化疗阶段)中相应的参数,在图4(a)中,令收益损失参数取值如下
,可得,当到达率
从0开始不断增大时,系统单位时间的收益函数如图4(a)所示。易知,当病人的到达率
时,系统的收益最大,该到达率即为系统中病人到达率的均衡。在实际问题中,对于不同疾病种类和病况的病人,收益损失参数可能是不同的,例如当收益损失参数取值为
时,由图4(b)可知,在该情形下,当病人的到达率
时,系统的收益最大。由图4中的数值实例可得,虽然当收益损失参数发生变化时,均衡到达率会发生变化,但是收益函数均为单峰函数且存在最大值。

(a)
(b)
Figure 4. System revenue when patients’ arrival rate
increases
图4. 当病人达到率
增加时系统的收益
在全地区医疗系统优化控制中,针对该二阶段重症医疗系统的到达率应该调节到到达率均衡附近,避免重症医疗系统太空或者太多重症病人被拒绝入院而带来过大的损失。
5. 结束语
通过建立二阶段重症医疗排队系统,刻画了具有随机性的医疗服务系统。使用具有乘积解的扰动的二维随机游动,利用马尔可夫报酬过程得到系统中每个阶段的平均病人数量,进而确定最优的医疗资源设计。在医疗资源确定的情形下,基于排队博弈理论建立收益损失模型来得到系统最优的病人到达率,从而实现对该随机系统的最优控制。实例分析不仅表明新模型在实践中具有可行性,而且说明了基于该排队模型的计算方法是有效的。基于排队模型的重症医疗系统的最优设计与控制可为相关医疗服务系统的优化设计与控制提供新的理论支持。部分可行的后续研究包括:a) 在医疗资源确定的情形下,针对特殊的假设,推导出病人最优到达率的显式表达式;b) 把二阶段重症医疗系统模型推广到多阶段重症医疗系统模型;c) 考虑排队网络模型,建立有合作的多个交互式二阶段重症医疗排队系统,并找到在基于复杂排队网络模型下的医疗资源的最优设计与控制。
基金项目
本研究由国家自然科学基金青年项目(71701066)和上海理工大学管理学院2021年度科研启动项目(KYQD202101)资助。