随机参考价格影响下带成本约束的库存系统
Cost-Constrained Inventory System under the Stochastic Reference Price Effect
DOI: 10.12677/orf.2024.142170, PDF, HTML, XML, 下载: 50  浏览: 75 
作者: 黄晓燕, 徐海燕, 卢相刚:广东工业大学数学与统计学院,广东 广州
关键词: 库存系统约束最优性随机参考价格粘性解Inventory System Constraint Optimality Stochastic Reference Price Viscosity Solutions
摘要: 本文深入探讨了制造商在考虑随机参考价格效应的情况下,对生产和定价做出最佳决策的问题。我们将其表述为随机控制问题,目的是在成本约束下最大化净利润函数。首先,为了解决约束优化问题,我们可以利用拉格朗日乘子方法将其转换为无约束问题。通过动态规划方法和粘性解方法,本文研究结果揭示了无约束问题的值函数是汉密尔顿–雅可比–贝尔曼(HJB)方程的唯一粘性解。然而,HJB方程难以得到显式解,我们利用有限差分理论和随机递归算法建立了合适的数值近似方案。我们证明了HJB方程的有限差分方案的收敛性,并证明了该方案的解收敛于HJB方程的解。此外,我们通过确定适当的拉格朗日乘子,在约束问题的最优解和无约束问题的最优解之间建立联系。最后,我们进行了数值实验并分析了关键参数的灵敏度。我们的实验结果可以为制造商提供库存和定价的参考。
Abstract: This paper delves into the manufacturer’s problem of making optimal decisions regarding production and pricing, taking into account the stochastic reference price effect. We formulate it as a problem of stochastic control, of which the aim is to maximum the net profit function subject to the cost constraint. First, to tackle a constrained optimization problem, we can utilize the Lagrange multiplier method to convert it into an unconstrained problem. Through the dynamic programming approach and the viscosity solutions method, our findings reveal that the value function of the unconstrained problem serves as the unique viscosity solutions to the Hamilton-Jacobi-Bellman (HJB) equation. However, the HJB equation is difficult to obtain an explicit solution, we use finite difference theory and stochastic recursive algorithm to establish a suitable numerical approximation scheme. We demonstrate the convergence of the finite difference scheme of the HJB equation and demonstrate that the solution of the scheme converges to the solution of HJB equation. Additionally, we establish a connection between the optimal solutions of the constrained problem and the unconstrained one by identifying an appropriate Lagrange multiplier. Finally, we carry out the experiments and analyze a sensitivity of the key parameters. The results of our experiments can provide manufacturers with references of inventory and pricing.
文章引用:黄晓燕, 徐海燕, 卢相刚. 随机参考价格影响下带成本约束的库存系统[J]. 运筹与模糊学, 2024, 14(2): 672-689. https://doi.org/10.12677/orf.2024.142170

1. 引言

库存问题是管理科学中人们关注的热点问题之一。在二十世纪初,F.W. Harris提出了经济订货量模型(EOQ),开创了现代库存理论的研究 [1] 。基于需求函数的分类,存在两种普遍的库存管理模型:确定型和随机型。例如,Serrano等人研究了一种库存模型,该模型的功能包含各种库存成本和需求确定性 [2] 。Hsieh和Dye认为零售商以确定性需求出售单个商品 [3] 。一般来说,产品的需求不是恒定的,而是由于外部原因而随着时间的推移而波动。Güler等人在文献 [4] 中研究了同时管理经历随机需求和参考效应的单一产品的库存和价格策略的问题。文献 [5] 通过在随机框架中最小化预期成本来优化订单数量,其中对产品的需求受到不确定性的影响。Zhou等人考虑了一个涉及价格和库存的管理系统,其中代表了需求的随机性 [6] 。以往关于定价的研究表明,除了产品的零售价格外,参考价格对消费者需求也有显著影响。Chenavaz认为如果消费者受到参考价格的高度影响,那么需求中的价格敏感程度就会上升。如果产品的价格低于参考价格,那么我们倾向于购买它,需求也会相应增加 [7] 。相关研究证实,参考价格会影响需求和盈利能力 [8] 。因此,在有消费者受参考价格影响的情况下,建议零售商采取降价政策 [9] 。文献 [10] 表明参考价格的发展涉及一定程度的随机性,这反映了消费者之间的多样性或外部因素,这些因素可以影响消费者对价格的记忆方式。Cao和Duan研究了制造商如何应对动态管理生产和定价过程的挑战,同时考虑随机参考价格效应 [11] 。

许多文献经常使用动态规划方法来解决库存问题。例如文献 [12] 中研究了一个最优控制问题,该问题涉及有限时间段内产品的动态定价策略,他们考虑的需求函数与产品价格呈线性关系,并随时间变化。Cao和Duan通过动态规划原理研究了制造商的生产和定价问题 [11] 。但是,如果控制问题中存在成本约束,则动态规划方法可能就无法求解该问题。成本约束的控制问题已被广泛研究。例如,Crow等人在 [13] 提出了一种降低充电成本的解决方案,目的是获得具有成本约束的电动汽车的最佳充电方法。王妍怡 [14] 在考虑库存持有成本和缺货惩罚成本的情况下,构建了基于供应商和零售商的基准库存水平的成本函数,在此基础上分别比较了集中决策和分散博弈下的最优情况。刘子伟 [15] 通过使用连续和离散充电速率的日前静态和实时动态框架,以减轻车辆充电引起的配电线路过载,提出的解决方案侧重于填谷和降低充电成本,是基于成本约束的动态最优电动汽车充电。一些研究使用众所周知的技术方法,例如拉格朗日乘子法。通过使用拉格朗日乘子将约束纳入目标函数,Mendoza-P’erez等人将问题转换为无约束优化问题。这涉及引入一个额外的变量,称为拉格朗日乘子,它允许将原始问题的约束纳入目标函数中 [16] 。Lu等人以库存管理为背景,采用相似的方法来处理约束控制问题 [17] 。

人们对库存管理系统的研究已经非常丰富。一些文献研究确定性或随机模型,一些文献考虑参考价格。本文受文献 [11] 的启发,研究了随机参考价格和成本约束下的联合生产和定价问题,具有意义和实用性。该研究论文重点探讨了制造商遇到需求不确定时生产和价格策略的同步调整以及参考价格的影响。由于成本函数有一个上限,类似于 [16] 和 [18] 中的方法,我们利用拉格朗日乘数的方法求解约束优化问题。如果拉格朗日乘子保持不变,则可以使用动态规划来解决问题。

然而,使用传统的标准动态规划方法获得封闭解的方法行不通。使用文献中 [17] 的方法作为参考,我们通过近似方案克服了这一困难。我们采用有限差分法、随机递归算法建立了合适的数值逼近算法。对于HJB方程的有限差分数值方案,证明了其收敛性,并证明了该方法得到的解收敛于值函数。我们开发了一种双环近似方法来估计控制策略和最优值函数。此外,我们推导出了约束问题和无约束问题之间的关联。它包括内部和外部近似值。内部逼近法是一种基于固定的拉格朗日乘子参数计算最优策略的数值方法。相反,外部近似法是一种随机方法,用于确定最佳拉格朗日乘子。从本质上讲,我们使用内部迭代来估计给定固定拉格朗日乘数的最优值函数。首先我们得到最优控制,然后通过运行随机逼近算法进一步改进估计。此外,我们分析了主要参数的灵敏度。本文的核心内容是:1) 建立基于成本约束和随机参考价格的库存管理最优控制模型。2) 提出了一种双环近似算法,旨在提供最优控制和值函数的估计。3) 我们对主要参数进行敏感性分析,并给出库存和定价策略的参考。

本文的其余部分按以下方式组织。第2节是关于建立最优控制模型。在第3节中,我们引入了拉格朗日乘子来解决约束优化问题。在第4节中,我们解释了约束的最优控制问题,并提出了近似方法。在第5节中,我们通过一些数值算例和参数敏感性分析,说明了该算法如何获得最优库存策略的近似值。

2. 构建最优控制问题

我们的模型涉及垄断制造商,其目标是生产特定商品并通过分销商销售。在销售过程中,经销商的参考价格会受到随机波动的影响。我们的目标是在无限的时间范围内尽可能地提高公司的净利润,并且时间t是连续的。

我们考虑商品的参考价格及其库存水平,与文献 [11] 、 [19] 和 [20] 类似,我们的假设是需求率函数受线性和加性参考价格效应的影响。需求率函数为 D ( p , r ) ,它取决于产品价格 p 和参考价格 r ,可以描述为:

D ( p ( t ) , R ( t ) ) = a b p ( t ) + γ ( R ( t ) p ( t ) ) (1)

我们用 a ( a < ) 表示平均市场潜力, b ( b < ) 表示需求对价格的敏感性。 γ ( R ( t ) p ( t ) ) 反映了参考价格效应,其中 γ 表示参考价格效应的大小。消费者的总需求 Q ( t ) 是一个随机过程,因为 d Q ( t ) = D ( p ( t ) , R ( t ) ) d t σ d Y 1 ( t ) ,其中 Y 1 ( t ) 是维纳过程。参考价格的等式写成以下等式:

d R ( t ) = β ( p ( t ) R ( t ) ) d t + ε R ( t ) d Y 2 ( t ) , R ( 0 ) = r , t 0 (2)

β 表示内存参数参考价格,随机参考价格的波动率用平方根扩散项 ε R ( t ) 来表示。此外,维纳过程 Y 1 ( t ) Y 2 ( t ) 是相互独立的。是库存水平。连续时间内库存的动态受生产率和需求率的影响,并遵循 I t o ^ 随机微分方程。结合公式(1)和(2),其中u代表生产率, ( u ( t ) ( a b p ( t ) + γ ( R ( t ) p ( t ) ) ) ) 解释了库存水平的即时波动。 σ d W ( t ) 表示扰动,它来自随机需求过程。上述库存动态修改为以下形式

d X ( t ) = ( u ( t ) D ( p ( t ) , R ( t ) ) ) d t + σ d Y 1 ( t ) , X ( 0 ) = x , t 0 (3)

然后,我们提出了随机最优控制的问题,其中 E ( ) 表示期望算子, ρ > 0 为贴现因子,假设 C ˜ ( u ) 为生产成本, H ˜ ( x ) 为库存成本,它们是二次连续可微分的,严格凸,有上界。净利润函数可以为

E 0 e ρ t [ p ( t ) d Q ( t ) ( C ˜ ( u ( t ) ) + H ˜ ( X ( t ) ) ) ] d t (4)

考虑上面的方程,方程(4)可以改写为

E 0 e ρ t [ p ( t ) ( a b p ( t ) ) + γ ( R ( t ) p ( t ) ) C ˜ ( u ( t ) ) H ˜ ( X ( t ) ) ] d t (5)

因为 E 0 e ρ t p ( t ) σ d Y 1 ( t ) = 0 .

我们提出了一个优化控制问题,目的是从一组可容许的控制中找到生产率和产品价格的最优路径 ( u * ( ) , p * ( ) ) 。对于每一个t,控制变量 u ( t ) p ( t ) 取集合 U = [ 0 , ) × [ p _ , p ¯ ] 中的值。 S = ( , ) × ( 0 , ) 是状态空间。注意, p _ p ¯ ( p ¯ > p _ > 0 ) 分别表示价格的下界和上界。基于 ( x , r ) S 的初始值,我们设置 ( u ( ) , p ( ) ) 。如果 ( u ( t ) , p ( t ) ) U ,那么对于任何 t 0 ,并且 ( u ( ) , p ( ) ) F t = σ { X ( s ) , R ( s ) , R ( s ) : s t } 可适的。所有容许集都可以表示为A。然后方程(5)变为:

max ( u ( ) , p ( ) ) A E 0 e ρ t [ p ( t ) ( a b p ( t ) ) + γ ( R ( t ) p ( t ) ) C ˜ ( u ( t ) ) H ˜ ( X ( t ) ) ] d t (6)

对于给定的 θ > 0 ,其中成本约束是

E { 0 e ρ t [ C ˜ ( u ( t ) ) + H ˜ ( X ( t ) ) ] d t } θ . (7)

但是, u ( ) p ( ) 属于可测函数的集合,无紧密性。接着我们采用松弛控制框架,将可测量空间嵌入到更大的空间和适当的紧密性中。然后我们假设在 ( U ) × S 上, Π ( U ) 是所有平稳随机核 π 的集合。对于每一个 ( x , r ) S π ( | ( x , r ) ) π ( U | ( x , r ) ) = 1 可测的,对于每个 J ( U ) π ( J | ( x , r ) ) ( S ) 可测的。

因此,值函数为

V ( x , r , π ) : = sup π Π ( U ) N ( x , r , π ) (8)

我们的目标是使期望目标最大化,并且得到确定的控制 π * ,总净利润为

N ( x , r , π ) : = E { 0 e ρ t U [ p ( t ) ( a b p ( t ) ) + γ ( R ( t ) p ( t ) ) C ˜ ( u ( t ) ) H ˜ ( X ( t ) ) ] π ( d u , d p | ( X ( t ) , R ( t ) ) ) d t } . (9)

同样地,我们可以得到成本函数表达式为

F ( x , r , π ) : = E { 0 e ρ t U [ C ˜ ( u ( t ) ) + H ˜ ( X ( t ) ) ] π ( d u , d p | ( X ( t ) , R ( t ) ) ) d t } . (10)

3. 主要结论

因为成本函数有一个上限,本文采用拉格朗日乘法方法来求解有约束的最优控制问题。

3.1. 拉格朗日乘数法

λ 0 ,对于所有 ( x , r ) S ,并考虑到利润增长率如下

w ( x , r , u , p , λ ) = p ( D ( p , r ) ) C ˜ ( u ) H ˜ ( x ) + λ ( C ˜ ( u ) + H ˜ ( x ) ρ θ ) (11)

然后我们可以定义朗格朗日函数

L ( x , r , π , λ ) : = E { 0 U e ρ t w ( X ( t ) , R ( t ) , u ( t ) , p ( t ) , λ ) π ( d u , d p | ( X ( t ) , R ( t ) ) ) d t } : = E { 0 U e ρ t [ p ( t ) ( D ( p ( t ) , R ( t ) ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ ] π ( d u , d p | ( X ( t ) , R ( t ) ) ) d t } (12)

我们的目标是确定一个策略 π Π ( U ) ,使前面定义的拉格朗日函数最大化。对应的值函数可以表示如下

V ( x , r , π ) : = L ( x , r , π * , λ ) = sup π Π ( U ) L ( x , r , π , λ ) (13)

值得注意的是,当 λ 是固定的时, V ( x , r , λ ) 表示无约束问题的值函数,相关的 π * 作为最优控制。给定 λ 0 ,我们可以通过求解相应的HJB方程来描述值函数 V ( x , r , λ ) 。然后应用随机动态规划方法。具体来说,对于给定的 λ 0 ,可以通过求解HJB方程得到值函数如下

ρ V ( x , r , π ) = max ( u , p ) U { L ( u , p ) V ( x , r , λ ) + p ( D ( p , R ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ } (14)

L ( u , p ) V ( x , r , λ ) : = [ ( u ( D ( p , r ) ) ) V ( x , r , λ ) x + β ( p r ) V ( x , r , λ ) r + 1 2 σ 2 2 V ( x , r , λ ) x 2 + 1 2 ε 2 r 2 V ( x , r , λ ) r 2 ] (15)

3.2. 净利润最大化

在上一节中,我们通过HJB方程得到,当 λ 发生变化时,我们现在应该考虑 V ( x , r , λ ) 的性质。然后对于每个 λ 0 ρ > 0 ,我们定义

Π λ : = { π Π ( U ) | ρ V ( x , r , λ ) = w ( x , r , π , λ ) + L π V ( x , r , λ ) }

其中 w ( x , r , π , γ ) : = U w ( x , r , u , p , λ ) π ( d u , d p | ( X ( t ) , R ( t ) ) ) 。然后我们用 Π λ 中的 π λ 来表示。集合 Π λ 包含了所有产生最优解的松弛控制。因此,我们提出了一个定理。

定理3.1 对于任何 ( x , r ) S ,以及对于每一个 λ 0 V ( x , r , λ ) 相对于 λ 是可微的,并且

V ( x , r , λ ) λ = F ( x , r , π λ ) θ (16)

证明:这里的结果与Mendosa-P’erez等人在 [16] 中的主要结果定理相一致。详细的证明可以在同一篇论文或者 [17] 中找到。根据我们所获得的特性,我们可以确定最优利润获取策略的特征。接下来,我们进一步描述了 λ * ,以建立这两个问题之间的关系。

定理3.2 为进一步证明,每个 ( x , r ) S

(a) 当 λ * = λ * ( x , r ) 0 时,使下式为

V ( x , r , λ ) λ = 0 ,

也就是说, F ( x , r , π λ ) = θ

(i) 每个 π λ * Π λ 最优利润策略的初始问题 ( P θ ) 。(其中随机最优控制问题 ( P θ ) 是净利润 N ( x , r , π ) 最大化)

(ii) 对应于 N ( x , r , π λ * ) V ( x , r , λ ) 是初始利润问题 ( P θ ) 的最优值,并且

V ( x , r , λ * ) = inf λ < 0 V ( x , r , λ )

(b) 当 λ * = 0 π 0 Π 0 满足 F ( x , r , λ * ) θ 时,这表示 Π ( U ) 中的 π 0 ,然后,

(i) 初始利润问题 ( P θ ) 的最优解决方案是策略 π 0

(ii) V ( x , r , 0 ) = N ( x , r , π 0 ) 成为初始利润问题 ( P θ ) 的最优值;

(iii) 此外,

V ( x , r , 0 ) = inf λ 0 V ( x , r , λ )

证明:此证明与 [17] 中的定理3.5相似,在此省略。

3.3. 粘性解和最佳优化控制

在本小节中,我们首先检查 V ( x , r , λ ) 的关键属性。为了方便起见,我们使用实际的反馈控制,而不是放松的控制。值得注意的是,以封闭形式求解HJB方程通常是一项具有挑战性的任务。因此,其中一个已被广泛采用的概念是粘度解。在下一节中,将提供了此解决方案的正式定义。

定义3.3对于每个固定的 λ 0 ,我们称 W 0 ( x , r , λ ) 为粘性解,如果它在S同时满足(i)和(ii)的条件。

(i) W 0 ( x , r , λ ) 是S上公式(14)的上半连续值,并且满足

ρ ϕ ( x 0 , r 0 ) sup ( u ( ) , p ( ) ) A { L ( u , p ) ϕ ( x 0 , r 0 ) + w ( x 0 , r 0 , u , p , λ ) }

对于所有 ϕ ( ) C 2 ( S ) 和所有 ( x 0 , r 0 ) S ,使 W 0 ( x , r , λ ) ϕ ( x , r ) ( x 0 , r 0 ) 处具有最小值。(ii) W 0 ( x , r , λ ) 是S上公式(14)的下半连续值,并且满足

ρ ϕ ( x 0 , r 0 ) sup ( u ( ) , p ( ) ) A { L ( u , p ) ϕ ( x 0 , r 0 ) + w ( x 0 , r 0 , u , p , λ ) }

对于所有 ϕ ( ) C 2 ( S ) 和所有 ( x 0 , r 0 ) S ,使在 ( x 0 , r 0 ) 处具有最大值。

我们利用 V ( x , r , λ ) 的连续性,建立了基于粘性解的HJB方程表达式。这一性质将在第4节所述的有限差分方法的收敛分析中是有必要的。此外,对于固定的 λ ,我们可以给出以 W 0 ( x , r , λ ) ϕ ( x , r ) 下定理。

定理3.4 对于每个固定的拉格朗日乘子 λ 0 ,值函数 V ( x , r , λ ) 是HJB方程(14)在S上的唯一粘性解。

证明:首先,我们证明了 V ( x , r , λ ) 是连续的,类似于 [17] 中的引理3.6。利用动态规划原理可以证明,对于每个停止时间 κ ,最优利润的表达式是由后续参考价格和库存状态下的即时获利和期望值函数的最大值给出的

V ( x , r , λ ) = max π Π ( U ) E { 0 κ e ρ t ( p ( t ) D ( p ( t ) , R ( t ) ) + ( λ 1 ) ( C ˜ ( u ( κ ) ) + H ˜ ( X ( κ ) ) ) λ ρ θ ) d t } (17)

对于给定的 X ( 0 ) = x 0 , R ( 0 ) = r 0 S ,让 ψ ( x , r ) C 2 ( S ) ,以及 V ( x , r , λ ) ψ ( x , r ) 满足它在 N ( x 0 , r 0 , λ ) ( x = x 0 , r = r 0 ) 中达到局部最小值 ( x 0 , r 0 )

V ( x 0 , r 0 , λ ) = E { 0 κ e ρ t ( p ( s ) D ( p ( s ) , R ( s ) ) + ( λ 1 ) ( C ˜ ( u ( κ ) ) + H ˜ ( X ( κ ) ) ) λ ρ θ ) d t } (18)

因为 V ( X ( t ) , R ( t ) , λ ) ψ ( X ( t ) , R ( t ) ) ,所以

E { e ρ κ V ( X ( κ ) , R ( κ ) , λ ) V ( x 0 , r 0 , λ ) } E { 0 κ e ρ t ( p ( s ) D ( p ( s ) , R ( s ) ) + ( λ 1 ) ( C ˜ ( u ( s ) ) + H ˜ ( X ( s ) ) ) λ ρ θ ) d t } (19)

然后

0 E 0 κ { e ρ s L ( u ( s ) , p ( s ) ) ψ ( X ( s ) , R ( s ) ) + w ( X ( s ) , R ( s ) , u ( s ) , p ( s ) , λ ) ρ V ( X ( s ) , R ( s ) , λ ) } d s (20)

并且让 κ 0 ,可得

max ( u , p ) U [ L ( u , p ) ψ ( x 0 , r 0 ) + w ( X ( s ) , R ( s ) , u ( s ) , p ( s ) , λ ) ] ρ V ( x 0 , r 0 , λ ) 0 (21)

因此, V ( x , r , λ ) 是一个粘性上解。 [17] 和 [21] 细节讲述了值函数的唯一性的证明。

4. 优化控制问题的解决方案

目前的问题是涉及到成本约束下的最优控制,为了克服这一挑战,我们设计了一个近似方案,包括有限差分法和随机递归算法。

4.1. 有限差分法

在本节中, λ 是固定的,我们使用一个粘性解来近似 V ( x , r , λ ) 。如前一节所述, V ( x , r , λ ) 是与之相关联的HJB方程的粘性解,即

ρ V ( x , r , λ ) = max ( u , p ) U { ( u ( a b p + γ ( r p ) ) ) V ( x , r , λ ) x + β ( p r ) V ( x , r , λ ) r + 1 2 σ 2 2 V ( x , r , λ ) x 2 + 1 2 ε 2 r 2 V ( x , r , λ ) r 2 + p ( a b p + γ ( r p ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ } (22)

它的哈密顿量是

Η ( x , r , D x V , D r V , D x 2 V , D r 2 ) = max ( u , p ) U { ( u ( a b p + γ ( r p ) ) ) V ( x , r , λ ) x + β ( p r ) V ( x , r , λ ) r + 1 2 σ 2 2 V ( x , r , λ ) x 2 + 1 2 ε 2 r 2 V ( x , r , λ ) r 2 + p ( a b p + γ ( r p ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ } ρ V ( x , r , λ ) (23)

同时我们让

f ( r , a , p ) = u ( a b p + γ ( r p ) ) , g ( r , p ) = β ( p r ) , f + ( r , a , p ) = max ( f ( r , a , p ) , 0 ) , g + ( r , p ) = max ( g ( r , p ) , 0 ) , f ( r , a , p ) = max ( f ( r , a , p ) , 0 ) , g ( r , p ) = max ( g ( r , p ) , 0 ) .

我们称 f + ( g + ) f ( g ) f ( g ) 的正(负)部分。

我们定义

Δ x + V = V ( x + h , r , λ ) V ( x , r , λ ) h , Δ r + V = V ( x , r + h , λ ) V ( x , r , λ ) h , Δ x 2 V = V ( x + h , r , λ ) + V ( x h , r , λ ) 2 V ( x , r , λ ) h 2 (24)

其中, Δ x V Δ r V 的定义方式相同,分别用 x h r h 替换 x + h r + h 。类似地, Δ r 2 V 的定义方式与 Δ x 2 V 类似,在这里省略了。我们用式(24)中 Δ x + V Δ r + V Δ x 2 V Δ r 2 V 来用近似式(22)中的 V ( x , r , λ ) / x V ( x , r , λ ) / r 2 V ( x , r , λ ) / x 2 2 V ( x , r , λ ) / r 2 ,我们依旧选择用 V ( x , r , λ ) ,而非 V m ( x , r , λ ) 。通过用差分部分代替导数部分,我们可以很容易地得到它的HJB方程。对上述公式进行重新整理,得到如下公式

V ( x , r , λ ) = max ( u , p ) U { ( ρ + f + ( r , a , p ) + f ( r , a , p ) + g + ( r , p ) + g ( r , p ) h + σ 2 + ε 2 r h 2 ) 1 [ ( f + ( r , a , p ) h + σ 2 2 h 2 ) V ( x + h , r , λ ) + ( f ( r , a , p ) h + σ 2 2 h 2 ) V ( x h , r , λ ) ( g + ( r , p ) h + ε 2 r 2 h 2 ) V ( x , r h , λ ) + ( g ( r , p ) h + ε 2 r 2 h 2 ) V ( x , r h , λ ) p ( a b p + γ ( r p ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ ] } (25)

具体来说,我们考虑

V m ( x , r , λ ) = sup ( u ( ) , p ( ) ) A E { 0 e ρ t w ( min ( X ( t ) , R ( t ) , m ) , π , λ ) d t }

其中 m > 0 是给定的。同样地,我们也可以确认 V m 是(22)的唯一粘性解。我们使用 V m ( x , r , λ ) 而不是 V ( x , r , λ ) 。它的HJB方程是

ρ V m ( x , r , λ ) = max ( u , p ) U ( f + ( r , a , p ) V m ( x + h , r , λ ) V m ( x , r , λ ) h f ( r , a , p ) V m ( x , r , λ ) V m ( x h , r , λ ) h + g + ( r , p ) V m ( x , r + h , λ ) V m ( x , r , λ ) h g ( r , p ) V m ( x , r , λ ) V m ( x , r h , λ ) h

+ 1 2 σ 2 V m ( x + h , r , λ ) + V m ( x h , r , λ ) 2 V m ( x , r , λ ) h 2 + 1 2 ε 2 r V m ( x , r + h , λ ) + V m ( x , r h , λ ) 2 V m ( x , r , λ ) h 2 + p ( a b p + γ ( r p ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ ) (26)

此外,用 V m ( x , r , λ ) 代替 V ( x , r , λ ) ,得到了与(23)相关联的哈密顿量。此外,我们在下面给出了(25)的相应方程:

V m ( x , r , λ ) = max ( u , p ) U { ( ρ + f + ( r , a , p ) + f ( r , a , p ) + g + ( r , p ) + g ( r , p ) h + σ 2 + ε 2 r h 2 ) 1 [ ( f + ( r , a , p ) h + σ 2 2 h 2 ) V m ( x + h , r , λ ) + ( f ( r , a , p ) h + σ 2 2 h 2 ) V m ( x h , r , λ ) ( g + ( r , p ) h + ε 2 r 2 h 2 ) V m ( x , r + h , λ ) + ( g ( r , p ) h + ε 2 r 2 h 2 ) V m ( x , r h , λ ) + p ( a b p + γ ( r p ) ) + ( λ 1 ) ( C ˜ ( u ) + H ˜ ( x ) ) λ ρ θ ] } (27)

参考Barles和Souganidis [22] 在文献中的主要收敛结果,可以推断,如果我们能建立S的单调性、一致性和稳定性的性质,也可以得到与定理(4.1)相比较的收敛结果。

定理4.1 当 h 0 时,序列 v h 局部一致收敛于 v 。因此,方程(27)的解 V h , m ( , , λ ) 收敛为HJB方程(26)的唯一粘性解,记为 v m

证明:证明与 [17] 中相似,在此省略。

4.2. 随机递归算法

在本节中,我们将重点介绍一个随机递归算法来评估 λ * 。假设我们已经使用前一节的值迭代方法与给定的原始数据 λ n 来计算出了最优控制 ( u n ( ) , p n ( ) ) 。让我们将实例目标函数设置为 D n ( ) 。方式如下,

λ n + 1 = λ n ε D n ( λ n + δ n , ς n , ϕ n ) D n ( λ n δ n , ς n , ϕ n ) 2 δ n (28)

其中, δ n ε n 为步长,而 ξ n 与噪声过程有关。引入松弛控制,然后我们可以得到另一个表达式(3)。

X n ( t ) = x + 0 t U [ u ( s ) ( a b p ( s ) + γ ( R ( s ) p ( s ) ) ) ] π n ( d u , d p | X ( s ) , R ( s ) ) d s + 0 t X n ( s ) σ d W n ( s ) d s (29)

W n π n 是对应于 ( u n ( ) , p n ( ) ) 的松弛控制。与 [23] 类似,我们使用广泛使用的常微分方程方法描述了随机递归逼近算法的收敛特性。由于我们有一个需要弱收敛方法的离散模型,我们必须确定一个合适的尺度来实现一个连续的参数插值。

请注意, π 依赖于 λ n ,而 ξ n ς n 也依赖于 λ n 。从上一节中,我们可以看到 π ( u , p ) 依赖于 λ 。为了进一步发展,让我们首先定义一些符号。我们定义 τ n h = k = 0 n 1 Δ ε k h ,并且定义 τ [ τ n h , τ n + 1 h ] , λ 0 ( τ ) = λ n ,让 λ 0 ( τ + τ n ) M ( τ ) = max { n : τ n τ } ,此外,我们还定义了

Ω n = [ E n D n ( δ n + λ n , ς n , ϕ n ) V ( δ n + λ n ) ] [ E n D n ( λ n δ n , ς n , ϕ n ) V ( λ n δ n ) ] Ψ n = V ( λ n + δ n ) V ( λ n δ n ) 2 δ n V λ ( λ n ) ϒ n = ( D n ( λ n + δ n , ς n , ϕ n ) D n ( λ n δ n , ς n , ϕ n ) ) E n ( D n ( λ n + δ n , ς n , ϕ n ) D n ( λ n δ n , ς n , ϕ n ) ) (30)

其中 Ω n 为噪声, Ψ n 为偏置, ϒ n 为鞅差。通常,让 0 < ε 0 n ε n = 0 < δ n 0 n ( ε n / δ n 2 ) < 。根据定义的符号,式(28)为

λ n + 1 = λ n + ε n V ( x , r , λ n ) + ε n ϒ n 2 δ n + ε n Ψ n + ε n Ω n 2 δ n (31)

根据(30)中给出的符号,插值过程可以显示为

λ n ( τ ) = λ n + j = n M ( τ + τ n ) 1 ε j V j ( x , r , λ j ) ϒ j 2 δ j + j = n M ( τ + τ n ) 1 ε j Ψ j + j = n M ( τ + τ n ) 1 ε j 2 δ j Ω j

其中, V j ( x , r , λ j ) 表示将 V ( x , r , λ ) λ 推导得到的偏导数。可以采用各种方法来证明收敛性,但我们选择了弱收敛的方法,这要求我们建立 λ n ( ) 的紧致性。在 [17] 的引理4.3中,已经证明了 ( X ( ) , R ( ) , u ( ) , p ( ) ) 是对 ( X n ( ) , R n ( ) , u n ( ) , p n ( ) ) 的弱收敛。我们还得到了一个定理。

定理4.2 当 z n 是一个正实数序列并满足该 z n ,则当 n 时, λ n ( + z n ) p λ *

证明:前面的引理让我们推导出 sup n E | λ n | 2 < λ n ( ) 在状态空间S上是紧的,然后

λ n ( τ + k ) λ n ( τ ) = M ( τ n + τ + k ) 1 s = M ( τ n + τ ) ε s [ ς s λ s + δ s ς s λ s δ s 2 δ s + ϕ s λ s + δ s ϕ s λ s δ s 2 δ s + ( ϕ s λ s θ ) ] (32)

对于任何 0 < T 0 < , 0 < τ < T 0 , η 0 > 0 , 0 < k < η 0

E τ n | λ n ( s + τ ) λ n ( τ ) | 2 β η 0 lim η 0 lim sup n E β n ( η 0 ) = 0 (33)

因为 λ n ( ) 序列在S上是紧的,我们可以利用普罗霍罗夫定理得到弱收敛的子序列。 λ ( ) 的子序列用 λ n ( ) 表示。此外, ,并在任意有界区间上一致收敛。 [17] 中提供了其证明,因此我们在这里省略了一些细节。

5. 数值结果

本节介绍了数值例子和灵敏度分析,数值参照文献 [24] 和 [25] 。此外,通过数值模拟,我们分析了随机参考价格和库存对最优价值函数(即最优利润)、生产率和销售价格的影响。

5.1. 一个基本的例子

示例1:在这一部分中,我们分别选择 ε n = O ( 1 / n ) ε n = O ( 1 / n 1 / 6 ) ,n为迭代次数。假设生产率u为正值,该公司将根据总生产成本 5 u + 5 u 2 自适应地调节其生产或补充率。库存持有总成本为 2 x + 2 x 2 ,库存级别X为实数。我们可以假设需求率为 D ( p , r ) = 10 0.1 p + 2 ( r p ) ,平均市场潜力为 a = 10 ,价格敏感性为 b = 0.1 ,参考价格效应强度为 γ = 0.05 。此外,我们假设波动率参数为 ε = 0.1 , σ = 0.05 。然后我们设置原始值 λ = 1 和成本约束 θ = 3 。制造商的主要目标是通过动态的定价和生产决策来优化他们的预期利润。假设贴现率为 ρ = 0.1

约束问题的最优值函数和相应的最优拉格朗日乘数如图1(a)和图1(b)所示。为了解释得更清楚,我们分别固定图中的参数库存X或参考价格R,得到图1(c)和图1(d)中的投影图。图象显示,当参考价格R固定时,随着库存水平X的增加,最优净利润先增加后减少。库存水平的提高会导致制造商库存成本的增加。因此,为了可以更快地清理库存,制造商需要通过降低零售价格来增加销量,达到不亏空的目的。此外,当库存水平X固定时,最优净利润随着参考价格R的增加而单调增加。参考价格对消费者的决策有明显的影响。参考价格越高,销售增长越大,库存需求就会增加,利润也会相应增加。另外,如果销售价格下降,销售增长会更大,也会带来利润增长。

Figure 1. Value function and optimal Lagrange multiplier

图1. 值函数和最优拉格朗日乘数

因此,在参考价格较高时,由于成本限制,制造商并不急于采用更高的售价来增加收入。相反,应该降低零售价格,并适当降低生产率。当参考价格较低时,制造商应当制定与参考价格相近的销售价格,并提高生产率。

最佳生产率和最佳销售价格如图2所示。如图2(c)和图2(d)所示,当参考价格R固定时,最优生产率u*随着库存X的增加而增加,达到最大值时有所回落。因为较高的参考价格增加了需求和库存,然后生产率提高。但是,需求积压越多,积压成本越高,会导致生产率有下降的可能。另外,当库存水平X固定时,最优生产率u*随着参考价格R的增加而单调上升。当参考价格高于当前产品价格,因而需求增加时,消费者将受益,制造商也会因此获利。同样,当参考价格低于当前产品价格时,消费者会受到损失,因此需求会减少。对消费者来说,较高的参考价并不意味着较高的售价。同样,如图2(e)和图2(f)

Figure 2. Optimal productivity u* and selling price p*

图2. 最佳的生产力u*和销售价格p*

所示,当参考价格R固定时,最优售价p*随着库存X的增加而降低,达到最大值时上升。当库存积压时,制造商需要降低销售价格来减轻压力。相反,当参考价格X固定时,最优销售价格p*随着参考价格R的增加而减小。当参考价格上升时,消费者对产品的忠诚度就减少了。制造商按照参考价降低相应的售价,就可以从中获得较高的利润。

因此,制造商应该根据库存的具体情况控制生产率。当库存积压时,制造商需要降低销售价格来减轻压力。

5.2. 灵敏性分析

在本小节中,我们将考虑当修改系统输入参数的值时,库存系统的最优策略如何变化。我们用数值方法研究了参考价格问题和不确定性对利润、生产力和销售价格的影响。因此,我们对关键参数进行了敏感性分析。

5.2.1. 关于参考效应系数的影响

示例2:我们通过一系列的敏感性分析,检验了参考价格效应系数对最优利润、最优生产率和销售价格的影响。这些分析如图3所示,其中的值是从集合 { 0.1 , 0.3 , 0.5 } 中选择的。

Figure 3. Optimal value function, productivity and selling price (γ)

图3. 最优价值函数、生产力和销售价格(γ)

我们在图3中观察到以下结论。在图3(a)~(c)中,我们观察到,当参考效应系数增加时,我们发现总利润、最优生产率和最优销售价格都趋于下降。一般来说,当消费者对参考价格效应比较敏感,即γ较高时,销售价格应该会较高,这会导致制造商因需求较低而减产。并且更高的收入才可以弥补更多的生产和库存成本,制造商可以获得更多利润。当参考效应系数增高时,参考价格的影响力也随之增加,这意味着制造商需要更加关注参考价格以确保产品的竞争力。制造商通常会降低销售价格以缩小与参考价格之间的差距,这样可以避免因参考效应系数的影响而导致需求下降。然而,当参考效应系数不断增加时,制造商只能保持低产量和继续降价以保持销量,最终维持利润。总的来说,当参考效应系数较高时,制造商应该降低生产率和销售价格。

5.2.2. 关于记忆参数的影响

示例3,我们考虑了记忆参数 β 对最佳利润、生产力和销售价格的影响,如图4所示,其中该值是从集合 { 1.0 , 1.5 , 2.0 } 中选择的。

Figure 4. Optimal value function, productivity and selling price (β)

图4. 最优价值函数,生产力和销售价格(β)

图4(a)~(c)的观察表明,随着参考价格R的增加,最优利润、生产率和销售价格都呈下降。记忆系数的值越高,反映出消费者的短期记忆越好,表明产品忠诚度越低。然而,由于成本限制,制造商并不急于采用高销售价格来增加收入。相反,他们可以通过降低售价来应对参考价,从而获得高收益。这种策略可以导致销售量和市场份额的增加,从而弥补降价带来的单位利润的减少。在这种情况下,制造商可能还需要考虑替代战略,如引入产品差异化或增强客户体验,以保持市场竞争力和盈利能力。

综上所述,在记忆参数影响较高的情况下,厂商应注意参考价格对消费需求的影响。为了保持市场竞争力和防止需求大幅下降,制造商可能会选择降低生产率和销售价格,同时尽可能保持较高的利润率。

5.2.3. 关于需求不确定性的影响

示例4:我们描述了当需求不确定性 σ 发生变化时,最优价值函数、生产率和销售价格的变化。

Figure 5. Optimal value function, productivity and selling price (σ)

图5. 最优价值函数、生产力和销售价格(σ)

图5(a)~(c)所示,需求不确定性对最优预期利润、生产率和销售价格的影响相对较小。然而,随着需求不确定性水平的增加,这三个变量都相应减少。换句话说,需求的不确定性对制造商的预期稳态利润有负面影响。这表明,当需求不确定性较小时,制造商可以实现更大的利润增长。因此,重要的是,制造商应更加关注需求不确定性对其长期盈利能力的影响。此外,制造商应密切关注消费者行为和偏好的变化,以便他们能够迅速调整营销和定价策略,以适应新的市场情况。为了使公司能够更多地了解消费者,减少需求的不确定性,公司可以使用大数据应用程序,使消费者更容易获得公司产品的信息并给出评论。因此,虽然需求不确定性对生产的影响可能相对较小,但仍可能影响制造商的长期盈利能力。为了减少需求的不确定性,制造商密切关注消费者的反馈,以便他们能够相应地调整战略,这一点很重要。当需求不确定性很高时,制造商可能需要更多地专注于维护客户忠诚度。

5.2.4. 关于参考价格不确定性的影响

示例5:参考价格不确定性的影响也是影响库存管理的因素之一。因此,我们考虑了参考价格的不确定性 对价值函数、生产率和销售价格的影响,其中不确定性系数集取自 { 0.1 , 0.4 , 0.7 }

Figure 6. Optimal value function, productivity and selling price (ε)

图6. 最优价值函数、生产力和销售价格(ε)

图6(a)~(c)所示,参考价格不确定性的增加对最优利润有负面影响。当参考价格的不确定性降低时,制造商可以获得更高的利润。相反,参考价格不确定性的增加会导致低利润,为此制造商可以通过降低生产率和提高售价来挽回损失。如果制造商忽略了参考价格的不确定性,如其随机性或消费者之间的差异,他们可能会以低价生产太多,导致产品价格和利润降低。为了避免这些问题,制造商需要采用更详细的市场研究和数据分析方法,以更好地了解市场需求和消费者行为,并根据这些信息制定适当的生产计划和定价策略。

总之,如果制造商将随机参考价格纳入其生产计划和定价策略,通常有利于他们保持低产量和高价格。制造商还应考虑将其他市场因素纳入其定价模型的潜在好处,如需求不确定性或生产成本,以便在定价策略中实现更大的准确性和可预测性。这使得他们可以通过以更高的价格销售更少的产品来最大限度地提高利润率,同时也创造了更大的市场价格可变性。

参考文献

[1] Harris, F.W. (1915) What Quantity to Make at Once. In: The Library of Factory Management, Vol. 5, A. W. Shaw Company, Chicago, 47-52.
[2] Serrano, A., Oliva, R. and Kraiselburd, S. (2017) On the Cost of Capital in Inventory Models with Deterministic Demand. International Journal of Production Economics, 183, 14-20.
https://doi.org/10.1016/j.ijpe.2016.10.007
[3] Hsieh, T.P. and Dye, C.Y. (2017) Optimal Dynamic Pricing for Deteriorating Items with Reference Price Effects When Inventories Stimulate Demand. European Journal of Operational Research, 262, 136-150.
https://doi.org/10.1016/j.ejor.2017.03.038
[4] Güler, M.G., Bilgiç, T. and Güllü, R. (2015) Joint Pricing and Inventory Control for Additive Demand Models with Reference Effects. Annals of Operations Research, 226, 255-276.
https://doi.org/10.1007/s10479-014-1706-3
[5] Mahapatra, A.S., Soni, N.H. and Mahapatra, M.S. (2021) A Continuous Review Production-Inventory System with a Variable Preparation Time in a Fuzzy Random Environment. Mathematics, 9, Article No. 747.
https://doi.org/10.3390/math9070747
[6] Zhou, Q., Yang, Y. and Fu, S. (2022) Deep Reinforcement Learning Approach for Solving Joint Pricing and Inventory Problem with Reference Price Effects. Expert Systems with Applications, 195, Article ID: 116564.
https://doi.org/10.1016/j.eswa.2022.116564
[7] Chenavaz, R. (2016) Dynamic Pricing with Reference Price Dependence. Economics, 10, Article ID: 20160022.
https://doi.org/10.5018/economics-ejournal.ja.2016-22
[8] Xue, M., Tang, W. and Zhang, J. (2016) Optimal Dynamic Pricing for Deteriorating Items with Reference-Price Effects. International Journal of Systems Science, 47, 2022-2031.
https://doi.org/10.1080/00207721.2014.970598
[9] Chen, K., Zha, Y., Alwan, L.C., et al. (2020) Dynamic Pricing in the Presence of Reference Price Effect and Consumer Strategic Behaviour. International Journal of Production Research, 58, 546-561.
https://doi.org/10.1080/00207543.2019.1598592
[10] Chen, X., Hu, P. and Hu, Z. (2017) Efficient Algorithms for the Dynamic Pricing Problem with Reference Price Effect. Management Science, 63, 4389-4408.
https://doi.org/10.1287/mnsc.2016.2554
[11] Cao, Y. and Duan, Y. (2020) Joint Production and Pricing Inventory System under Stochastic Reference Price Effect. Computers & Industrial Engineering, 143, Article ID: 106411.
https://doi.org/10.1016/j.cie.2020.106411
[12] Chou, F.S. and Parlar, M. (2006) Optimal Control of a Revenue Management System with Dynamic Pricing Facing Linear Demand. Optimal Control Applications and Methods, 27, 323-347.
https://doi.org/10.1002/oca.785
[13] Crow, M.L. (2016) Cost-Constrained Dynamic Optimal Electric Vehicle Charging. IEEE Transactions on Sustainable Energy, 8, 716-724.
https://doi.org/10.1109/TSTE.2016.2615865
[14] 王妍怡, 陈宏, 冉超. 库存成本约束下的供应链协调研究[J]. 物流工程与管理, 2014(8): 84-87.
[15] 刘子伟, 陈杰, 陈鑫, 等. 基于成本约束的动态最优电动汽车充电[J]. 电网与清洁能源, 2021, 37(11): 94-101.
[16] Mendoza-Pérez, A.F., Jasso-Fuentes, H. and Hernández-Lerma, O. (2015) The Lagrange Approach to Ergodic Control of Diffusions with Cost Constraints. Optimization, 64, 179-196.
https://doi.org/10.1080/02331934.2012.736992
[17] Lu, X., Yin, G., Zhang, Q., et al. (2017) Building up an Illiquid Stock Position Subject to Expected Fund Availability: Optimal Controls and Numerical Methods. Applied Mathematics & Optimization, 76, 501-533.
https://doi.org/10.1007/s00245-016-9359-z
[18] Sun, B., Tao, Z.Z. and Wang, Y.Y. (2019) Dynamic Programming Viscosity Solution Approach and Its Applications to Optimal Control Problems. In: Smith, F.T., Dutta, H. and Mordeson, J.N., Eds., Mathematics Applied to Engineering, Modelling, and Social Issues, Springer, Berlin, 363-420.
https://doi.org/10.1007/978-3-030-12232-4_12
[19] Fibich, G., Gavious, A. and Lowengart, O. (2003) Explicit Solutions of Optimization Models and Differential Games with Nonsmooth (Asymmetric) Reference-Price Effects. Operations Research, 51, 721-734.
https://doi.org/10.1287/opre.51.5.721.16758
[20] Greenleaf, E.A. (1995) The Impact of Reference Price Effects on the Profitability of Price Promotions. Marketing Science, 14, 82-104.
https://doi.org/10.1287/mksc.14.1.82
[21] Pham, H. (2009) Continuous-Time Stochastic Control and Optimization with Financial Applications. Springer Science & Business Media, Berlin.
https://doi.org/10.1007/978-3-540-89500-8
[22] Barles, G. and Souganidis, P.E. (1991) Convergence of Approximation Schemes for Fully Nonlinear Second Order Equations. Asymptotic Analysis, 4, 271-283.
https://doi.org/10.3233/ASY-1991-4305
[23] Lu, X. (2019) Constrained Optimality for Controlled Switching Diffusions with an Application to Stock Purchasing. Quantitative Finance, 19, 2069-2085.
https://doi.org/10.1080/14697688.2019.1614210
[24] Maimon, O., Khmelnitsky, E. and Kogan, K. (1998) Optimal Flow Control in Manufacturing Systems: Production Planning and Scheduling. Springer Science & Business Media, Berlin.
https://doi.org/10.1007/978-1-4757-2834-7
[25] Herbon, A. and Kogan, K. (2014) Time-Dependent and Independent Control Rules for Coordinated Production and Pricing under Demand Uncertainty and Finite Planning Horizons. Annals of Operations Research, 223, 195-216.
https://doi.org/10.1007/s10479-014-1616-4