关于Lagrange乘数法的再探讨
Further Exploration of Lagrange Multiplier Method
DOI: 10.12677/aam.2024.1312510, PDF, HTML, XML,    科研立项经费支持
作者: 孙慧静, 刘晓燕:海军航空大学航空基础学院,山东 烟台;马启建:烟台文化旅游职业学院,山东 烟台
关键词: 条件极值Lagrange乘数法梯度法向量Conditional Extremum Lagrange Multiplier Method Gradient Normal Vector
摘要: Lagrange乘数法是求条件极值的重要方法。教材中仅仅针对目标函数为二元函数,约束条件为一个二元方程时,给出了Lagrange乘数法的基本思想与详细的做法,但对于自变量多余两个、约束条件多余一个的情形的Lagrange乘数法只是简单提及,没有给出详尽的推导过程。本文分别从横向和纵向两个维度,通过层层递进的方式,按照五种情形,给出了Lagrange乘数法的一般推广,并进行了详细的理论推导以及给出了Lagrange乘数法的几何意义。研究结果不论对于一线的科研工作者还是初学者都有一定的启发与借鉴意义。
Abstract: Lagrange multiplier method is an important method for finding conditional extremum. The textbook only provides the basic idea and detailed method of Lagrange multiplier method when the objective function is a binary function and the constraint condition is a binary equation. However, for cases where there are more than two independent variables and more than one constraint, the Lagrange multiplier method is only briefly mentioned without providing a detailed derivation process. This article provides a general extension of the Lagrange multiplier method from both horizontal and vertical dimensions, using a progressive approach in five different scenarios. Moreover, detailed theoretical derivation and geometric significance of the Lagrange multiplier method are also presented. The research results of this article have certain inspirations and reference significance for both frontline researchers and beginners.
文章引用:孙慧静, 马启建, 刘晓燕. 关于Lagrange乘数法的再探讨[J]. 应用数学进展, 2024, 13(12): 5290-5301. https://doi.org/10.12677/aam.2024.1312510

1. 前言

Lagrange乘数法是《高等数学》多元函数部分中的一个重要内容.在求解多元函数条件极值问题时,用到了该方法[1]-[4]。教材中仅仅针对目标函数为二元函数,约束条件为一个二元方程时,给出了Lagrange乘数法的基本思想与详细的做法,但对于自变量多余两个、约束条件多余一个的情形的Lagrange乘数法只是简单提及,没有给出详尽的推导过程[1]。至于Lagrange乘数的几何意义也没有给出解释。

许多文献从不同的角度给出了Lagrange乘数法的几何意义[3]-[7]。这些文献要么从低维的角度做了几何解释,要么仅仅通过例子加以说明,而没有给出推导过程。因此,本文主要对于更一般情形——自变量多余两个、约束条件多余一个条件极值的Lagrange乘数法进行推广,同时根据推导结果给出了Lagrange乘数法的几何意义。

2. Lagrange乘数法的推广及几何意义

(一) 目标函数为二元函数 z=f( x,y ) ,约束条件为二元方程 φ( x,y )=0

1. Lagrange乘数法

定理1 [1]:要找目标函数二元函数 z=f( x,y ) ,约束条件为二元方程 φ( x,y )=0 下的可能极值点,可以先作Lagrange函数:

L( x,y )=f( x,y )+λφ( x,y ),

其中 λ 为参数,求其对 x,y λ 一阶偏导数,并使之为零,即

{ f x ( x,y )+λ φ x ( x,y )=0, f y ( x,y )+λ φ y ( x,y )=0, φ( x,y )=0, (1)

由方程组解出 x,y λ ,这样得到的 ( x,y ) 就是函数 f( x,y ) 在附加条件下 φ( x,y )=0 的可能极值点。

2. 几何意义

下面通过两种方式来解释Lagrange乘数法的几何意义。

方式一:假设函数 z=f( x,y ) ( x 0 , y 0 ) 处取得极值,则 φ( x 0 , y 0 )=0 。假设 φ( x,y )=0 ( x 0 , y 0 ) 附近邻域内可以确定隐函数 y=ψ( x ) ,则函数目标函数变为 z=f( x,ψ( x ) ) 。又 z=f( x,ψ( x ) ) ( x 0 , y 0 ) 处取

得极值,则 dz dx | x= x 0 =0

f x ( x 0 , y 0 )+ f y ( x 0 , y 0 ) dy dx | ( x 0 , y 0 ) =0,

( f x ( x 0 , y 0 ), f y ( x 0 , y 0 ) )( 1, dy dx | ( x 0 , y 0 ) )=0, (2)

亦或

gradf| ( x 0 , y 0 ) T=0, (3)

其中 gradf| ( x 0 , y 0 ) =( f x ( x 0 , y 0 ), f y ( x 0 , y 0 ) ) T=( 1, dy dx | ( x 0 , y 0 ) )

gradf| ( x 0 , y 0 ) 一方面可以理解为函数 z=f( x,y ) ( x 0 , y 0 ) 处的梯度,另一方面也可以理解为在 xOy 平面内 z=f( x,y ) 的某等值线 f( x,y )= C 0 ( x 0 , y 0 ) 处的法向量,其中 C 0 =f( x 0 , y 0 ) T=( 1, dy dx | ( x 0 , y 0 ) ) 为曲

线 φ( x,y )=0 ( x 0 , y 0 ) 处的切向量。于是,等值线 f( x,y )= C 0 ( x 0 , y 0 ) 处的法线向量与曲线 φ( x,y )=0 ( x 0 , y 0 ) 处的切向量是互相垂直,或者说成等值线 f( x,y )= C 0 与曲线 φ( x,y ) 相切于点 ( x 0 , y 0 ) ,或者等值线 f( x,y )= C 0 ( x 0 , y 0 ) 处的法向量与曲线 φ( x,y )=0 ( x 0 , y 0 ) 处的法向量是平行的,即目标函数的梯度方向与约束条件的法向量平行。用线性代数的术语可表述为梯度向量能用约束条件的法向量线性表示。

由此可见,若 ( x 0 , y 0 ) 为目标函数 z=f( x,y ) 在约束条件 φ( x,y )=0 的极值点,其必要条件的几何意义为目标函数 z=f( x,y ) 的某等值线 f( x,y )= C 0 与曲线 φ( x,y )=0 相切于 ( x 0 , y 0 )

方式二:

对(2)式作进一步的整理,因为 dy dx | ( x 0 , y 0 ) = φ x ( x 0 , y 0 ) φ y ( x 0 , y 0 ) ,所以(2)式可变为

f x ( x 0 , y 0 )+ f y ( x 0 , y 0 )( φ x ( x 0 , y 0 ) φ y ( x 0 , y 0 ) )=0, (4)

f y ( x 0 , y 0 ) φ y ( x 0 , y 0 ) =λ ,即

f y ( x 0 , y 0 )λ φ y ( x 0 , y 0 )=0, (5)

则(4)式可变为

f x ( x 0 , y 0 )λ φ x ( x 0 , y 0 )=0 (6)

即极值点一定满足(5)、(6)两式。(5)、(6)两式也可以用向量形式来表达,即

( f x ( x 0 , y 0 ), f y ( x 0 , y 0 ) )λ( φ x ( x 0 , y 0 ), φ y ( x 0 , y 0 ) )=0

亦即

gradfλn=0 (7)

其中 n=( φ x ( x 0 , y 0 ), φ y ( x 0 , y 0 ) ) ,表示曲线 φ( x,y ) ( x 0 , y 0 ) 处的法向量。(7)式表示的意义是 gradf n 共线(平行)或者用线性代数的术语表述成: gradf 可用 n 线性表示。若 ( x 0 , y 0 ) 为目标函数 z=f( x,y ) 在约束条件 φ( x,y )=0 的极值点,其必要条件的几何意义为目标函数 z=f( x,y ) 的某等值线 f( x,y )= C 0 与曲线 φ( x,y )=0 相切于 ( x 0 , y 0 )

综上,几何上,约束条件 φ( x,y )=0 xOy 面内是一条平面曲线。目标函数 z=f( x,y ) xOy 坐标面内有一系列的等值线,若 z=f( x,y ) 在约束条件 φ( x,y )=0 下取得极值,则必在某等值线与约束曲线相切时取得。若目标函数 z=f( x,y ) 的某等值线与曲线 φ( x,y )=0 相交于 ( x 0 , y 0 ) 点,则该点 ( x 0 , y 0 ) 一定不可能为极值点。至于等值线与曲线 φ( x,y )=0 相离就更谈不上存在极值点的可能性。

(二) 目标函数为三元函数 u=f( x,y,z ) ,约束条件为三元方程 φ( x,y,z )=0

1. Lagrange乘数法

定理2:要找目标函数二元函数 u=f( x,y,z ) ,约束条件为二元方程 φ( x,y,z )=0 下的可能极值点,可以先作Lagrange函数:

L( x,y,z )=f( x,y,z )+λφ( x,y,z ),

其中 λ 为参数,求其对 x,y,z λ 一阶偏导数,并使之为零,即

{ f x ( x,y,z )λ φ x ( x,y,z )=0, f y ( x,y,z )λ φ y ( x,y,z )=0, f z ( x,y,z )λ φ z ( x,y,z )=0, φ( x,y,z )=0, (8)

由方程组解出 x,y,z λ ,这样得到的 ( x,y,z ) 就是函数 u=f( x,y,z ) 在附加条件下 φ( x,y,z )=0 的可能极值点。

证明:假定 φ( x,y,z )=0 可确定隐函数 z=z( x,y ) ,则目标函数变为 u=f( x,y,z( x,y ) ) ,假定 u=f( x,y,z ) ( x 0 , y 0 , z 0 ) 处取得极值,则

u x ( x 0 , y 0 , z 0 )=0, u y ( x 0 , y 0 , z 0 )=0

{ f x ( x 0 , y 0 , z 0 )+ f z ( x 0 , y 0 , z 0 ) z x | ( x 0 , y 0 , z 0 ) =0, f y ( x 0 , y 0 , z 0 )+ f z ( x 0 , y 0 , z 0 ) z y | ( x 0 , y 0 , z 0 ) =0,

z x | ( x 0 , y 0 , z 0 ) = φ x ( x 0 , y 0 , z 0 ) φ z ( x 0 , y 0 , z 0 ) z y | ( x 0 , y 0 , z 0 ) = φ y ( x 0 , y 0 , z 0 ) φ z ( x 0 , y 0 , z 0 )

{ f x ( x 0 , y 0 , z 0 )+ f z ( x 0 , y 0 , z 0 )( φ x ( x 0 , y 0 , z 0 ) φ z ( x 0 , y 0 , z 0 ) )=0, f y ( x 0 , y 0 , z 0 )+ f z ( x 0 , y 0 , z 0 )( φ y ( x 0 , y 0 , z 0 ) φ z ( x 0 , y 0 , z 0 ) )=0,

f z ( x 0 , y 0 , z 0 ) φ z ( x 0 , y 0 , z 0 ) =λ ,即 f z ( x 0 , y 0 , z 0 )λ φ z ( x 0 , y 0 , z 0 )=0 ,故

{ f x ( x 0 , y 0 , z 0 )λ φ x ( x 0 , y 0 , z 0 )=0, f y ( x 0 , y 0 , z 0 )λ φ y ( x 0 , y 0 , z 0 )=0, f z ( x 0 , y 0 , z 0 )λ φ z ( x 0 , y 0 , z 0 )=0, φ( x 0 , y 0 , z 0 )=0.

写成向量形式

( f x , f y , f z )| ( x 0 , y 0 , z 0 ) λ ( φ x , φ y , φ z )| ( x 0 , y 0 , z 0 ) =0,

gradf| ( x 0 , y 0 , z 0 ) λn=0 (9)

2. 几何意义

三元函数 u=f( x,y,z ) 在约束条件为二元方程 φ( x,y,z )=0 下在 ( x 0 , y 0 , z 0 ) 取得极值的必要条件(9)式的几何意义为:目标函数 u=f( x,y,z ) 的梯度方向与约束条件 φ( x,y,z )=0 ( x 0 , y 0 , z 0 ) 处法向量平行,或

梯度向量能用约束条件的法向量线性表示,即 gradf| ( x 0 , y 0 ) =λn ,其中 gradf| ( x 0 , y 0 , z 0 ) = ( f x , f y , f z )| ( x 0 , y 0 , z 0 ) 表示 u=f( x,y,z ) ( x 0 , y 0 , z 0 ) 梯度方向, n= ( φ x , φ y , φ z )| ( x 0 , y 0 , z 0 ) 表示曲面 φ( x,y,z )=0 ( x 0 , y 0 , z 0 ) 处法向量。

也可以表述为:若 u=f( x,y,z ) 在约束条件 φ( x,y,z )=0 下取得极值,则必在某等值面 f( x,y,z )= C 0 与约束曲面 φ( x,y,z )=0 相切时取得。

(三) 目标函数为n元函数 u=f( x 1 , x 2 ,, x n ) ,约束条件为n元方程 φ( x 1 , x 2 ,, x n )=0

1. Lagrange乘数法

定理3:要找目标函数n元函数 u=f( x 1 , x 2 ,, x n ) ,约束条件为n元方程 φ( x 1 , x 2 ,, x n )=0 下的可能极值点,可以先作Lagrange函数:

L( x 1 , x 2 ,, x n )=f( x 1 , x 2 ,, x n )+λ( x 1 , x 2 ,, x n ),

其中 λ 为参数,求其对 x 1 , x 2 ,, x n λ 一阶偏导数,并使之为零,即

{ f x 1 ( x 1 , x 2 ,, x n )λ φ x 1 ( x 1 , x 2 ,, x n )=0, f x 2 ( x 1 , x 2 ,, x n )λ φ x 2 ( x 1 , x 2 ,, x n )=0, f x n ( x 1 , x 2 ,, x n )λ φ x n ( x 1 , x 2 ,, x n )=0, φ( x 1 , x 2 ,, x n )=0, (10)

由方程组解出 x 1 , x 2 ,, x n λ ,这样得到的 ( x 1 , x 2 ,, x n ) 就是函数 u=f( x 1 , x 2 ,, x n ) 在附加条件下 φ( x 1 , x 2 ,, x n )=0 的可能极值点。

证明:假定 φ( x 1 , x 2 ,, x n )=0 可确定隐函数 x n = x n ( x 1 , x 2 ,, x n1 ) ,则目标函数变为 u=f( x 1 , x 2 ,, x n ( x 1 , x 2 ,, x n1 ) ) ,假定 u=f( x 1 , x 2 ,, x n ) ( x 10 , x 20 ,, x n0 ) 处取得极值,则

u x 1 | ( x 10 , x 20 ,, x n0 ) =0, u x 2 | ( x 10 , x 20 ,, x n0 ) =0,, u x n | ( x 10 , x 20 ,, x n0 ) =0

{ f x 1 ( x 10 , x 20 ,, x n0 )+ f x n ( x 10 , x 20 ,, x n0 ) x n x 1 | ( x 10 , x 20 ,, x n0 ) =0, f x 2 ( x 10 , x 20 ,, x n0 )+ f x n ( x 10 , x 20 ,, x n0 ) x n x 2 | ( x 10 , x 20 ,, x n0 ) =0, f x n1 ( x 10 , x 20 ,, x n0 )+ f x n ( x 10 , x 20 ,, x n0 ) x n x n1 | ( x 10 , x 20 ,, x n0 ) =0,

x n x 1 | ( x 10 , x 20 ,, x n0 ) = φ x 1 ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) , x n x 2 | ( x 10 , x 20 ,, x n0 ) = φ x 2 ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) , x n x n1 | ( x 10 , x 20 ,, x n0 ) = φ x n1 ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) ,

{ f x 1 ( x 10 , x 20 ,, x n0 )+ f x n ( x 10 , x 20 ,, x n0 )( φ x 1 ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) )=0, f x 2 ( x 10 , x 20 ,, x n0 )+ f x n ( x 10 , x 20 ,, x n0 )( φ x 2 ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) )=0, f x n1 ( x 10 , x 20 ,, x n0 )+ f x n ( x 10 , x 20 ,, x n0 )( φ x n1 ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) )=0,

f x n ( x 10 , x 20 ,, x n0 ) φ x n ( x 10 , x 20 ,, x n0 ) =λ ,即

f x n ( x 10 , x 20 ,, x n0 )λ φ x n ( x 10 , x 20 ,, x n0 )=0,

{ f x 1 ( x 10 , x 20 ,, x n0 )λ φ x 1 ( x 10 , x 20 ,, x n0 )=0, f x 2 ( x 10 , x 20 ,, x n0 )λ φ x 2 ( x 10 , x 20 ,, x n0 )=0, f x n ( x 10 , x 20 ,, x n0 )λ φ x n ( x 10 , x 20 ,, x n0 )=0,

写成向量形式

gradf| ( x 10 , x 20 ,, x n0 ) λn=0. (11)

其中

gradf| ( x 10 , x 20 ,, x n0 ) =( f x 1 ( x 10 , x 20 ,, x n0 ), f x 2 ( x 10 , x 20 ,, x n0 ),, f x n ( x 10 , x 20 ,, x n0 ) )

n=( φ x 1 ( x 10 , x 20 ,, x n0 ), φ x 2 ( x 10 , x 20 ,, x n0 ),, φ x n ( x 10 , x 20 ,, x n0 ) ) ,表示超曲面 φ( x 1 , x 2 ,, x n )=0

( x 10 , x 20 ,, x n0 ) 处的法向量。

2. 几何意义

n元函数 u=f( x 1 , x 2 ,, x n ) 在约束条件为n元方程 φ( x 1 , x 2 ,, x n )=0 下在 ( x 10 , x 20 ,, x n0 ) 取得极值的必要条件(11)式的几何意义为:目标函数 u=f( x 1 , x 2 ,, x n ) 的梯度方向与约束条件 φ( x 1 , x 2 ,, x n )=0 ( x 10 , x 20 ,, x n0 ) 处法向量平行,或者用线性代数的术语表述成: gradf 可用 n 线性表示。也可以表述为:若 u=f( x 1 , x 2 ,, x n ) 在约束条件 φ( x 1 , x 2 ,, x n )=0 下取得极值,则必在某等值超曲面 f( x 1 , x 2 ,, x n )= C 0 与约束超曲面 φ( x 1 , x 2 ,, x n )=0 相切点 ( x 10 , x 20 ,, x n0 ) 取得。

(四) 目标函数为三元函数 u=f( x,y,z ) ,约束条件为由2个3元方程组成的三元方程组 { φ( x,y,z )=0 ψ( x,y,z )=0

1. Lagrange乘数法

定理4:要找目标函数二元函数 u=f( x,y,z ) ,约束条件为一个由2个方程组成的三元方程组

{ φ( x,y,z )=0 ψ( x,y,z )=0 下的可能极值点,可以先作Lagrange函数:

L( x,y,z )=f( x,y,z )+λφ( x,y,z )+μψ( x,y,z ),

其中 λ,μ 为参数,求其对 x,y,z λ,μ 一阶偏导数,并使之为零,即

{ f x ( x,y,z )+λ φ x ( x,y,z )+μ ψ x ( x,y,z )=0, f y ( x,y,z )+λ φ y ( x,y,z )+μ ψ y ( x,y,z )=0, f z ( x,y,z )+λ φ z ( x,y,z )+μ ψ z ( x,y,z )=0, φ( x,y,z )=0, ψ( x,y,z )=0, (12)

由方程组解出 x,y,z λ,μ ,这样得到的 ( x,y,z ) 就是函数 f( x,y,z ) 在附加条件下 { φ( x,y,z )=0 ψ( x,y,z )=0 的可能极值点。

证明:设 ( x 0 , y 0 , z 0 ) 为目标函数 u=f( x,y,z ) 在约束条件 { φ( x,y,z )=0 ψ( x,y,z )=0 的极值点,并设 { φ( x,y,z )=0 ψ( x,y,z )=0 能确定隐函数 y=y( x ) z=z( x ) ,则目标函数 u=f( x,y,z ) 变为 u=f( x,y( x ),z( x ) ) 。又 u=f( x,y,z ) ( x 0 , y 0 , z 0 ) 处取得极值,则 du dx | x= x 0 =0

f x ( x 0 , y 0 , z 0 )+ f y ( x 0 , y 0 , z 0 ) dy dx | ( x 0 , y 0 , z 0 ) + f z ( x 0 , y 0 , z 0 ) dz dx | ( x 0 , y 0 , z 0 ) =0,

( f x ( x 0 , y 0 , z 0 ), f y ( x 0 , y 0 , z 0 ), f z ( x 0 , y 0 , z 0 ) )( 1, dy dx | ( x 0 , y 0 , z 0 ) , dz dx | ( x 0 , y 0 , z 0 ) )=0,

亦或

gradf| ( x 0 , y 0 , z 0 ) T=0, (13)

其中 gradf| ( x 0 , y 0 , z 0 ) =( f x ( x 0 , y 0 , z 0 ), f y ( x 0 , y 0 , z 0 ), f z ( x 0 , y 0 , z 0 ) ) T=( 1, dy dx | ( x 0 , y 0 , z 0 ) , dz dx | ( x 0 , y 0 , z 0 ) ) 表示空间曲线 { φ( x,y,z )=0 ψ( x,y,z )=0 ( x 0 , y 0 , z 0 ) 处的切向量。

空间曲线 { φ( x,y,z )=0 ψ( x,y,z )=0 ( x 0 , y 0 , z 0 ) 处的切向量也可以表示为

n 1 × n 2 = | i j k φ x φ y φ z ψ x ψ y ψ z | ( x 0 , y 0 , z 0 )

空间曲线的切向量既垂直于 n 1 = ( φ x , φ y , φ z ) ( x 0 , y 0 , z 0 ) 又垂直于 n 2 = ( ψ x , ψ y , ψ z ) ( x 0 , y 0 , z 0 ) ,显然梯度一定与 n 1 = ( φ x , φ y , φ z ) ( x 0 , y 0 , z 0 ) n 2 = ( ψ x , ψ y , ψ z ) ( x 0 , y 0 , z 0 ) 共面,即梯度可以用 n 1 = ( φ x , φ y , φ z ) ( x 0 , y 0 , z 0 ) n 2 = ( ψ x , ψ y , ψ z ) ( x 0 , y 0 , z 0 ) 线性表示,即必要条件如下

{ f x ( x,y,z )+λ φ x ( x,y,z )+μ ψ x ( x,y,z )=0, f y ( x,y,z )+λ φ y ( x,y,z )+μ ψ y ( x,y,z )=0, f z ( x,y,z )+λ φ z ( x,y,z )+μ ψ z ( x,y,z )=0, φ( x,y,z )=0, ψ( x,y,z )=0. (14)

2. 几何意义

三元函数 u=f( x,y,z ) 在约束条件 { φ( x,y,z )=0 ψ( x,y,z )=0 下在 ( x 0 , y 0 , z 0 ) 取得极值的必要条件(14)式的几何意义为:目标函数 u=f( x,y,z ) 的梯度向量在满足约束条件 { φ( x,y,z )=0 ψ( x,y,z )=0 的点 ( x 0 , y 0 , z 0 ) 处与空间曲线的切向量垂直,则与法向量平行,或者说梯度向量能用约束条件的法向量线性表示,即

gradf| ( x 0 , y 0 , z 0 ) =λ n 1 +μ n 2

其中 gradf| ( x 0 , y 0 , z 0 ) = ( f x , f y , f z )| ( x 0 , y 0 , z 0 ) 表示 u=f( x,y,z ) ( x 0 , y 0 , z 0 ) 梯度方向, λ n 1 +μ n 2 表示空间曲线 { φ( x,y,z )=0 ψ( x,y,z )=0 的法向量。

几何上,约束条件 { φ( x,y,z )=0 ψ( x,y,z )=0 表示空间直角坐标系 Oxyz 中的一条空间曲线,而目标函数在空间直角坐标系 Oxyz 中表示有一系列的等值面,若 u=f( x,y,z ) 在约束条件 { φ( x,y,z )=0 ψ( x,y,z )=0 下取得极值,则必在某等值面与约束曲线相切时取得。

(五) 若目标函数为n元函数 u=f( x 1 , x 2 ,, x n ) ,约束条件为 n1 n元方程 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 组成的方程组。

1. Lagrange乘数法

定理5:要找目标函数n元函数 u=f( x 1 , x 2 ,, x n ) ,约束条件为一个由 n1 个方程组成的n元方程组 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 下的可能极值点,可以先作Lagrange函数:

L( x 1 , x 2 ,, x n )=f( x 1 , x 2 ,, x n )+ λ 1 φ 1 ( x 1 , x 2 ,, x n )++ λ n1 φ n1 ( x 1 , x 2 ,, x n ),

其中 λ k ,( k=1,,n1 ) 为参数,求其对 x 1 , x 2 ,, x n λ k ,( k=1,,n1 ) 一阶偏导数,并使之为零,即

{ f x 1 ( x 1 , x 2 ,, x n )+ λ 1 φ 1, x 1 ( x 1 , x 2 ,, x n )++ λ n1 φ n1, x 1 ( x 1 , x 2 ,, x n )=0, f x n ( x 1 , x 2 ,, x n )+ λ 1 φ 1, x n1 ( x 1 , x 2 ,, x n )++ λ n1 φ n1, x n1 ( x 1 , x 2 ,, x n )=0, φ 1 ( x 1 , x 2 ,, x n )=0, φ n1 ( x 1 , x 2 ,, x n )=0, (15)

由方程组解出 x 1 , x 2 ,, x n λ k ,( k=1,,n1 ) ,这样得到的 ( x 1 , x 2 ,, x n ) 就是函数 u=f( x 1 , x 2 ,, x n )

在附加条件下 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 的可能极值点。

证明:设 ( x 10 , x 20 ,, x n0 ) 为目标函数 u=f( x 1 , x 2 ,, x n ) 在约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 下的极值点,并设 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 能确定隐函数 { x 2 = x 2 ( x 1 ) x 3 = x 3 ( x 1 ) x n = x n ( x 1 ) 则目标函数 u=f( x 1 , x 2 ,, x n ) 变为 u=f( x 1 , x 2 ( x 1 ),, x n ( x 1 ) ) 。又 u=f( x 1 , x 2 ,, x n ) ( x 10 , x 20 ,, x n0 ) 处取得极值,则 du d x 1 | x 1 = x 10 =0

f x 1 ( x 1 , x 2 ,, x n )+ f x 2 ( x 1 , x 2 ,, x n ) d x 2 d x 1 | ( x 10 , x 20 ,, x n0 ) ++ f x n ( x 1 , x 2 ,, x n ) d x n d x 1 | ( x 10 , x 20 ,, x n0 ) =0,

( f x 1 , f x 2 ,, f x n ) ( x 10 , x 20 ,, x n0 ) ( 1, d x 2 d x 1 | ( x 10 , x 20 ,, x n0 ) ,, d x n d x 1 | ( x 10 , x 20 ,, x n0 ) )=0,

亦或

gradf| ( x 0 , y 0 , z 0 ) T=0

其中

gradf| ( x 10 , x 20 ,, x n0 ) = ( f x 1 , f x 2 ,, f x n ) ( x 10 , x 20 ,, x n0 )

T=( 1, d x 2 d x 1 | ( x 10 , x 20 ,, x n0 ) ,, d x n d x 1 | ( x 10 , x 20 ,, x n0 ) ) 表示空间曲线 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 ( x 10 , x 20 ,, x n0 ) 处的切向量。

空间曲线的切向量 T 垂直于 n 1 =( φ 1 x 1 , φ 1 x 2 ,, φ 1 x n ) n 2 =( φ 2 x 1 , φ 2 x 2 ,, φ 2 x n ) n n1 =( φ n1, x 1 , φ n1, x 2 ,, φ n1, x n ) ,显然, n 1 , n 2 ,, n n1 n维空间中 n1 个线性无关的向量,梯度可以用 n 1 , n 2 ,, n n1 线性表示。

2. 几何意义

几何上,约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 表示n维空间中的一条空间曲线,而目标函数在n维空间中表示有一系列的等值超曲面,若 u=f( x 1 , x 2 ,, x n ) 在约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 下取得极值,则必在某等值超曲面 u=f( x 1 , x 2 ,, x n )= C 0 (某常数)与约束曲线 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ n1 ( x 1 , x 2 ,, x n )=0 相切时取得。

(六) 若目标函数为n元函数 u=f( x 1 , x 2 ,, x n ) ,约束条件为mn元方程组成的一个方程组

{ φ 1 ( x 1 , x 2 ,, x n )=0, φ 2 ( x 1 , x 2 ,, x n )=0, φ m ( x 1 , x 2 ,, x n )=0, ( m<n )

1. Lagrange乘数法

定理6:要找目标函数二元函数 u=f( x 1 , x 2 ,, x n ) ,约束条件为mn元方程组成的一个方程组

{ φ 1 ( x 1 , x 2 ,, x n )=0, φ 2 ( x 1 , x 2 ,, x n )=0, φ m ( x 1 , x 2 ,, x n )=0, ( m<n )

下的可能极值点,可以先作Lagrange函数:

L( x 1 , x 2 ,, x n ; λ 1 , λ 1 ,, λ m )=f( x 1 , x 2 ,, x n )+ λ 1 φ 1 ( x 1 , x 2 ,, x n )++ λ m φ m ( x 1 , x 2 ,, x n ),

其中 λ k ,k=1,2,,m 为参数,求其对 x i ,i=1,2,,n λ k ,k=1,,m 一阶偏导数,并使之为零,即

{ f x 1 ( x 1 , x 2 ,, x n )+ λ 1 φ 1 x 1 ( x,y,z )++ λ m φ m x 1 ( x,y,z )=0, f x 2 ( x 1 , x 2 ,, x n )+ λ 1 φ 1 x 2 ( x,y,z )++ λ m φ m x 2 ( x,y,z )=0, f x n ( x 1 , x 2 ,, x n )+ λ 1 φ 1 x n ( x,y,z )++ λ m φ m x n ( x,y,z )=0, φ 1 ( x 1 , x 2 ,, x n )=0, φ 2 ( x 1 , x 2 ,, x n )=0, φ m ( x 1 , x 2 ,, x n )=0, (16)

由方程组解出 x 1 , x 2 ,, x n λ 1 , λ 1 ,, λ m ,这样得到的 ( x 1 , x 2 ,, x n ) 就是函数 f( x 1 , x 2 ,, x n ) 在附加条

件下 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ m ( x 1 , x 2 ,, x n )=0 ( m<n ) 的可能极值点。

证明略。

2. 几何意义

n元函数 u=f( x 1 , x 2 ,, x n ) 在约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ m ( x 1 , x 2 ,, x n )=0 ( m<n ) 下在 ( x 10 , x 20 ,, x n0 ) 取得极值的必要条件(16)式的几何意义为:目标函数 u=f( x 1 , x 2 ,, x n ) 的梯度向量在满足约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ m ( x 1 , x 2 ,, x n )=0 ( m<n ) 的点 ( x 10 , x 20 ,, x n0 ) 处与空间超曲面的切平面垂直,即与空间超曲面的法向量平行,或者说梯度向量能用约束条件的法向量线性表示,即

gradf| ( x 10 , x 20 ,, x n0 ) = λ 1 n 1 + λ 1 n 2 ++ λ m n m

其中 gradf| ( x 10 , x 20 ,, x n0 ) 表示 u=f( x 1 , x 2 ,, x n ) ( x 10 , x 20 ,, x n0 ) 梯度方向, λ 1 n 1 + λ 1 n 2 ++ λ m n m 表示空间超曲面 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ m ( x 1 , x 2 ,, x n )=0 ( m<n ) 的法向量。

几何上,约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ m ( x 1 , x 2 ,, x n )=0 ( m<n ) 表示n维空间的m维的超曲面,而目标函数n维空间表示有一系列的等值超曲面,若 u=f( x 1 , x 2 ,, x n ) 在约束条件 { φ 1 ( x 1 , x 2 ,, x n )=0 φ 2 ( x 1 , x 2 ,, x n )=0 φ m ( x 1 , x 2 ,, x n )=0 ( m<n ) 下取得极值,则必在某等值超曲面与约束超曲面相切时取得。

3. 小结

针对教材中仅仅对目标函数为二元函数,约束条件为一个二元方程时,给出了Lagrange乘数法的基本思想与详细的做法,但对于自变量多余两个、约束条件多余一个的情形的Lagrange乘数法只是简单提及,没有给出详尽的推导过程的现象,本文主要探讨了Lagrange乘数法的一般意义的推广以及几何意义。

按照“横向”和“纵向”两个维度对Lagrange乘数法进行推广。Lagrange乘数法的“横向”推广包括如下情形:1. 目标函数为三元函数,约束条件为一个三元方程;2. 目标函数为n元函数,约束条件为一个n元方程。Lagrange乘数法的“纵向”推广包括如下情形:1. 目标函数为三元函数,约束条件为由2个3元方程组成的三元方程组;2. 目标函数为n元函数,约束条件为 n1 n元方程组成的方程组;最后得出了Lagrange乘数法一般推广:目标函数为n元函数,约束条件为mn ( m<n ) 元方程组成的方程组。

至于Lagrange乘数法的几何意义可以统一理解为:若目标函数在约束条件下取得极值,则必在目标函数等于某常数时表示的等值超曲面与约束条件表示的超曲面相切时取得。或者用线性代数的术语叙述:若目标函数在约束条件下在某点处取得极值,则目标函数在该点处的梯度向量能用约束条件方程的法向量线性表示。

基金项目

海军航空大学科研自主立项项目(H2202301004)。

参考文献

[1] 同济大学数学科学学院. 高等数学(下) [M]. 第八版. 北京: 高等教育出版社, 2023: 112-117.
[2] 杨丽娜. 拉格朗日乘子法几何意义的教学设计[J]. 高等数学研究, 2023, 26(2): 49-51+60.
[3] 陈建发. 关于拉格朗日乘数法的几何意义[J]. 高等数学研究, 2016, 19(2): 35-36.
[4] 马明华, 李明, 孙宁. 关于微积分中多元函数极值教学的几点思考[J]. 科技风, 2023(23): 63-65.
[5] 汪良辉. Lagrange乘数法的几何意义[J]. 杭州师院学报(自然科学版), 1985(S1): 78-79.
[6] 杨俊兴. 从几何角度给予拉格朗日乘数法新的推导思路[J]. 高等数学研究, 2016, 19(2): 54-55.
[7] 李长青. 高等数学教学中应重视几何直观的作用[J]. 高等数学研究, 2007, 10(2): 25-27.