1. 引言
二次型作为一种重要的数学工具既能把二次函数、双曲线和椭圆这样的曲线表达成一般线性方程组,又能把多项式方程和复变函数这样的非线性方程组表达成线性方程组的集合,在一定条件下也能把多项式方程或复变函数这些线性方程组化为二次型问题来求解。所以二次型理论在多元函数极值与条件极值问题中有重要地位与广泛应用。
关于这方面的内容,目前已有很多学者进行了相关研究。早在1997年,米少田 [1] 就讨论了二次型理论在判定多元函数极值中的应用以及存在的局限性。随后董丽华、梁伟秋等人 [2] [3] [4] 也分别研究过类似问题。卢里举 [5] 从二次型多项式的正定性判别作为切入点,研讨得到极值判定的充分条件,并给出该方法在多元线性回归中计算回归系数的应用。刘爱德 [6] 等人从矩阵角度出发阐述了多元函数在稳定点取得极值的充分条件,并用代数方法解决了两类多元函数的极值问题。陈荣群和黄勇 [7] 着重研究用二次型理论求两种特殊类型函数的条件极值,并讨论一般元二次式的极值和判别法。黄朝军 [8] 探讨了二次型矩阵在多元函数的最值和条件极值中的应用。杨廷鸿等人 [9] 从Lagrange条件极值出发,讨论二项式条件极值的Lagrange乘数法求解,并将其迁移到矩阵特征值问题,进一步拓展到n维空间。本文在前人研究的基础上,全面阐述二次型理论、矩阵特征值在多元函数极值和条件极值中的应用并解析二次型理论在判定条件极值时存在的不足。当判别法失效时,利用二次型与多元函数间的联系,求解多元函数极值时一般要对驻点邻域内函数二阶微分的符号进行判断。但是限于多个变量等因素,计算函数的二阶微分时会产生很大的计算量。
安排如下:第二部分给出二次型理论、矩阵特征值和极值存在的充分条件,为后面内容提供理论支撑。第三部分是本文的核心,主要介绍多元二次齐次函数的极值与矩阵特征值之间的关系、二次型理论在多元函数极值和最值中的应用、二次型理论在多元函数条件极值中的应用及存在的局限性。第四部分对全文内容进行总结和概括。
2. 准备知识
有关二次型的概念、性质及相关定理以及极值存在的充分条件,详细内容可参看文献 [10] [11] 。
定义1 设A是n阶矩阵,若存在实数
和非零向量
满足
,则称
为矩阵A的特征值,X为对应于
的特征向量。
定义2 数域P上的一个n元二次型是系数在P中的含n个变量的二次齐次多项式,其一般形式是
简写成
,其中
,令
,称A为二次型
的矩阵,此时
。
定义3 设实二次型
,
,
,则
1) 若对
,有
,则称f为正定二次型,A为正定矩阵。
2) 若对
,有
,则称f为负定二次型,A为负定矩阵。
3) 若对
,有
,则称f为半正定二次型,A为半正定矩阵。
4) 若对
,有
,则称f为半负定二次型,A为半负定矩阵。
5) 其余情形,则称f为不定二次型,A为不定矩阵。
定理1 设实二次型
是正定(负定)二次型,其中
,
,则
,
。
证明 这里以f是正定二次型为例给出证明,f是负定二次型时,证明过程类似。
根据正定二次型的定义,取
,有
。取
,有
。依次下去,取
,有
。综上,结论成立。
定理2 (极值的充分条件)
是函数
的驻点,
在
附近具有二阶连续偏
导数,记
,则
1) 当
是正定矩阵时,
是极小值点,
是极小值;
2) 当
是负定矩阵时,
是极大值点,
是极大值;
3) 当
是不定矩阵时,
不是极值点,
不是极值;
4) 当
是半正定或半负定时,无法判断
是否为极值点;
分析 将函数
在点
处Taylor展开,结合矩阵与二次型之间的关系即可得到结论,详细证明过程可参看 [3] [6] 。
注1 i) 若函数
在点
处满足
,则
是函数的驻点。
ii) 矩阵
是函数
在点
处的Hessian矩阵。
iii) 对于条件极值而言,当
是正定(负定)矩阵时,
是满足约束条件的极小(大)值点,
是满足约束条件的极小(大)值;当
是不定矩阵时,无法判断
是否为满足约束条件的极值点。反例可参看本文的例5、例6。
3. 经典解析
3.1. 多元函数
的极值与矩阵
的特征值之间的联系
例1 (北京交通大学2022年数学分析考研真题)证明:n元实二次型
在单位球面
上的最大值、最小值恰为对称矩阵
的最大、最小特征值。
分析 即证多元函数
在条件
下的最大值、最小值分别是矩阵
的最大、最小特征值。
解 首先求
在条件
下的最值,构造Lagrange函数
,
L关于
求偏导,得
(1)
将前n个方程分别乘以
后相加,并结合
可知
。
即方程组(1)的解
满足
(2)
其次,易知方程组(1)中的前n个线性方程组的系数矩阵为A,且满足
。即
为矩阵A的特征值,而
为对应于
的特征向量。由于f在有界闭区域
上连续,从而存在最大值与最小值,所以由(2)式可知f的最大值与最小值分别为矩阵A的最大特征值与最小特征值。
3.2. 二次型理论在多元函数极值中的应用
例2 求函数
的极值。
分析 先求可能的极值点,再进一步判断。
解 第一:求可能的极值点。
解方程
求得驻点:
,
,
;
第二:判断。求二阶偏导数,
,
,
。
处,对应的Hessian矩阵
,各阶顺序主子式:
,
,
即
是正定矩阵,故
是极小值点,极小值为
。
处,对应的Hessian矩阵
,各阶顺序主子式:
,
,即
是正定矩阵,故
是极小值点,极小值为
。
处,对应的Hessian矩阵
,
。但注意到
,且
,
在曲线上
,
,
在曲线上
,
,故
不是极值点;
综上,
、
是极小值点,相应的极小值为
。
3.3. 二次型理论在多元函数最值中的应用
例3 (第十三届全国大学生数学竞赛)设
是单位开球,函数u,v在
上连续,在B内二阶连续可导,满足
(3)
其中
,
,
表示B的边界,证明:
。
分析 方程组(3)中的前两个方程均含有
的形式,且要证明的结论是
,为便于讨论,利用形式统一法将
视为一个整体进行分析与探究。
证明 记
,则
,
。
即w满足以下方程
(4)
显然,
。所以
必然在
上达到最大值,设最大值点为
。
若
,即
是函数
的内部极值点,则
。记
是函数
在点
处的
Hessian矩阵,则
是负定矩阵,由定理1知,
,
。从而
。于是
由(4)得到,在
处,
,
而
,故上式表明
。
若
,则由(4),
。
综上,恒有
,
;即
。
3.4. 二次型理论在多元函数条件极值中的应用及其存在的局限性
3.4.1. 二次型理论在多元函数条件极值中的应用
例4 求函数
在条件
下的极值。
解 第一:构造Lagrange函数
。
第二:求Lagrange函数的驻点。解方程
(5)
得
,记
。
函数L在点
处的Hessian矩阵
,
因
,故
是正定矩阵。即
有唯一的极小值
,并且也是最小值。故
在条件
下的极小值为
。
注2 由例4,可得到如下结论
函数
在条件
下的最小值为
,即
。
故利用Lagrange函数求多元函数的条件极值时,还可以用来证明不等式。
例5 求函数
在条件
下的极值。
解 方法1 转化为无条件极值(略);
方法2 Lagrange乘数法
第一:构造Lagrange函数
;
第二:求Lagrange函数的驻点,解方程
(6)
得
,
,
,
,记
;当
时,将其代入(6)得,
(舍)。
第三:判断。
构造函数
;计算函数
在点
处的Hessian矩阵
,则
的各阶顺序主子式:
,
,
,
即
是不定矩阵。此时无法判断
是否为满足约束条件的极值点。
接下来使用二阶微分法判断。
,
;
当
时,
,此时无法判断
的符号;结合条件
,等式两边同时微分得,
,在点
处,
,将其代入
得,
,
;
故
是极小值点,极小值为
。
例6 求函数
在条件
下的极值。
解 方法1 转化为无条件极值(略);
方法2 Lagrange乘数法
第一:构造Lagrange函数
;
第二:求Lagrange函数的驻点,解方程
(7)
解得
,记
。
第三:判断。
构造函数
;函数
在点
处的Hessian矩阵
,显然
是不定矩阵。但在约束条件
下
,取
,
,则
,
,可知
不是满足约束条件的极值点。
3.4.2. 二次型理论在求解多元函数条件极值时所存在的局限性
由例4可知,利用二次型的正定性来判断多元函数的条件极值是一个非常便捷的方法,但也存在一定的局限性。因为二次型的正定、负定仅是
成为满足约束条件极值点的充分条件而非必要条件。比如例5,很多学生会计算函数
在点
处的Hessian矩阵,但此时判别法失效。这里通过二阶微分法有效地判断出
是条件极值的极小值点。对于例6,判别法也失效,这里根据目标函数本身的结构特征进行判断。
虽然二次型理论在多元函数极值和条件极值的应用上存在一定的局限性,但有必要进一步的探讨和研究。在判断多元函数的极值和条件极值时,为了克服这些不足,我们可根据具体问题情况选择恰当的方法进行分析和求解。
为巩固读者对二次型理论在多元函数极值和条件极值中应用的理解,提供以下题目供其练习。
1) 设实二次型
的矩阵A的最大特征值为
,最小特征值为
,证明:对于任意实数
,都有
。
2) 求函数
的极值。
3) 证明
。
4) 求函数
在条件
下的极值。
4. 结束语
二次型理论在多元函数极值和条件极值的计算及解析过程中有广泛的应用,是最基础也是最重要的工具之一。掌握二次型理论,有助于深入理解相关领域的知识,提高分析和计算能力,达成对实际问题的准确把握。
但在实际应用中发现二次型理论也存在一些不足。例如,二次型理论没有给出多元函数极值和条件极值的具体计算公式,这在多元函数极值和条件极值中是十分重要的。又如对于高阶甚至非二次的函数,二次型理论就很难适用。因此,在处理复杂问题时需要借助更加高级的技巧或者通过计算机进行数值模拟分析。另外二次型理论通常只能处理实域函数,在特定领域中无法完全满足处理比如虚函数等复杂问题的需求。
综上,虽然二次型理论在多元函数极值和条件极值中是一种非常有效的工具,但在实际运用时,有必要将二次型理论应用到实际问题中去,同时还需根据特殊情况和需求来选择合适的数学模型和相应的工具以达到更好的效果。
基金项目
信息工程大学教育教学研究课题(JXYJ2022C010),强军新工科一般课题:强联[2022] 2号。