多项式近似因式分解的可信验证
The Verification of Approximate Polynomial Factorization
DOI: 10.12677/AAM.2020.98144, PDF, HTML, XML, 下载: 589  浏览: 784  科研立项经费支持
作者: 严杰煜, 李 喆*:长春理工大学理学院,吉林 长春
关键词: 多元多项式近似因式分解可信验证Multivariate Polynomial Approximate Factorization Verification
摘要: 众所周知,系数有扰动多项式的因式分解是不连续的。因此,传统的多项式因式分解对于数值计算来说是一个不适定问题。本文利用区间算法,研究多项式近似因式分解的可信计算。给定一个实多项式,本文利用已有算法计算给定多项式其因式分解流形结构,设计算法输出在该因式分解流形结构中一系数为区间的因式分解。算法保证,在该区间因式分解中存在一系数为实数的因式分解,其所对应的多项式为在确定的因式分解流形结构中与给定多项式残差最小的多项式。
Abstract: It is well-known for a polynomial with perturbed coefficients, its factorization is discontinuous. Therefore, the traditional polynomial factorization is an ill-posed problem for numerical computation. This paper is to study the trusted computing of polynomial approximate factorization on the basis of interval algorithm. Given a polynomial of real coefficients, this paper uses the existing algorithm to compute the structure of factorization manifold, and provides a verification algorithm to compute a factorization with interval coefficients in the computed factorization manifold structure. The algorithm is guaranteed that there exists a real factorization within this interval factorization such that the corresponding polynomial of the real factorization is the polynomial with the minimum residual in the computed decomposition manifold structure.
文章引用:严杰煜, 李喆. 多项式近似因式分解的可信验证[J]. 应用数学进展, 2020, 9(8): 1230-1238. https://doi.org/10.12677/AAM.2020.98144

1. 引言

多项式因式分解是多项式基本运算的主要研究问题之一,也是Maple,Mathematica等计算机代数系统的主要功能之一。国内外很多学者对多项式因式分解问题进行了大量的研究。Lenstra和Lovasz [1] 首先提出了关于一元多项式因式分解的时间算法。该算法使用Berlekamp算法并结合Hensel引理对有限域上的多项式进行因式分解。Kaltofen和Von zur Gathen [2] [3] 给出了多元多项式因式分解的时间算法,并对该算法的时间复杂性进行了严格的证明。目前,精确的二元多项式因式分解时间复杂性最低的算法是由Lecerf [4] 提出的。Gao [5] 在Ruppert [6] 针对多项式微分形式相关结论的启发下,提出了一种新的因式分解算法。该算法首先利用Hilbert不可约定理,将多项式由多元降为二元,并提出了二元多项式任意域上的因式分解方法。

众所周知,多项式其系数微小的摄动都有可能改变其因式分解的结构。因此,对于系数有扰动的多项式,其因式分解计算是不连续的。于是当一个多项式系数的精确度有限时,其因式分解计算就显得十分困难。随着对多项式因式分解研究的逐步深入,学者们将研究工作从符号计算扩展到数值计算。Sasaki [7] 通过矩阵运算尽可能多的得到零和关系,提出了一种有效算法改进了多项式的近似因式分解算法。Gao、Kaltofen、May、Yang和Zhi [8] [9] 基于Ruppert和Gao针对多元多项式微分形式的研究成果,利用奇异值分解,结构总体最小二乘以及高斯–牛顿算法来计算多元多项式近似因式分解。Corless、Galligo和Giesbrecht等人 [10] [11] [12] 从几何角度研究了多项式因式分解问题。他们基于参数空间中的投影和随机环上的延拓法,从一个具有扰动的多项式中重建一个近似多项式及其不可约因子,通过建立因式分解的分层复解析流形及其管状邻域,设计了多项式因式分解的数值算法。Kahan [13] 发现了对于不适定代数问题不连续解的流形上隐藏的连续性,解决了对数据微小变化敏感的多项式因式分解的计算问题。Wu和Zeng [14] 提出了基于多项式空间几何和因式分解流形分层的数值分解概念,证明了多项式数值因式分解的存在性、唯一性、李普希茨连续性和收敛性,并提出了多项式数值因式分解算法。该算法消除了传统因式分解的病态性,将数值计算中的不适定因式分解问题完全正则化。

本文利用区间算法,在文献 [14] 工作的基础上设计了在确定因式分解流形结构下,与给定多项式残差向量2-范数最小的多项式的可信计算方法。

2. 预备部分

本文分别用 + 表示非负整数集合、实数集合和正实数集合。用 来表示 n 上的乘积顺序,对于 α = ( α 1 , α 2 , , α n ) T β = ( β 1 , β 2 , , β n ) T n α β 当且仅当 α i β i i = 1 , 2 , , n 。用 l e x 表示 n 上的字典序,若向量 β α 的最左边的非零项是正的,记为 α l e x x β 。假设向量 x = ( x 1 , x 2 , , x r ) T 的分

量为变量, M ( x ) 是一个 m × n 维矩阵,该矩阵的每一个分量都是关于变量 x 1 , x 2 , , x r 的函数, M ( x ) x k 表示分量为 M i , j ( x ) x k 的矩阵,其中 1 i n 1 j m 1 k r I n 表示 n × n 维单位矩阵, O m , n 表示 m × n 维零矩阵。

[ x ] : = [ x 1 , x 2 , , x r ] 是关于变量 x 1 , x 2 , , x r 的r元多项式环。令 x α : = x 1 α 1 x 2 α 2 x r α r [ x ] 中的单项,其中 α = ( α 1 , α 2 , , α r ) n 。多项式 f [ x ] 是单项式的有限线性组合,即f可以写成以下形式

f = β = ( β 1 , β 2 , , β n ) T n c β x β , c β

deg x i ( f ) 表示多项式f关于变量 x i 的次数,则多项式f的次数定义为 deg ( f ) = ( deg x 1 ( f ) , deg x 2 ( f ) , , deg x n ( f ) ) T 。令 [ f ] 表示 i = 1 n ( deg x i ( f ) + 1 ) 维向量,其分量是由多项式

f的系数按字典序降序排列而成的向量。文献 [8] [9] [15] 引入了多项式w关于次数 l = ( l 1 , l 2 , , l n ) T 的卷积矩阵 C l ( w ) ,对于一个 deg ( w ) = l 的多项式w,矩阵 C l ( w ) 乘以 [ f ] 得到的向量为多项式w乘以多项式f所得的多项式其系数按照字典序排列而成的向量。

I 表示所有区间 { [ x _ , x ¯ ] : x _ , x ¯ , x _ x ¯ } 构成的集合。区间向量 X = ( X 1 , X 2 , , X n ) T 是一个分量为区间的n维向量组,且满足条件

X = { ( x 1 , x 2 , , x n ) n : x i X i , 1 i n } .

区间矩阵 A I m × n 是具有区间项的矩阵,如果区间矩阵A中的任意实矩阵是满秩的,则称区间矩阵A满秩。如果属于区间矩阵 M I m × n 的任意实矩阵M,对所有的 1 i n 1 j n 满足条件 M i , j = M j , i ,则称区间矩阵M是区间对称矩阵。如果区间对称矩阵M中的每一个对称矩阵都为正定矩阵,则称区间对称矩阵M为区间对称正定矩阵。对于一个区间对称矩阵M,INTLAB工具箱 [16] 中的isspd函数可以验证M的正定性,即命令isspd (M)返回值为1,说明区间对称矩阵M为对称正定矩阵。

定理1 (见 [17]):设 f : n n f = ( f 1 , , f n ) T f 1 , , f n 是连续可微函数。对于 x ˜ n 和区间向量 X I n ,其中 0 X ,令 f ( x ˜ + X ) 表示 f 在区间 x ˜ + X 处的区间雅可比矩阵。给定 R n × n 和满足条件 f ( x ˜ + X ) M 的区间矩阵 M I m × n ,若

R f ( x ˜ ) + ( I n R M ) X int ( X ) ,

则存在唯一的 x ^ x ˜ + X ,使得 f ( x ^ ) = 0 ,其中 int ( X ) 表示 X 的内部。

3. 多项式近似因式分解

假设 γ p 1 k 1 p 2 k 2 p r k r 是多项式 f [ x ] 的近似因式分解,其中 γ k 1 k 2 k r k i p 1 , p 2 , , p r 是成对互质的无平方多项式,且对于任意的 1 i r deg ( p i ) = m i = ( m i , 1 , m i , 2 , , m i , n ) T 。Wu和Zeng在文献 [14] 中提出了基于多项式空间几何和分解流形分层的数值多项式分解的概念,并且定义多项式全体近似因式分解的子集

F m 1 k 1 m 2 k 2 m r k r = { γ p 1 k 1 p 2 k 2 p r k r : γ , deg p i m i , i = 1 , , r ; p 1 , p 2 , , p r } . (1)

Wu和Zeng称子集 F m 1 k 1 m 2 k 2 m r k r 中任意一个多项式的因式分解流形结构为 m 1 k 1 m 2 k 2 m r k r ,并引入了以下向量

b i = ( b i , β | β n , β m i ) T , 1 i r , (2)

其中向量 b i 的分量是按照关于 β 的字典序降序排列。然后,Wu和Zeng将求解因式分解流形结构 m 1 k 1 m 2 k 2 m r k r 上的近似因式分解问题转换成计算下述超定方程组的最小二乘解

ϕ ( γ , [ p 1 ] , , [ p r ] ) = ( [ γ p 1 k 1 p r k r f ] b 1 T [ p 1 ] 1 b r T [ p r ] 1 ) = 0. (3)

4. 主要结果

4.1. 数值部分

数值部分利用文献 [8] 中的数值多项式因式分解算法来计算因式分解流形结构 m 1 k 1 m 2 k 2 m r k r 。然后,求超定方程组(3)的最小二乘解,得到该因式分解流形结构上高精度的近似解,记作

f γ ¯ p ¯ 1 k 1 p ¯ 2 k 2 p ¯ r k r .

我们引入扰动向量

e i = ( e i , β | β n , β m i ) T , 1 i r , (4)

其中向量 e i 的分量关于 β 的字典序降序排列。定义扰动多项式 p ¯ i ( e i )

p ¯ i ( e i ) = p ¯ i + β n , β m i e i , β x β , 1 i r .

为了简化表达式,令 e = ( e 1 , e 2 , , e r ) T ,定义非线性函数

F ( e ) = [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] 2 2 , (5)

定义

q ¯ i ( e ) = ( k i p ¯ i ( e i ) ) γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r , 1 i r .

非线性函数 F ( e ) 的梯度为

F ( e ) = { C m 1 T ( q ¯ 1 ( e ) ) [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] C m 2 T ( q ¯ 2 ( e ) ) [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] C m r T ( q ¯ r ( e ) ) [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] , (6)

其中 C m i ( q ¯ i ( e ) ) 是多项式 q ¯ i ( e ) 关于次数 m i = ( m i , 1 , m i , 2 , , m i , n ) T 的卷积矩阵。关于变量 e i , β ,有 F ( e ) e i , β 的偏导数如下

F ( e ) e i , β = ( C m 1 T ( q ¯ 1 ( e ) ) e i , β [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] C m 2 T ( q ¯ 2 ( e ) ) e i , β [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] C m r T ( q ¯ r ( e ) ) e i , β [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] ) + ( C m 1 T ( q 1 ( e ) ) C m 2 T ( q 2 ( e ) ) C m r T ( q r ( e ) ) ) [ γ p ¯ 1 ( e 1 ) k 1 p ¯ 2 ( e 2 ) k 2 p ¯ r ( e r ) k r f ] e i , β . (7)

注1:数值部分的主要工作是计算下列优化问题的稳定点

min F ( e ) s .t . { b 1 T [ p ¯ 1 ( e 1 ) ] 1 = 0 b 2 T [ p ¯ 2 ( e 2 ) ] 1 = 0 b r T [ p ¯ r ( e r ) ] 1 = 0 . (8)

¨

通过引入拉格朗日算子 λ = ( λ 1 , λ 2 , , λ r ) T ,定义拉格朗日函数

G ( e , λ ) = F ( e ) + i = 1 r λ i ( b i T [ p ¯ i ( e i ) ] 1 ) , (9)

则有

G ( e , λ ) = [ F ( e ) b 1 T [ p ¯ 1 ( e 1 ) ] 1 b 2 T [ p ¯ 2 ( e 2 ) ] 1 b r T [ p ¯ r ( e r ) ] 1 ] + [ λ 1 b 1 λ 2 b 2 λ r b r 0 0 0 ] . (10)

由于 G ( e , λ ) 的Hession矩阵不包含变量 λ i 1 i r ,为了方便起见将 G ( e , λ ) 写作 G ( e ) ,显然,

G ( e ) = [ b 1 F ( e ) b 2 b r b 1 T b 2 T O r × r b r T ] . (11)

注2:通过选择零向量作为初始值,数值部分采用数值牛顿迭代法

( e ¯ λ ¯ ) ( e ¯ λ ¯ ) G ( e ¯ ) 1 G ( e ¯ , λ ¯ ) (12)

计算非线性系统 G ( e , λ ) = 0 的近似解 ( e ¯ , λ ¯ ) 。 ¨

4.2. 验证部分

验证部分分为两个阶段,第一阶段验证非线性系统 G ( e , λ ) = 0 近似解的可信误差界,第二阶段验证优化问题(8)的稳定点是否为其局部最优解。

注 3:对于满足 e ¯ E ˜ 的区间向量 E ˜ ,使用区间运算和式(6) (7) (11)计算区间雅克比矩阵 G ( E ˜ ) 。利用定理1和verifynlss函数计算区间向量 E ^ Λ ^ ,其满足条件存在实向量 e ^ E ^ 和实向量 λ ^ Λ ^ ,使得 G ( e ^ , λ ^ ) = 0 。 ¨

对每个 1 i r ,令 s i 表示 e i 的维数,令 s = i = 1 r s i 。记 E = ( E 1 , E 2 , , E r ) T ,其中 E i I s t 。向量 E i b i e i 的最后一项分别用 E i , s b i , s 表示,令分别表示向量删除最后一项所得的向量。

不失一般性,我们假设

对每一个,存在一个关于变量的线性函数,其满足条件

显然,

定义非线性函数

则有约束优化问题(8)可以转化为下面无约束优化问题

(13)

验证部分第二阶段使用isspd函数验证区间Hession矩阵的正定性。当isspd函数返回值为1时,满足条件的实向量为问题(8)的局部最优解。

5. 主要算法

算法1

输入

输出,或“Failure”。

步骤1 数值部分

步骤1.1 计算多项式f的因式分解流形结构

步骤1.2 计算系统(3)的近似解

步骤1.3 计算系统的近似解

步骤2 验证部分

步骤2.1 初始化

步骤2.2 当进行以下操作:

计算

,则令

如果,则返回“Failure”并停止。

步骤2.3 计算区间Hession阵,若isspd返回值为1,则输出,否则,返回“Failure”。 ¨

注4:在算法1中,给定实数x,则intval(x)输出区间。给定实数a,b,其中,则输出实区间。给定,则输出包含和零向量的最小的区间向量。 ¨

通过以上分析可以得到下述定理。

定理2:假设算法1成功输出因式分解流形结构,系数向量和摄动区间向量,则存在一个实向量,它是优化问题(8)的局部最优解。

6. 算例

例1 考虑多项式,其中多项式。摄动多项式r与f的次数相同且r的系数是[−5, 5]上随机的一个数。应用算法1可得

因此根据定理2,存在一个实向量,它是优化问题(8)的局部最优解。

例2 [14] 考虑多项式,其中多项式。应用算法1可得

因此根据定理2,存在一个实向量,它是优化问题(8)的局部最优解。

例3考虑单变量多项式,其中多项式。摄动多项式r与f的次数相同且r的系数是[−5, 5]上随机的一个数。应用算法1可得

因此根据定理2,存在一个实向量,它是优化问题(8)的局部最优解。

基金项目

吉林省自然科学基金(批准号:11601039)。

NOTES

*通讯作者。

参考文献

[1] Lenstra, A., Lenstra, H. and Lovasz, L. (1982) Factoring Polynomials with Rational Coefficients. Mathematische Annalen, 261, 515-534.
https://doi.org/10.1007/BF01457454
[2] Von zur Gathen, J. and Kaltofen, E. (1985) Factoring Sparse Multivariate Polynomials. Journal of Computer and System Sciences, 31, 265-287.
https://doi.org/10.1016/0022-0000(85)90044-3
[3] Kaltofen, E. (1985) Polynomial-Time Reductions from Multivariate to Bi- and Univariate Integral Polynomial Factorization. SIAM Journal on Computing, 14, 469-489.
https://doi.org/10.1137/0214035
[4] Lecerf, G. (2010) New Recombination Algorithms for Bivariate Polynomial Factorization Based on Hensel Lifting. Applicable Algebra in Engineering, Communication and Computing, 21, 151-176.
https://doi.org/10.1007/s00200-010-0121-5
[5] Gao, S. (2003) Factoring Multivariate Polynomials via Partial Differential Equations. Mathematics of Computation, 72, 801-822.
https://doi.org/10.1090/S0025-5718-02-01428-X
[6] Ruppert, W. (1999) Reducibility of Polynomials f(x, y) Modulo p. Journal of Number Theory, 77, 62-70.
https://doi.org/10.1006/jnth.1999.2381
[7] Sasaki, T. (2001) Approximate Multivariate Polynomial Factorization Based on Zero-Sum Relations. In: Proceedings of ISSAC 2001, ACM Press, New York, 284-291.
https://doi.org/10.1145/384101.384139
[8] Gao, S., Kaltofen, E., May, J., Yang, Z. and Zhi, L. (2004) Approximate Factorization of Multivariate Polynomials via Differential Equations. In: Proc. ISSAC’04, ACM Press, New York, 167-174.
https://doi.org/10.1145/1005285.1005311
[9] Kaltofen, E., May, J., Yang, Z. and Zhi, L. (2008) Approximate Factorization of Multivariate Polynomials Using Singular Value Decomposition. Journal of Symbolic Computation, 43, 359-376.
https://doi.org/10.1016/j.jsc.2007.11.005
[10] Corless, R., Giesbrecht, M., Van Hoeij, M., Kotsireas, I. and Watt, S. (2001) Towards Factoring Bivariate Approximate Polynomials. In: Proc. of ISSAC’01, ACM Press, New York, 85-92.
https://doi.org/10.1145/384101.384114
[11] Corless, R., Galligo, A., Kotsireas, I. and Watt, S. (2002) A Geometric-Numeric Algorithm for Absolute Factorization of Multivariate Polynomials. In: Proc. of ISSAC’02, ACM Press, New York, 37-45.
https://doi.org/10.1145/780506.780512
[12] Galligo, A. and Van Hoeij, M. (2007) Approximate Bivariate Factorization, a Geometric Viewpoint. In: Proceedings of SNC’07, ACM Press, New York, 1-10.
[13] Kahan, W. (1972) Conserving Confluence Curbs Ill-Condition. Technical Report, Computer Science Department, University of California, Berkeley.
[14] Wu, W.Y. and Zeng, Z.G. (2017) The Numerical Factorization of Polynomials. Foundations of Computational Mathematics, 17, 259-286.
https://doi.org/10.1007/s10208-015-9289-1
[15] Galligo, A. and Watt, S. (1997) A Numerical Absolute Primality Test for Bivariate Polynomials. In: Proceedings of ISSAC97, ACM Press, New York, 217-224.
https://doi.org/10.1145/258726.258788
[16] Rump, S.M. (1999) INTLAB-Interval Laboratory. Springer Netherlands, Berlin.
https://doi.org/10.1007/978-94-017-1247-7_7
[17] Rump, S.M. (1983) Solving Algebraic Problems with High Accuracy. In: Kulisch, W.L. and Miranker, W.L., Eds., A New Approach to Scientific Computation, Academic Press, San Diego, 51-120.
https://doi.org/10.1016/B978-0-12-428660-3.50010-0