三尺讲台
教学管理 教改教研 教师培训 学科活动 语言文字宣传
论文:(陈奕)二次型中与极值有关的问题研究
发布时间:2018.12.17


二次型中与极值有关的问题研究



Research on Extreme Values 

in Quadratic Forms



作    者: 陈  奕


湖南省岳阳市弘毅新华中学

二○一八年八月   岳阳




摘   要


二次型的极值问题是数学中的一个研究重要对象. 在这篇文章中, 我们探讨利用二次型理论解决多元二次函数的极值问题, 给出相关问题的解决方法.

关键词: 二次型; 无条件极值; 条件极值























Abstract


Extreme question of the quadratic form is an important research object. In this paper we discuss extreme questions of quadratic function with several variables by the theory of the quadratic form, and give some solving methods for corresponding problems. 

Keywords: quadratic form; unconditional extreme value; conditional extreme value




image.png

0 引言


目前众多论文和教材中所讨论的极值问题尤以一元函数,二元函数最多,怎样去求一个元函数的极值,很多著作、论文和教材都有不同的方法,其中最常见的是用二次型来判别极值. 这些论文或教材的讨论比较零乱,形式不一,内容不全面. 本文主要是在其他论文和教材的论述基础上整理,修正,将二次型与极值联系起来讨论元函数的无条件极值、条件极值,并将元函数的情形运用到二次函数和二次型上,同时将结合特征值来讨论二次型的极值问题. 对于本文涉及而没有注明的概念和结果, 可参考文献[1]-[11].


1 相关基本概念


在这一节中, 我们简单叙述与本文相关联的一些基本概念.

一个系数在数域中,含有个变量的二次齐次多项式

     

 (1)

称为数域上的一个元二次型. 当数域为实数域时(即为实数),这个二次型称为实二次型. 设,而,那么以上二次型(1)可以写为  (2)记二次型其中称为二次型(2)的矩阵,且为对称矩阵,有.

设是一个实二次型 ,对于任意一组不全为零的实数,若都有,则称此二次型为正定的,它的矩阵称为正定矩阵;若都有,则称此二次型为负定的,它的矩阵称为负定矩阵;若都有(或), 则称此二次型为半正定的(或半负定的),矩阵为半正定(或半负定)矩阵;若它不是半正定的,也不是半负定,则称此二次型为不定的,矩阵为不定矩阵.

设元数值函数在点可导,其中,那么称向量


为函数在点的梯度,记作 ,即

.

设元函数对各自变量具有二阶连续偏导数, 则矩阵


称为是函数在点的海森矩阵. 是由函数的个二阶偏导数构成的阶实对称矩阵. 

无条件极值是指对自变量除了限制在定义域内外,并无其他条件.条件极值是指对自变量有附加条件的极值.

设是数域上线性空间的一个线性变换,如果对于数域中一数,存在一个非零向量,使得,那么称为的一个特征值,而称为的属于特征值的一个特征向量.

设是数域上的一级矩阵,是一个文字,矩阵的行列式


称为的特征多项式,这是数域上的一个次多项式.

若矩阵可以由矩阵经过一系列初等变换得到,则与矩阵称为等价的.


2 二次型与极值.


    下面分四种情况,将二次型与极值联系起来,列出相应的定理,归纳总结出其对应的解题步骤,并应用相关知识解题.

2.1利用二次型的性质判定多元函数的无条件极值

2.1.1.多元函数极值的判别定理:

定理2.1  (必要条件) 若点是函数的极值点,并且对各自变量的一阶偏导数都存在,则函数在该点的梯度必然为零,即.

证明 反证法. 不妨设为极大值,而,则存在某一,使

不妨设,则存在的某一邻域,使得在这一邻域内,当时,有

矛盾.故有.

定理2.2  (充分条件)设函数在点的某个邻域内具有直到二阶的连续偏导数,且在该点的梯度,则

(1) 当为正定矩阵时,为的极小值;

(2) 当为负定矩阵时,为的极大值;

(3) 当为不定矩阵时,不是的极值.

证明 考虑在点的泰勒展开式:


将此式用矩阵形式表示:

因为,当,且充分小时,上式可化为

         (3)

由此可以看出是否为的极值,主要取决于(3)式右边的正定性.

a) 当


为正定矩阵时,

,

即为的极小值.

b) 当


为负定矩阵时,

即为的极大值.

c) 当


为不定矩阵时,不是的极值.

2.1.2.一般解题步骤

多元函数在定义域内求极值,可按下述步骤进行:

(1) 取

求出的所有驻点;

(2) 求出在点的海森矩阵;

(3) 判定正定或负定:若正定,则在点取得极小值;若负定,则在点取得极大值.

注:显然,二次型的极值(即元二次函数的极值)也可用此方法求解. 类似地,二次型的条件极值也可以用海森矩阵求解,以下就不再特别指出了.

    2.1.3.应用 

例2.1  求三元实函数的极值.

解 令

则得到驻点

.

的二阶偏倒数分别为 


得到海森矩阵

在处,矩阵

其中矩阵的各价顺序主子式

,,,

因此,不定,不是极值点.

在处,矩阵

其中矩阵的各价顺序主子式

,,,

因此,正定,在处取极小值, 极小值为

.

2.2利用矩阵的秩判定实二次多项式的无条件极值

.   2.2.1 定理

定理2.3  对实元二次多项式,它的前一个和是一个实元二次型,它所对应的实对称矩阵的秩为, 作非退化的线性替换, 其中,,使


把二次型化为只含有平方项的二次型,在此变换下:

情况1:为半正定矩阵

(1) 若, 则存在极小值;

(2) 若, 一次项所含新变数均在平方项中出现, 则有极小值;

(3) 若, 一次项所含新变数至少有一个不在平方项中出现, 则不存在极值.

情况2:为半负定矩阵

(1) 若, 则有极大值;

(2) 若, 一次项所含新变数均在平方项中出现, 则有极大值;

(3) 若, 一次项所含新变数至少有一个不在平方项中出现, 则没有极值存在.

情况3:为不定矩阵, 则不存在极值.

2.2.2 一般解题步骤

求实元二次多项式的极值,可按下述步骤进行:

(1) 记; 

(2) 作非退化的线性替换,使

并判断的正定性及的秩与的大小关系,再根据定理2.3进行判断是否存在极值;

(3) 若存在极值,将实二次多项式用新变数表示出来,再进行配方,从而求出实二次多项式的极大值或极小值.

2.2.3 应用

例2.2  判断


是否有极值,若有,请求出极值.

解 设的二次型部分所对应的矩阵为,则

,

在的下面放一个四阶单位矩阵, 作变换时既可作列变换又可作行变换, 但单位阵只能作与相同的列变换, 当变为对角阵时,单位阵就变成了定理中的所求可逆矩阵, 得到

使得


    主对角线上有一个零,故知,而对角线上其余的非零数全部是正的. 故知为半正定阵, 是否存在极值还应看替换情形才确定, 作线性替换, 即 

,

在此替换下的二次项部分变为 , 一次项部分



一次项所含有新字母均在平方项中出现, 故有极小值存在, 对变换后的多项式进行配方可得 

.

所以,当


时, 有极小值, 即

   ,

,

 

时,Z有极小值.

注:我们发现, 结合矩阵的秩用二次型理论来求极值, 解答思路清晰、直观, 但在用二次型理论求极值时, 必须注意定理的条件, 并且如何构造出一个二次型, 这是解题的关键. 然后利用二次型正定性、半正定性、半负定性的定义或等价条件, 通过判断二次型(矩阵)为正定性、半正定性、半负定性, 从而判断并求出函数的极值.

2.3利用二次型的性质判定多元函数的条件极值

2.3.1.拉格朗日乘数法:

要找函数在附加条件下可能的极值点,可以构造函数,其中为某一常数,令

则可得到可能的极值点的坐标.

    注:推广到多个附加条件时,拉格朗日乘数法仍适用.

    2.3,2 一般解题步骤

多元函数在条件下求极值,可按下述步骤进行:

(1) 构造函数;

(2) 令

求出的所有驻点;

(3) 求出在点的海森矩阵;

(4) 判定正定或负定:若正定,则在点取得极小值;

若负定,则在点取得极大值.

注:对于条件极值,我们还可以通过的二阶全微分的符号来判断它的极值,但在此我们只研究它的二次型方法,即利用海森()矩阵求条件极值.

2.3.3.应用

例2.3  求函数在条件下的极值.

解 构造函数

,

得到驻点

,.

的二阶偏倒数分别为:


得到函数的海森矩阵

当时,矩阵


为负定矩阵,是极大值点.极大值为.

当时,矩阵


为正定矩阵,是极小值点.极小值为.

2.4利用特征值判定实二次型的条件极值

2.4.1 定理及其证明

定理2.4  实元二次函数在条件下的极大值与极小值,分别恰为的最大、最小特征值, 其中,为实对称矩阵.

证明 令

构造函数 . 令

,

可写成 ,即, 等式两边同时左乘以一个,则

,

即, 而条件,可写成,那么,就会有


因而,求函数的极值,也就是计算的最大、最小特征值,其中约束条件,也就是要求的特征向量为单位向量.

定理2.5  实元二次函数在条件下的极大值与极小值,分别为的最大、最小特征值的倍, 其中,为实对称矩阵.

证明 令

构造函数


,

可写成 ,即,等式两边同时左乘以一个,则

,

即, , 而条件,可写成 ,那么,就会有

.

因而,求函数的极值,也就是计算的最大、最小特征值的倍.

2.4.2 一般解题步骤

实元二次函数在条件下求极值,可按下述步骤进行:

(1) 令的特征多项式;

(2) 写出二次型的矩阵;

(3) 求出的全部特征值,若,则

,

,

注:相对于拉格朗日乘数法的计算过程来说,这个定理无疑是较大的简化了计算步骤,但同时它也有其局限性, 目标函数必须为二次型, 条件要为, 这就要求我们具体问题具体分析, 而不要太拘于一种方法.

2.4.3 应用

例2.4  求实二次型在条件下的最大值与最小值.

解 记二次型的矩阵为, 则

它的特征多项式

令,易求出其特征值

因此,实二次型


在条件 下的最大值为,最小值为.

这道题实际上就是的特例.


致谢  本文是在李凤高老师的指导和帮助下完成的, 在此对李老师表示衷心的感谢!




参考文献


[1] 北京大学数学系. 高等代数(第三版)[M]. 北京: 高等教育出版社, 2003.

[2] 华东师范大学数学系. 数学分析(上、下册)[M]. 北京:高等教育出版社, 2001.

[3] 程国, 刘亚亚. 求多元函数极值的二次型方法[J]. 河西学院学报, 24:5(2008), 20-23.

[4] 聂铭. 多元函数极值的判定[J]. 六盘水师范高等专科学校学报, 20:6(2008), 40-44.

[5] 徐玉华, 喻欢. 一类二次型条件极值的求解[J]. 郧阳师范高等专科学校学报, 27:3(2007), 10-14.

[6] 陈荣群, 黄勇. 二次型在求条件极值中的应用[J]. 福建教育学院学报, 10(2008), 98-101.

[7] 龙莉, 黄玉洁. 多元函数的极值及其应用[J]. 鞍山师范学院报, 5:4(2003), 10-12.

[8] 杨文杰, 孙静. 多元函数的极值问题[J]. 辽宁工学院学报, 24:1(2004), 27-30.

[9] 宋国际. 论正定矩阵在多元函数极值问题中的应用[J]. 河北旅游职业学院学报, 15:1(2010),58-60.

[10] 朱用, 文王燕, 侯汝臣. 正定矩阵在函数极值问题中的应用[J]. 数学的实践与认识, 40:21(2010), 249-251.

[11] 杨家骐, 王卿文. 高等代数在初等代数中的应用[M]. 济南: 山东教育出版社, 1992.

.


地址:岳阳市经济技术开发区康王乡新华社区-岳阳市弘毅新华中学(京港澳高速路连接线3公里处、南翔万商旁)

联系电话:0730-8061333      

Copyright © 2010-2017 岳阳市弘毅新华中学 湘ICP备18022682号 技术支持:连线科技

官方二维码