代码拉取完成,页面将自动刷新
\chapter{二次型}
%%%%%%%%%%%%%%%%----------二次型的化简与矩阵的合同
\section{二次型的化简与矩阵的合同}
在解析几何中, 我们曾经学过二次曲线及二次曲面的分类. 以平面二次曲线为例, 一条二次曲线可以由一个二元二次方程给出:
\begin{align}\label{equation:8.1}
a{x}^{2} + {bxy} + c{y}^{2} + {dx} + {ey} + f = 0.
\end{align}
要区分上 式是哪一种曲线 (椭圆、双曲线、抛物线或其退化形式), 我们通常分两步来做: 首先将坐标轴旋转一个角度以消去 \({xy}\) 项,再作坐标轴的平移以消去一次项. 这里的关键是消去 \({xy}\) 项,即需要找到逆时针旋转$ \theta$后的基, 使得二次项只含平方项. 其过渡矩阵为
\[\begin{pmatrix}
\cos \theta & -\sin \theta \\
\sin \theta & \cos \theta
\end{pmatrix},\]
旧的坐标向量等于过渡矩阵乘以新的坐标向量,因此可以得到
\[\begin{pmatrix}
x\\
y
\end{pmatrix} = \begin{pmatrix}
\cos \theta & -\sin \theta \\
\sin \theta & \cos \theta
\end{pmatrix}\begin{pmatrix}
x'\\
y'
\end{pmatrix},\]
于是得到通常的坐标变换公式为
\begin{align}\label{equation:8.2}
\left\{ \begin{array}{l} x = {x}^{\prime }\cos \theta - {y}^{\prime }\sin \theta \\ y = {x}^{\prime }\sin \theta + {y}^{\prime }\cos \theta \end{array}\right.
\end{align}
从线性空间与线性变换的角度来看, \eqref{equation:8.2} 式表示平面上的一个线性变换. 因此二次曲线分类的关键是给出一个线性变换, 使\eqref{equation:8.1}式中的二次项只含平方项. 这种情形也在空间二次曲面的分类时出现. 类似的问题在数学的其他分支、物理、 力学中也会遇到. 为了讨论问题的方便, 只考虑二次齐次多项式.
\begin{definition}[二次型]
设 \(f\) 是数域 \(\mathbb{K}\) 上的 \(n\) 元二次齐次多项式:
\begin{align}\label{equation:8.3}
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = \sum_{i=1}^{n}a_{ii}x_i^2+2\sum_{1\leq i<j\leq n} a_{ij} x_ix_j,
\end{align}
称 \(f\) 为数域 \(\mathbb{K}\) 上的 \(n\) 元二次型,简称二次型.
\end{definition}
这里非平方项的系数采用 \(2{a}_{ij}\) 主要是为了以后矩阵表示的方便.
\begin{example}
下列多项式都是二次型:
\[
f\left( {x,y}\right) = \frac{1}{2}{x}^{2} + {3xy} + 4{y}^{2}
\]
\[
f\left( {x,y,z}\right) = 2{x}^{2} - {y}^{2} + 4{z}^{2} - {2xy} + \left( {\sqrt{3} + 2}\right) {xz}
\]
\[
f\left( {{x}_{1},{x}_{2},{x}_{3},{x}_{4}}\right) = {x}_{1}^{2} + \sqrt{5}{x}_{2}^{2} - 2{x}_{3}^{2}.
\]
而下列多项式都不是二次型:
\[
f\left( {x,y}\right) = {x}^{2} + {3xy} + {y}^{2} - {2x} + 1
\]
\[
f\left( {x,y,z}\right) = 2{x}^{2} - {y}^{2} - {2xy} + {2xz} + 3,
\]
\[
f\left( {{x}_{1},{x}_{2},{x}_{3},{x}_{4}}\right) = {x}_{1}^{3} + {x}_{2}^{2} - 2{x}_{3}^{2} + 5{x}_{1}{x}_{4}.
\]
\end{example}
我们现在要用矩阵为工具来处理二次型. 用矩阵的乘法我们可以把 \eqref{equation:8.3} 式写成矩阵相乘的形式:
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {x}^{\prime }Ax
\]
其中
\[
A = \left( \begin{matrix} {a}_{11} & {a}_{12} & \cdots & {a}_{1n} \\ {a}_{21} & {a}_{22} & \cdots & {a}_{2n} \\ \vdots & \vdots & & \vdots \\ {a}_{n1} & {a}_{n2} & \cdots & {a}_{nn} \end{matrix}\right) ,x = \left( \begin{matrix} {x}_{1} \\ {x}_{2} \\ \vdots \\ {x}_{n} \end{matrix}\right) .
\]
在矩阵 \(A\) 中, \({a}_{ij} = {a}_{ji}\) 对一切 \(i,j\) 成立,也就是说矩阵 \(A\) 是一个对称阵.
下面定义如下的映射
\begin{align*}
\varphi:&\{\mathbb{K}\text{上的}n\text{阶对称阵}\}\rightarrow \{n\text{元二次型}\}\\
&A\mapsto x'Ax
\end{align*}
由上面的讨论已知$ \varphi$一定是满射(即给定一个二次型,用其系数构造一个对称阵$ A$,则$ \varphi(A)$就是一个二次型);下面证明$ \varphi$ 是单射.
设存在对称阵$ A,B$使得$ x'Ax=x'Bx$,即
\[\sum_{i=1}^{n}a_{ii}x_i^2+2\sum_{1\leq i<j\leq n} a_{ij} x_ix_j = \sum_{i=1}^{n}b_{ii}x_i^2+2\sum_{1\leq i<j\leq n} b_{ij} x_ix_j,\]
根据多项式相等的定义,一定有
\[ a_{ij} = b_{ij},1\leq i<j\leq n.\]
由$ A,B$都是对称矩阵得到$ A=B$.从而$ \varphi$一定是单射.
也就是说一个对称矩阵与一个二次型之间是一一对应的.
\begin{example}
求二次型 \(f\left( {x,y}\right) = {x}^{2} + {3xy} + {y}^{2}\) 的矩阵表示.
\end{example}
\begin{solution}
\[f\left( {x,y}\right) =\begin{pmatrix}
x&y
\end{pmatrix}\begin{pmatrix}
1 & \frac{3}{2} \\ \frac{3}{2} & 1
\end{pmatrix}\begin{pmatrix}
x \\
y
\end{pmatrix}.\]
\end{solution}
\begin{example}
求二次型 \(f\left( {{x}_{1},{x}_{2},{x}_{3},{x}_{4}}\right) = {x}_{1}^{2} - {x}_{2}^{2} + 2{x}_{3}^{2} + 4{x}_{4}^{2}\) 相伴的对称阵.
\end{example}
\begin{solution}
所求的对称阵为
\[\begin{pmatrix}
1 & & & \\ & - 1 & & \\ & & 2 & \\ & & & 4
\end{pmatrix}\]
\end{solution}
这是一个对角阵. 显然, 一个二次型只含平方项当且仅当它的相伴矩阵是一个对角阵.
\begin{example}
求对称阵
\[\begin{pmatrix}
1 & \frac{1}{2} & - \sqrt{2} \\ \frac{1}{2} & - 1 & 0 \\ - \sqrt{2} & 0 & 2
\end{pmatrix},\]
所对应的二次型.
\end{example}
\begin{solution}
所求之二次型为
\[
f\left( {{x}_{1},{x}_{2},{x}_{3}}\right) = {x}_{1}^{2} + {x}_{1}{x}_{2} - {x}_{2}^{2} - 2\sqrt{2}{x}_{1}{x}_{3} + 2{x}_{3}^{2}.
\]
\end{solution}
二次型理论的基本问题是要寻找一个线性变换把它变成只含平方项. 由上面我们知道, 二次型与对称阵一一对应, 而线性变换可以用矩阵来表示. 自然地, 二次型的变换与矩阵有着密切的关系. 现在我们来探讨这个关系.
设 \(V\) 是 \(n\) 维线性空间,二次型 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 可以看成是 \(V\) 上的二次函数. 即若设 \(V\) 的一组基为 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) ,向量 \(\mathbf{x}\) 在这组基下的坐标为 \({x}_{1},{x}_{2},\cdots ,{x}_{n}\) ,则 \(f\) 便是向量 \(\mathbf{x}\) 的函数. 现假设 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{n}}\right\}\) 是 \(V\) 的另一组基,向量 \(\mathbf{x}\) 在 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{n}}\right\}\) 下的坐标为 \({y}_{1},{y}_{2},\cdots ,{y}_{n}\) . 记 \(\mathbf{C} = \left( {c}_{ij}\right)\) 是从基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 到基 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{n}}\right\}\) 的过渡矩阵,则
\[\begin{pmatrix}
{x}_{1} \\ {x}_{2} \\ \vdots \\ {x}_{n}
\end{pmatrix} = \begin{pmatrix}
{c}_{11} & {c}_{12} & \cdots & {c}_{1n} \\ {c}_{21} & {c}_{22} & \cdots & {c}_{2n} \\ \vdots & \vdots & & \vdots \\ {c}_{n1} & {c}_{n2} & \cdots & {c}_{nn}
\end{pmatrix}\begin{pmatrix}
{y}_{1} \\ {y}_{2} \\ \vdots \\ {y}_{n}
\end{pmatrix}\]
或简记为
\[
\mathbf{x} = \mathbf{{Cy}}
\]
其中 \(\mathbf{y}\) 为 \(n\) 维列向量
\[
\left( \begin{matrix} {y}_{1} \\ {y}_{2} \\ \vdots \\ {y}_{n} \end{matrix}\right)
\]
将上式代入 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {\mathbf{x}}^{\prime }\mathbf{A}\mathbf{x}\) ,得
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = \mathbf{y}'{\mathbf{C}}^{\prime }\mathbf{A}\mathbf{C}\mathbf{y}.
\]
显然, \({C}^{\prime }{AC}\) 仍是一个对称阵,故 \({\mathbf{y}}^{\prime }{C}^{\prime }{AC}\mathbf{y}\) 是以 \(\mathbf{y}\) 为变元的二次型,记为 \(g\left( {{y}_{1},{y}_{2},\cdots ,{y}_{n}}\right)\) . 由此我们可看出: 若二次型 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 所对应的对称阵为 \(\mathbf{A}\) ,则经过变量代换之后得到的二次型 \(g\left( {{y}_{1},{y}_{2},\cdots ,{y}_{n}}\right)\) 所对应的对称阵为 \({C}^{\prime }{AC}\) .
\begin{definition}
设 \(A,B\) 是数域 \(\mathbb{K}\) 上的 \(n\) 阶矩阵,若存在 \(n\) 阶非异阵 \(C\) ,使
\[
B = {C}^{\prime }{AC},
\]
则称 \(B\) 与 \(A\) 是合同的,或称 \(B\) 与 \(A\) 具有合同关系.
\end{definition}
不难证明, 合同关系是一个等价关系, 即
\begin{enumerate}[(1)]
\item 任一矩阵 \(A\) 与自己合同,因为 \(A = {\mathbf{I}}^{\prime }A\mathbf{I}\) ;
\item 若 \(B\) 与 \(A\) 合同,则 \(A\) 与 \(B\) 合同. 这是因为若 \(B = {C}^{\prime }AC\) ,则 \(A =\) \({\left( {C}^{\prime }\right) }^{-1}B{C}^{-1} = {\left( {C}^{-1}\right) }^{\prime }B{C}^{-1};\)
\item 若 \(B\) 与 \(A\) 合同, \(D\) 与 \(B\) 合同,则 \(D\) 与 \(A\) 合同. 事实上,若 \(B = {C}^{\prime }AC\) , \(D = {H}^{\prime }BH\) ,则 \(D = {H}^{\prime }{C}^{\prime }ACH = {\left( CH\right) }^{\prime }A\left( {CH}\right)\) .
\end{enumerate}
通过上述的讨论我们可以得到如下的关系
\begin{figure}[H]
\centering
\begin{tikzcd}
\text{二次型}f(x_1,\cdots,x_n) \arrow[rr,Rightarrow,"\text{坐标向量作非异变换}"," x = Cy "'] \arrow[dd, leftrightarrow,"1:1"] & & g(y_1,\cdots,y_n)\text{只含平方项} \arrow[dd,leftrightarrow,"1:1"] \\
& & \\
A \arrow[rr, Rightarrow,"\text{合同变换}"] & & C'AC\text{为对角阵}
\end{tikzcd}
\end{figure}
将二次型化为只含平方项相当于要找到一个非异阵$ C$,使得$ C'AC$为一个对角阵.
因为一个二次型经变量代换后得到的二次型的相伴对称阵与原二次型的相伴对称阵是合同的, 又因为只含平方项的二次型其相伴对称阵是一个对角阵 ,所以,化二次型为只含平方项等价于对对称阵 \(A\) 寻找非异阵 \(C\) , 使 \({C}^{\prime }{AC}\) 是一个对角阵. 这一情形与矩阵相似关系颇为类似,在相似关系下我们希望找到一个非异阵 \(\mathbf{P}\) ,使 \({\mathbf{P}}^{-1}A\mathbf{P}\) 成为简单形式的矩阵 (如 Jordan 标准型). 现在我们要找一个非异阵 \(C\) ,使 \({C}^{\prime }{AC}\) 为对角阵. 因此二次型化简的问题相当于寻找合同关系下的标准型. 我们能找到这样的矩阵 \(C\) 吗?
首先我们来考察初等变换和矩阵合同的关系.
\begin{lemma}
对称阵 \(A\) 的下列变换都是合同变换,称为对称初等变换:
\begin{enumerate}[(1)]
\item 对换 \(A\) 的第 \(i\) 行与第 \(j\) 行,再对换第 \(i\) 列与第 \(j\) 列;
\item 将非零常数 \(k\) 乘以 \(A\) 的第 \(i\) 行,再将 \(k\) 乘以第 \(i\) 列;
\item 将 \(A\) 的第 \(i\) 行乘以 \(k\) 加到第 \(j\) 行上,再将第 \(i\) 列乘以 \(k\) 加到第 \(j\) 列上.
\end{enumerate}
\end{lemma}
\begin{proof}
上述变换相当于将一个初等矩阵左乘以 \(A\) 后再将这个初等矩阵的转置右乘之, 因此是合同变换.
\end{proof}
\begin{lemma}
设 \(A\) 是数域 \(\mathbb{K}\) 上的非零对称阵,则必存在非异阵 \(C\) ,使 \({C}^{\prime }{AC}\) 的第 \(\left( {1,1}\right)\) 元素不等于零.
\end{lemma}
\begin{proof}
若 \({a}_{11} = 0\) ,而 \({a}_{ii} \neq 0\) ,则将 \(A\) 的第一行与第 \(i\) 行对换,再将第一列与第 \(i\) 列对换,得到的矩阵的第 \(\left( {1,1}\right)\) 元素不为零. 根据上述引理,这样得到的矩阵和原矩阵合同.
若所有的 \({a}_{ii} = 0\left( {i = 1,2,\cdots ,n}\right)\) . 设 \({a}_{ji} \neq 0\left( {i \neq j}\right)\) ,将 \(A\) 的第 \(j\) 行加到第 \(i\) 行上,再将第 \(j\) 列加到第 \(i\) 列上. 因为 \(A\) 是对称阵, \({a}_{ji} = {a}_{ij} \neq 0\) ,于是第 \(\left( {i,i}\right)\) 元素是 \(2{a}_{ij}\) 且不为零. 再用前面的办法使第 \(\left( {1,1}\right)\) 元素不等于零. 显然我们得到的矩阵和原矩阵仍合同. 这就证明了结论.
\end{proof}
\begin{theorem}
设 \(A\) 是数域 \(\mathbb{K}\) 上的 \(n\) 阶对称阵,则必存在 \(\mathbb{K}\) 上的 \(n\) 阶非异阵 \(C\) ,使 \({C}^{\prime }AC\) 为对角阵.
\end{theorem}
\begin{proof}
对阶数$ n$进行归纳.当$ n=1$时,结论成立.设当阶数小于$ n$ 时,结论成立.当$ A = 0$时成立,下设$ A \neq 0$且阶数为$ n$的情形.
由上述引理可知,一定存在合同变换使得变换后矩阵的第(1,1)元不为零,故不妨设$ A$的第(1,1)元$ a_{11} \neq 0$.,则可将第一行乘以 \(- {a}_{11}^{-1}{a}_{i1}\) 加到第 \(i\) 行上,再将第一列乘以 \(- {a}_{11}^{-1}{a}_{i1}\) 加到第 \(i\) 列上. 由于 \({a}_{i1} = {a}_{1i}\) ,故得到的矩阵的第 \(\left( {1,i}\right)\) 元素及第 \(\left( {i,1}\right)\) 元素均等于零. 由前面引理可知,新得到的矩阵与 \(A\) 是合同的. 这样,可依次把 \(A\) 的第一行与第一列除 \({a}_{11}\) 外的元素都消去. 于是 \(A\) 合同于下列矩阵:
\[\begin{pmatrix}
{a}_{11} & 0 & 0 & \cdots & 0 \\ 0 & {b}_{22} & {b}_{23} & \cdots & {b}_{2n} \\ 0 & {b}_{32} & {b}_{33} & \cdots & {b}_{3n} \\ \vdots & \vdots & \vdots & & \vdots \\ 0 & {b}_{n2} & {b}_{n3} & \cdots & {b}_{nn}
\end{pmatrix},\]
上式右下角是一个 \(n - 1\) 阶对称阵,记为 \({A}_{1}\) . 因此可归纳地假设存在非异的 \(n - 1\) 阶矩阵 \(D\) ,使 \({D}^{\prime }{A}_{1}D\) 为对角阵,于是
\[
\left( \begin{matrix} 1 & O \\ O & {D}^{\prime } \end{matrix}\right) \left( \begin{matrix} {a}_{11} & O \\ O & {A}_{1} \end{matrix}\right) \left( \begin{matrix} 1 & O \\ O & D \end{matrix}\right) = \left( \begin{matrix} {a}_{11} & O \\ O & {D}^{\prime }{A}_{1}D \end{matrix}\right)
\]
是一个对角阵. 显然
\[
\left( \begin{matrix} 1 & O \\ O & {D}^{\prime } \end{matrix}\right) = {\left( \begin{matrix} 1 & O \\ O & D \end{matrix}\right) }^{\prime }
\]
因此 \(A\) 合同于一对角阵.
\end{proof}
\begin{corollary}
合同变换是若干次对称初等变换的复合.
\end{corollary}
\begin{proof}
设$ A$经合同变换得到$ C'AC$,其中$ C$为非异阵,则$ C$可以写为若干个初等阵的乘积,即有$ C= P_1 \cdots P_k$,其中$ P_i$为初等阵. 于是
\[C'AC = (P_1P_2\cdots P_k)'A( P_1P_2\cdots P_k) =p_k'\cdots(P_2'(P_1'A P_1)P_2)\cdots P_k.\]
\end{proof}
\begin{definition}
下列变换是合同变换,称为分块对称初等变换:
\begin{enumerate}[(1)]
\item 对换$ A$的第$ i$分块行与第$ j$分块行,再对换第$ i$分块列与第$ j$分块列;即
\[P_{ij}AP_{ij}'.\]
\item $ A$的第$ i$分块行左乘非异阵$ M$,第$ i$分块列右乘$ M'$;
\[P_i(M)AP_i(M').\]
\item 第$ i$分块行左乘矩阵$ M$加到第$ j$分块行上,第$ i$分块列右乘$ M'$加到第$ j$分块列上.
\[T_{ij}(M)AT_{ji}(M').\]
\end{enumerate}
\end{definition}
\begin{note}
设$ A$是一个分块对角阵,例如\[A = \begin{pmatrix}
A_{11}&A_{12}\\
A_{21}&A_{22}
\end{pmatrix},\]
其中$ A_{11},A_{22}$为对称阵,$ A_{12}=A_{21}'$.
\end{note}
%%%%%%%%%%%%%二次型的化简
\section{二次型的化简}
如何将二次型化为标准型? 在这一节里, 我们将介绍配方法和初等变换法这两种方法.
配方法主要使用如下的完全平方公式:
\[\left(\sum_{i=1}^{n}x_i\right)^2 = \sum_{i=1}^{n}x_i^2+2\sum_{1\leq i<j\leq n}x_ix_j.\]
\begin{example}
将下列二次型化成对角型:
\[
f\left( {{x}_{1},{x}_{2},{x}_{3}}\right) = {x}_{1}^{2} + 2{x}_{1}{x}_{2} - 4{x}_{1}{x}_{3} - 3{x}_{2}^{2} - 6{x}_{2}{x}_{3} + {x}_{3}^{2}.
\]
\end{example}
\begin{solution}
先将含有 \({x}_{1}\) 的项放在一起凑成完全平方再减去必要的项:
\begin{align*}
f\left( {{x}_{1},{x}_{2},{x}_{3}}\right) &= \left( {{x}_{1}^{2} + 2{x}_{1}{x}_{2} - 4{x}_{1}{x}_{3}}\right) - 3{x}_{2}^{2} - 6{x}_{2}{x}_{3} + {x}_{3}^{2}\\
&= \left\lbrack {{\left( {x}_{1} + {x}_{2} - 2{x}_{3}\right) }^{2} - {x}_{2}^{2} - 4{x}_{3}^{2} + 4{x}_{2}{x}_{3}}\right\rbrack - 3{x}_{2}^{2} - 6{x}_{2}{x}_{3} + {x}_{3}^{2}\\
&= {\left( {x}_{1} + {x}_{2} - 2{x}_{3}\right) }^{2} - 4{x}_{2}^{2} - 2{x}_{2}{x}_{3} - 3{x}_{3}^{2}.
\end{align*}
再对后面那些项配方:
\begin{align*}
- 4{x}_{2}^{2} - 2{x}_{2}{x}_{3} - 3{x}_{3}^{2} &= - \left\lbrack {{\left( 2{x}_{2} + \frac{1}{2}{x}_{3}\right) }^{2} - \frac{1}{4}{x}_{3}^{2}}\right\rbrack - 3{x}_{3}^{2}\\
& = - {\left( 2{x}_{2} + \frac{1}{2}{x}_{3}\right) }^{2} - \frac{11}{4}{x}_{3}^{2}\text{.}
\end{align*}
于是
\[
f\left( {{x}_{1},{x}_{2},{x}_{3}}\right) = {\left( {x}_{1} + {x}_{2} - 2{x}_{3}\right) }^{2} - {\left( 2{x}_{2} + \frac{1}{2}{x}_{3}\right) }^{2} - \frac{11}{4}{x}_{3}^{2}.
\]
\end{solution}
令
\[ \begin{cases}
{y}_{1} = {x}_{1} + {x}_{2} - 2{x}_{3} \\ {y}_{2} = 2{x}_{2} + \frac{1}{2}{x}_{3} \\ {y}_{3} = {x}_{3}
\end{cases} \]
或
\[ \begin{pmatrix}
{y}_{1} \\ {y}_{2} \\ {y}_{3}
\end{pmatrix} = \begin{pmatrix}
1 & 1 & - 2 \\ 0 & 2 & \frac{1}{2} \\ 0 & 0 & 1
\end{pmatrix}\begin{pmatrix}
{x}_{1} \\ {x}_{2} \\ {x}_{3}
\end{pmatrix} \]
因此 \(f = {y}_{1}^{2} - {y}_{2}^{2} - \frac{11}{4}{y}_{3}^{2}\) ,其变换矩阵为
\[ C = \begin{pmatrix}
1 & 1 & - 2 \\ 0 & 2 & \frac{1}{2} \\ 0 & 0 & 1
\end{pmatrix}^{-1} = \begin{pmatrix}
1 & - \frac{1}{2} & \frac{9}{4} \\ 0 & \frac{1}{2} & - \frac{1}{4} \\ 0 & 0 & 1
\end{pmatrix} \]
即有 \[ x = Cy. \]
\begin{note}
\begin{enumerate}[(1)]
\item 配方法得到的过渡矩阵为非异上三角阵;
\item 有时明显的配方不能保证过渡矩阵非异,从而化简结果不一定正确.
\end{enumerate}
\end{note}
\begin{example}
用观察法即可得到下列配方:
\begin{align*}
f &= 2{x}_{1}^{2} + 2{x}_{2}^{2} + 2{x}_{3}^{2} - 2{x}_{1}{x}_{2} + 2{x}_{1}{x}_{3} + 2{x}_{2}{x}_{3}\\
&= {\left( {x}_{1} - {x}_{2}\right) }^{2} + {\left( {x}_{1} + {x}_{3}\right) }^{2} + {\left( {x}_{2} + {x}_{3}\right) }^{2}.
\end{align*}
若令 \({y}_{1} = {x}_{1} - {x}_{2},{y}_{2} = {x}_{1} + {x}_{3},{y}_{3} = {x}_{2} + {x}_{3}\) ,则 \(f = {y}_{1}^{2} + {y}_{2}^{2} + {y}_{3}^{2}\) . 由于矩阵
\[ \begin{pmatrix}
1 & - 1 & 0 \\ 1 & 0 & 1 \\ 0 & 1 & 1
\end{pmatrix} \]
不是非异阵, 因此上述配方不是我们所需要的结论.
\end{example}
如果已知的二次型中没有平方项, 我们可以采用下面例子中的方法.
\begin{example}
将二次型
\[
f\left( {{x}_{1},{x}_{2},{x}_{3},{x}_{4}}\right) = 2{x}_{1}{x}_{2} - {x}_{1}{x}_{3} + {x}_{1}{x}_{4} - {x}_{2}{x}_{3} + {x}_{2}{x}_{4} - 2{x}_{3}{x}_{4}
\]
化成对角型.
\end{example}
\begin{solution}
但我们可作如下变换:
\[ \begin{cases}
{x}_{1} = {y}_{1} + {y}_{2} \\ {x}_{2} = {y}_{1} - {y}_{2} \\ {x}_{3} = {y}_{3} \\ {x}_{4} = {y}_{4} \
\end{cases}\]
代入原二次型得
\[
f = 2{y}_{1}^{2} - 2{y}_{2}^{2} - 2{y}_{1}{y}_{3} + 2{y}_{1}{y}_{4} - 2{y}_{3}{y}_{4}
\]
这时 \({y}_{1}^{2}\) 项不为零,于是
\begin{align*}
f &= \left( {2{y}_{1}^{2} - 2{y}_{1}{y}_{3} + 2{y}_{1}{y}_{4}}\right) - 2{y}_{2}^{2} - 2{y}_{3}{y}_{4}\\
&= 2\left\lbrack {{\left( {y}_{1} - \frac{1}{2}{y}_{3} + \frac{1}{2}{y}_{4}\right) }^{2} - \frac{1}{4}{y}_{3}^{2} - \frac{1}{4}{y}_{4}^{2} + \frac{1}{2}{y}_{3}{y}_{4}}\right\rbrack - 2{y}_{2}^{2} - 2{y}_{3}{y}_{4}\\
&= 2{\left( {y}_{1} - \frac{1}{2}{y}_{3} + \frac{1}{2}{y}_{4}\right) }^{2} - 2{y}_{2}^{2} - \frac{1}{2}{y}_{3}^{2} - {y}_{3}{y}_{4} - \frac{1}{2}{y}_{4}^{2}\\
&= 2{\left( {y}_{1} - \frac{1}{2}{y}_{3} + \frac{1}{2}{y}_{4}\right) }^{2} - 2{y}_{2}^{2} - \frac{1}{2}{\left( {y}_{3} + {y}_{4}\right) }^{2}\text{.}
\end{align*}
令
\[ \begin{cases}
{z}_{1} = {y}_{1} - \frac{1}{2}{y}_{3} + \frac{1}{2}{y}_{4} \\ {z}_{2} = {y}_{2} \\ {z}_{3} = {y}_{3} + {y}_{4} \\ {z}_{4} = {y}_{4}
\end{cases} \]
于是
\[
f = 2{z}_{1}^{2} - 2{z}_{2}^{2} - \frac{1}{2}{z}_{3}^{2}
\]
其中 \({z}_{4}^{2}\) 的系数为零,故未写出.
为求变换矩阵 \(C\) ,可从上面 \({z}_{i}\) 的表示式中解出 \({y}_{i}\) :
\[ \begin{cases}
{y}_{1} = {z}_{1} + \frac{1}{2}{z}_{3} - {z}_{4} \\ {y}_{2} = {z}_{2} \\ {y}_{3} = {z}_{3} - {z}_{4} \\ {y}_{4} = {z}_{4}
\end{cases} \]
再将 \({x}_{i}\) 求出:
\[ \begin{cases}
{x}_{1} = {z}_{1} + {z}_{2} + \frac{1}{2}{z}_{3} - {z}_{4} \\ {x}_{2} = {z}_{1} - {z}_{2} + \frac{1}{2}{z}_{3} - {z}_{4} \\ {x}_{3} = {z}_{3} - {z}_{4} \\ {x}_{4} = {z}_{4}
\end{cases} \]
于是\[ C = \begin{pmatrix}
1 & 1 & \frac{1}{2} & - 1 \\ 1 & - 1 & \frac{1}{2} & - 1 \\ 0 & 0 & 1 & - 1 \\ 0 & 0 & 0 & 1
\end{pmatrix}. \]
\end{solution}
用配方法化简二次型有时比较麻烦,求非异阵 \(C\) 也比较麻烦. 我们常常用初等变换法来化简二次型.
设$ A$是一个对称阵,现在需要找到一个非异阵$ C$使得$ C'AC$为对角阵,可以通过如下方法得到:
构造一个$ n\times 2n$阶矩阵$ \begin{pmatrix}
\begin{array}{c:c}
A&I_n
\end{array}
\end{pmatrix}$,对该分块矩阵实施初等行变换,再对第一个分块$ A$实施对称的初等列变换,直到将左边矩阵变为对角阵,则右边矩阵是过渡矩阵的转置.
下面我们通过例子来说明这种方法.
\begin{example}
将下列二次型化为对角型:
\[
f\left( {{x}_{1},{x}_{2},{x}_{3}}\right) = {x}_{1}^{2} - 3{x}_{2}^{2} - 2{x}_{1}{x}_{2} + 2{x}_{1}{x}_{3} - 6{x}_{2}{x}_{3}.
\]
\end{example}
\begin{solution}
记与 \(f\) 相伴的对称阵为 \(A\) ,写出 \(\left( {A,{\mathbf{I}}_{3}}\right)\) 并作变换:
\[ \begin{pmatrix}
\begin{array}{c:c}
A&I_3
\end{array}
\end{pmatrix} = \begin{pmatrix}
\begin{array}{ccc:ccc}
1 & - 1 & 1 & 1 & 0 & 0 \\
0 & - 4 & - 2 & 1 & 1 & 0 \\
1 & - 3 & 0 & 0 & 0 & 1
\end{array}
\end{pmatrix} \rightarrow \begin{pmatrix}
\begin{array}{ccc:ccc}
1 & - 1 & 1 & 1 & 0 & 0 \\
0 & - 4 & - 2 & 1 & 1 & 0 \\
0 & - 2 & -1 & -1 & 0 & 1
\end{array}
\end{pmatrix}\rightarrow \begin{pmatrix}
\begin{array}{ccc:ccc}
1 &0 & 0 & 1 & 0 & 0 \\
0 & - 4 & - 2 & 1 & 1 & 0 \\
0 & - 2 & -1 & -1 & 0 & 1
\end{array}
\end{pmatrix}\]
\[ \rightarrow \begin{pmatrix}
\begin{array}{ccc:ccc}
1 & 0 & 0 & 1 & 0 & 0 \\
0 & - 4 & 0 & 1 & 0 & 0 \\
0 & 0 & 0 & - \frac{3}{2} & - \frac{1}{2} & 1
\end{array}
\end{pmatrix} \]
于是 \(f\) 可化简为
\[
{y}_{1}^{2} - 4{y}_{2}^{2}
\]
\[ C = \begin{pmatrix}
1 & 0 & 0 \\ 1 & 1 & 0 \\ - \frac{3}{2} & - \frac{1}{2} & 1
\end{pmatrix}' = \begin{pmatrix}
1 & 1 & - \frac{3}{2} \\ 0 & 1 & - \frac{1}{2} \\ 0 & 0 & 1
\end{pmatrix}. \]
\end{solution}
如碰到第 \(\left( {1,1}\right)\) 元素是零的矩阵,可先设法将第 \(\left( {1,1}\right)\) 元素化成非零,再进行上述过程.
\begin{example}
将二次型 \(f\left( {{x}_{1},{x}_{2},{x}_{3}}\right) = 2{x}_{1}{x}_{2} + 4{x}_{1}{x}_{3} - 4{x}_{2}{x}_{3}\) 化成对角型.
\end{example}
\begin{solution}
写出与 \(f\) 相伴的对称阵 \(A\) ,作 \(\left( {A,{\mathbf{I}}_{3}}\right)\) 并将它的第二行加到第一行上,再将第二列加到第一列上,使得(1,1)位置不为0:
\[ \begin{pmatrix}
\begin{array}{c:c}
A&I_3
\end{array}
\end{pmatrix} = \begin{pmatrix}
\begin{array}{ccc:ccc}
0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & - 2 & 0 & 1 & 0 \\ 2 & - 2 & 0 & 0 & 0 & 1
\end{array}
\end{pmatrix}\rightarrow \begin{pmatrix}
\begin{array}{ccc:ccc}
2 & 1 & 0 & 1 & 1 & 0 \\ 1 & 0 & - 2 & 0 & 1 & 0 \\ 0 & - 2 & 0 & 1 & 0 & 0
\end{array}
\end{pmatrix}\rightarrow \begin{pmatrix}
\begin{array}{ccc:ccc}
2 & 0 & 0 & 1 & 1 & 0 \\ 0 & - \frac{1}{2} & 0 & - \frac{1}{2} & \frac{1}{2} & 0 \\ 0 & 0 & 8 & 2 & - 2 & 1
\end{array}
\end{pmatrix} \]
因此 \(f\) 化简为
\[
2{y}_{1}^{2} - \frac{1}{2}{y}_{2}^{2} + 8{y}_{3}^{2}
\]
\[ C = \begin{pmatrix}
1 & - \frac{1}{2} & 2 \\ 1 & \frac{1}{2} & - 2 \\ 0 & 0 & 1
\end{pmatrix} .\]
\end{solution}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%惯性定理
\section{惯性定理}
在上两节里我们已经知道如何将一个数域上的二次型化为标准型, 即只含平方项的二次型. 在这一节里, 我们将主要讨论实数域与复数域上的二次型.
\subsection*{实二次型}
我们已经知道,任意一个实对称阵 \(A\) 必合同于一个对角阵:
\[
{C}^{\prime }AC = \operatorname{diag}\left\{ {{d}_{1},{d}_{2},\cdots ,{d}_{r},0,\cdots ,0}\right\}
\]
其中 \({d}_{i} \neq 0\left( {i = 1,\cdots ,r}\right)\) . 注意到 \(C\) 是可逆阵,所以 \(r = \mathrm{r}\left( {{C}^{\prime }AC}\right) = \mathrm{r}\left( A\right)\) . 故秩 \(r\) 是矩阵合同关系下的一个不变量. 如同相似标准型一样,我们的目的是要找出实对称阵在合同关系下的全系不变量, 即找出一组足以判断两个实对称阵是否合同的合同不变量. 我们不妨设实对称阵已具有下列对角阵的形状:
\[
A = \operatorname{diag}\left\{ {{d}_{1},{d}_{2},\cdots ,{d}_{r},0,\cdots ,0}\right\} .
\]
任意调换 \(A\) 的主对角线上的元素(第一类对称初等变换)得到的矩阵仍与 \(A\) 合同. 因此我们可把零放在一起,把正项与负项放在一起,即可设 \({d}_{1} > 0,\cdots ,{d}_{p} > 0\) ; \({d}_{p + 1} < 0,\cdots ,{d}_{r} < 0.A\) 所代表的二次型为
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {d}_{1}{x}_{1}^{2} + {d}_{2}{x}_{2}^{2} + \cdots + {d}_{r}{x}_{r}^{2}.
\]
令
\[
{y}_{1} = \sqrt{{d}_{1}}{x}_{1},\cdots ,{y}_{p} = \sqrt{{d}_{p}}{x}_{p}
\]
\[
{y}_{p + 1} = \sqrt{-{d}_{p + 1}}{x}_{p + 1},\cdots ,{y}_{r} = \sqrt{-{d}_{r}}{x}_{r}
\]
\[
{y}_{j} = {x}_{j}\left( {j = r + 1,\cdots ,n}\right)
\]
则 上式变为
\[
f = {y}_{1}^{2} + \cdots + {y}_{p}^{2} - {y}_{p + 1}^{2} - \cdots - {y}_{r}^{2}.
\]
这一事实等价于说 \(A\) 合同于下列对角阵:
\[
\operatorname{diag}\{ 1,\cdots ,1; - 1,\cdots , - 1;0,\cdots ,0\}
\]
其中有 \(p\) 个 \(1,q\) 个 \(- 1,n - r\) 个零.
现在我们要证明 上 式中的数 \(p\) 及 \(q = r - p\) 是两个合同不变量.
\begin{theorem}[惯性定理]
设 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是一个 \(n\) 元实二次型,且 \(f\) 可化为两个标准型:
\[
{c}_{1}{y}_{1}^{2} + \cdots + {c}_{p}{y}_{p}^{2} - {c}_{p + 1}{y}_{p + 1}^{2} - \cdots - {c}_{r}{y}_{r}^{2}
\]
\[
{d}_{1}{z}_{1}^{2} + \cdots + {d}_{k}{z}_{k}^{2} - {d}_{k + 1}{z}_{k + 1}^{2} - \cdots - {d}_{r}{z}_{r}^{2}
\]
其中 \({c}_{i} > 0,{d}_{i} > 0\) ,则必有 \(p = k\) .
\end{theorem}
\begin{proof}
用反证法,设 \(p > k\) . 由前面的说明知道可设 \({c}_{i}\) 及 \({d}_{i}\) 均为 1 . 因此
\begin{align}\label{equation:8.4}
{y}_{1}^{2} + \cdots + {y}_{p}^{2} - {y}_{p + 1}^{2} - \cdots - {y}_{r}^{2} = {z}_{1}^{2} + \cdots + {z}_{k}^{2} - {z}_{k + 1}^{2} - \cdots - {z}_{r}^{2}.
\end{align}
又设
\[
x = {By},x = {Cz}
\]
其中
\[
\mathbf{x} = \left( \begin{matrix} {x}_{1} \\ {x}_{2} \\ \vdots \\ {x}_{n} \end{matrix}\right) ,\mathbf{y} = \left( \begin{matrix} {y}_{1} \\ {y}_{2} \\ \vdots \\ {y}_{n} \end{matrix}\right) ,\mathbf{z} = \left( \begin{matrix} {z}_{1} \\ {z}_{2} \\ \vdots \\ {z}_{n} \end{matrix}\right)
\]
于是 \(\mathbf{z} = {C}^{-1}B\mathbf{y}\) . 令
\[ C^{-1}B = \begin{pmatrix}
{c}_{11} & {c}_{12} & \cdots & {c}_{1n} \\ {c}_{21} & {c}_{22} & \cdots & {c}_{2n} \\ \vdots & \vdots & & \vdots \\ {c}_{n1} & {c}_{n2} & \cdots & {c}_{nn}
\end{pmatrix}, \]
则
\[
\begin{cases}
{z}_{1} = {c}_{11}{y}_{1} + {c}_{12}{y}_{2} + \cdots + {c}_{1n}{y}_{n}, \\ {z}_{2} = {c}_{21}{y}_{1} + {c}_{22}{y}_{2} + \cdots + {c}_{2n}{y}_{n}, \\ \cdots \\ {z}_{n} = {c}_{n1}{y}_{1} + {c}_{n2}{y}_{2} + \cdots + {c}_{nn}{y}_{n}.
\end{cases} \]
因为 \(p > k\) ,齐次线性方程组
\[ \begin{cases}
{c}_{11}{y}_{1} + {c}_{12}{y}_{2} + \cdots + {c}_{1n}{y}_{n} = 0, \\ \cdots \\ {c}_{k1}{y}_{1} + {c}_{k2}{y}_{2} + \cdots + {c}_{kn}{y}_{n} = 0, \\ {y}_{p + 1} = 0, \\ \cdots \\ {y}_{n} = 0.
\end{cases} \]
必有非零解 ( \(n\) 个未知数, \(n - \left( {p - k}\right)\) 个方程式). 令其中一个非零解为 \({y}_{1} = {a}_{1}\) , \(\cdots ,{y}_{p} = {a}_{p},{y}_{p + 1} = 0,\cdots ,{y}_{n} = 0\) . 把这组解代入\eqref{equation:8.4} 可得
式左边得到\[
{a}_{1}^{2} + \cdots + {a}_{p}^{2} > 0.
\]
但这时 \({z}_{1} = \cdots = {z}_{k} = 0\) ,故 \eqref{equation:8.4}式右边将小于等于零. 引出了矛盾.
同理可证 \(p < k\) 也不可能.
从而$ p=k$.
\end{proof}
\[
f = {y}_{1}^{2} + \cdots + {y}_{p}^{2} - {y}_{p + 1}^{2} - \cdots - {y}_{r}^{2}.
\]
这样的二次型称为$ f$的规范标准型.
\begin{definition}
设 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是一个实二次型,\[
f = {y}_{1}^{2} + \cdots + {y}_{p}^{2} - {y}_{p + 1}^{2} - \cdots - {y}_{r}^{2}.
\]
是一个规范标准型,则称 \(r\) 是该二次型的秩, \(p\) 是它的正惯性指数, \(q = r - p\) 是它的负惯性指数, \(s = p - q\) 称为 \(f\) 的符号差.
\end{definition}
显然,若已知秩 \(r\) 与符号差 \(s\) ,则 \(p = \frac{1}{2}\left( {r + s}\right) ,q = \frac{1}{2}\left( {r - s}\right)\) . 事实上, 在 \(p,q,r,s\) 中只需知道其中两个数,其余两个数也就知道了. 由于实对称阵与实二次型之间的等价关系, 我们将实二次型的秩、惯性指数及符号差也称为相应的实对称阵的秩、惯性指数及符号差.
\begin{theorem}
秩与符号差 (或正负惯性指数) 是实对称阵在合同关系下的全系不变量.
\end{theorem}
\begin{proof}
由上面的定理知道,秩 \(r\) 与符号差 \(s\) 是实对称阵合同关系的不变量. 反之,若 \(n\) 阶实对称阵 \(A,B\) 的秩都为 \(r\) ,符号差都是 \(s\) ,则它们都合同于
\[
\operatorname{diag}\{ 1,\cdots ,1; - 1,\cdots , - 1;0,\cdots ,0\}
\]
其中有 \(p = \frac{1}{2}\left( {r + s}\right)\) 个 \(1,q = \frac{1}{2}\left( {r - s}\right)\) 个 -1 及 \(n - r\) 个零,因此 \(A\) 与 \(B\) 合同. 对正负惯性指数的结论也同样成立.
\end{proof}
\subsection*{复二次型}
复二次型要比实二次型简单得多. 因为复二次型
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {d}_{1}{x}_{1}^{2} + {d}_{2}{x}_{2}^{2} + \cdots + {d}_{r}{x}_{r}^{2}
\]
必可化为
\[
{z}_{1}^{2} + {z}_{2}^{2} + \cdots + {z}_{r}^{2}
\]
其中 \({z}_{i} = \sqrt{{d}_{i}}{x}_{i}\left( {i = 1,2,\cdots ,r}\right) ,{z}_{j} = {x}_{j}\left( {j = r + 1,\cdots ,n}\right)\) . 所以复对称阵的合同关系只有一个全系不变量,那就是秩 \(r\) .
合同标准型即为
\[ \begin{pmatrix}
I_r&O\\
O&O
\end{pmatrix}. \]
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%正定型与正定矩阵
\section{正定型与正定矩阵}
这一节里的二次型都假定是实二次型.
\begin{definition}
设 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {\mathbf{x}}^{\prime }A\mathbf{x}\) 是 \(n\) 元实二次型.
\begin{enumerate}[(1)]
\item 若对任意 \(n\) 维非零列向量 \(\mathbf{\alpha }\) 均有 \({\mathbf{\alpha }}^{\prime }A\mathbf{\alpha } > 0\) ,则称 \(f\) 是正定二次型 (简称正定型),矩阵 \(A\) 称为正定矩阵 (简称正定阵);
\item 若对任意 \(n\) 维非零列向量 \(\mathbf{\alpha }\) 均有 \({\mathbf{\alpha }}^{\prime }A\mathbf{\alpha } < 0\) ,则称 \(f\) 是负定二次型 (简称负定型),矩阵 \(A\) 称为负定矩阵 (简称负定阵);
\item 若对任意 \(n\) 维非零列向量 \(\mathbf{\alpha }\) 均有 \({\mathbf{\alpha }}^{\prime }A\mathbf{\alpha } \geq 0\) ,则称 \(f\) 是半正定二次型 (简称半正定型),矩阵 \(A\) 称为半正定矩阵 (简称半正定阵);
\item 若对任意 \(n\) 维非零列向量 \(\mathbf{\alpha }\) 均有 \({\mathbf{\alpha }}^{\prime }A\mathbf{\alpha } \leq 0\) ,则称 \(f\) 是半负定二次型 (简称半负定型),矩阵 \(A\) 称为半负定矩阵 (简称半负定阵);
\item 若存在 \(\mathbf{\alpha }\) ,使 \({\mathbf{\alpha }}^{\prime }A\mathbf{\alpha } > 0\) ; 又存在 \(\mathbf{\beta }\) ,使 \({\mathbf{\beta }}^{\prime }A\mathbf{\beta } < 0\) ,则称 \(f\) 是不定型.
\end{enumerate}
\end{definition}
显然
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {x}_{1}^{2} + {x}_{2}^{2} + \cdots + {x}_{n}^{2}
\]
是正定型, 而
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = - {x}_{1}^{2} - {x}_{2}^{2} - \cdots - {x}_{n}^{2}
\]
是负定型. 事实上我们可以证明如下的定理.
\begin{theorem}
实二次型 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是正定型的充分必要条件是 \(f\) 的正惯性指数等于 \(n;f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是负定型的充分必要条件是 \(f\) 的负惯性指数等于 \(n;f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是半正定型的充分必要条件是 \(f\) 的正惯性指数等于 \(f\) 的秩 \(r;f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是半负定型的充分必要条件是 \(f\) 的负惯性指数等于 \(f\) 的秩 \(r\) .
\end{theorem}
\begin{proof}
若 \(f\) 的正惯性指数等于 \(n\) ,则 \(f\) 可化为下列标准型:
\[
f = {y}_{1}^{2} + {y}_{2}^{2} + \cdots + {y}_{n}^{2}
\]
显然 \(f\) 是正定型. 反之,若 \(f\) 是正定型,如果 \(f\) 的正惯性指数 \(p < n\) ,则 \(f\) 可化为如下标准型:
\[
f = {y}_{1}^{2} + \cdots + {y}_{p}^{2} - {c}_{p + 1}{y}_{p + 1}^{2} - \cdots - {c}_{n}{y}_{n}^{2}
\]
其中 \({c}_{j} \geq 0\left( {j = p + 1,\cdots ,n}\right)\) . 这时令 \({b}_{1} = \cdots = {b}_{p} = 0,{b}_{p + 1} = \cdots = {b}_{n} = 1\) , 则 \({b}_{1},{b}_{2},\cdots ,{b}_{n}\) 不全为零. 假设这时 \(\mathbf{x} = \mathbf{{Cy}}\) ,其中
\[
\mathbf{x} = \left( \begin{matrix} {x}_{1} \\ {x}_{2} \\ \vdots \\ {x}_{n} \end{matrix}\right) ,\mathbf{y} = \left( \begin{matrix} {y}_{1} \\ {y}_{2} \\ \vdots \\ {y}_{n} \end{matrix}\right)
\]
\(C\) 是非异阵. 故从 \({y}_{i} = {b}_{i}\left( {i = 1,\cdots ,n}\right)\) 可得 \({x}_{i} = {a}_{i}\left( {i = 1,\cdots ,n}\right)\) 是一组不全为零的实数. 于是
\[
f\left( {{a}_{1},{a}_{2},\cdots ,{a}_{n}}\right) \leq 0.
\]
这与 \(f\) 是正定型矛盾,其余结论的证明类似.
\end{proof}
显然我们有下面的定理.
\begin{theorem}\label{theorem:8.4.2}
实对称阵 \(A\) 是正定阵当且仅当它合同于单位阵 \({\mathbf{I}}_{n};A\) 是负定阵当且仅当它合同于 \(- {\mathbf{I}}_{n};A\) 是半正定阵当且仅当 \(A\) 合同于下列对角阵:
\[ \begin{pmatrix}
{\mathbf{I}}_{r} & \mathbf{O} \\ \mathbf{O} & \mathbf{O}
\end{pmatrix} \]
\(A\) 是半负定阵当且仅当 \(A\) 合同于下列对角阵:
\[ \begin{pmatrix}
- {\mathbf{I}}_{r} & \mathbf{O} \\ \mathbf{O} & \mathbf{O}
\end{pmatrix} \]
\end{theorem}
\begin{definition}[顺序主子式]
设 \(A = \left( {a}_{ij}\right)\) 是 \(n\) 阶矩阵, \(A\) 的 \(n\) 个子式:
\[ \begin{vmatrix}
{a}_{11} & {a}_{12} & \cdots & {a}_{1k} \\ {a}_{21} & {a}_{22} & \cdots & {a}_{2k} \\ \vdots & \vdots & & \vdots \\ {a}_{k1} & {a}_{k2} & \cdots & {a}_{kk}
\end{vmatrix}\left( {k = 1,2,\cdots ,n}\right) \]
称为 \(A\) 的顺序主子式.
\end{definition}
\begin{theorem}\label{theorem:8.4.3}
\(n\) 阶实对称阵 \(A\) 是正定阵的充分必要条件是它的 \(n\) 个顺序主子式全大于零.
\end{theorem}
\begin{proof}
设与 \(A\) 对应的实二次型为 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) . 若 \(A = \left( {a}_{ij}\right)\) 且 \(f\) 是正定型,则 \(f\) 可表示为
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = \mathop{\sum }\limits_{{j = 1}}^{n}\mathop{\sum }\limits_{{i = 1}}^{n}{a}_{ij}{x}_{i}{x}_{j}
\]
令
\[
{f}_{k}\left( {{x}_{1},{x}_{2},\cdots ,{x}_{k}}\right) = \mathop{\sum }\limits_{{j = 1}}^{k}\mathop{\sum }\limits_{{i = 1}}^{k}{a}_{ij}{x}_{i}{x}_{j}
\].
则对任意一组不全为零的实数 \({c}_{1},{c}_{2},\cdots ,{c}_{k}\) ,有
\[
{f}_{k}\left( {{c}_{1},{c}_{2},\cdots ,{c}_{k}}\right) = f\left( {{c}_{1},{c}_{2},\cdots ,{c}_{k},0,\cdots ,0}\right) > 0,
\]
所以, \({f}_{k}\) 是一个正定二次型. 它的相伴矩阵 \({A}_{k}\) 由 \(A\) 的前 \(k\) 行及前 \(k\) 列组成, 因此 \({A}_{k}\) 是一个正定阵. \({A}_{k}\) 合同于 \({\mathbf{I}}_{k}\) ,即 \(k\) 阶单位阵. 也就是说存在 \(k\) 阶非异阵 \(B\) ,使
\[
{B}^{\prime }{A}_{k}B = {\mathbf{I}}_{k}
\]
因此
\[
\det \left( {{B}^{\prime }{A}_{k}B}\right) = {\left( \det B\right) }^{2}\det {A}_{k} = 1
\]
即有 \(\det {A}_{k} > 0\) . 这证明了必要性.
充分性:对 \(A\) 的阶 \(n\) 用数学归纳法,当 \(n = 1\) 时, \(A = \left( a\right) ,a > 0\) , 因此 \(f = a{x}_{1}^{2}\) 是正定型.
设结论对 \(n - 1\) 成立,现要证明对 \(n\) 阶实对称阵 \(A\) ,若它的 \(n\) 个顺序主子式全大于零,则 \(A\) 必是正定阵. 记 \({A}_{n - 1}\) 是 \(A\) 的 \(n - 1\) 阶顺序主子式所在的矩阵, \(A\) 可写为
\[ A= \begin{pmatrix}
{A}_{n - 1} & \mathbf{\alpha } \\ {\mathbf{\alpha }}^{\prime } & {a}_{nn}
\end{pmatrix} \]
因为 \(A\) 的顺序主子式全大于零, \({A}_{n - 1}\) 的顺序主子式也全大于零,由归纳假设, \({A}_{n - 1}\) 是正定阵.
由于$ A_{n-1}$非异,故可以对上式做分块对称初等变换,得到
\[ \begin{pmatrix}
{A}_{n - 1} & \mathbf{\alpha } \\ {\mathbf{\alpha }}^{\prime } & {a}_{nn}
\end{pmatrix} \rightarrow \begin{pmatrix}
A_{n-1}&\alpha\\
0&a_{nn} - \alpha'A_{n-1}^{-1}\alpha
\end{pmatrix}
\rightarrow \begin{pmatrix}
A_{n-1}&0\\
0&a_{nn} - \alpha'A_{n-1}^{-1}\alpha
\end{pmatrix},\]
做的是第三类分块对称初等变换,故行列式的值不发生改变,得到
\[ |A| = |A_{n-1}|(a_{nn} - \alpha'A_{n-1}^{-1}\alpha), \]
因为\(A,A_{n-1}\) 的顺序主子式全大于零,从而
\[ a_{nn} - \alpha'A_{n-1}^{-1}\alpha>0, \]
由于$ A_{n-1}$正定,故存在非异阵$ C_{n-1}$使得
\[ C_{n-1}'A_{n-1}C_{n-1} = I_{n-1}, \]
从而
\[ \begin{pmatrix}
C_{n-1}'&0\\
0&1
\end{pmatrix}\begin{pmatrix}
A_{n-1}&0\\
0&a_{nn} - \alpha'A_{n-1}^{-1}\alpha
\end{pmatrix}\begin{pmatrix}
C_{n-1}&0\\
0&1
\end{pmatrix} = \begin{pmatrix}
I_{n-1}&0\\
0&a_{nn} - \alpha'A_{n-1}^{-1}\alpha
\end{pmatrix}\]
因为$ a_{nn} - \alpha'A_{n-1}^{-1}\alpha>0$,故该矩阵为正定阵,即$ A$为正定阵.
\end{proof}
\begin{example}
试求 \(t\) 的取值范围,使下列二次型为正定型:
\[
f\left( {{x}_{1},{x}_{2},{x}_{3},{x}_{4}}\right) = {x}_{1}^{2} + 4{x}_{2}^{2} + 4{x}_{3}^{2} + 3{x}_{4}^{2} + {2t}{x}_{1}{x}_{2} - 2{x}_{1}{x}_{3} + 4{x}_{2}{x}_{3}.
\]
\end{example}
\begin{solution}
这个二次型的相伴矩阵为
\[ A = \begin{pmatrix}
1 & t & - 1 & 0 \\ t & 4 & 2 & 0 \\ - 1 & 2 & 4 & 0 \\ 0 & 0 & 0 & 3
\end{pmatrix} \]
\(A\) 的顺序主子式为
\[
\left| {A}_{1}\right| = 1 > 0,\left| {A}_{2}\right| = \left| \begin{array}{ll} 1 & t \\ t & 4 \end{array}\right| = 4 - {t}^{2},
\]
\[
\left| {A}_{3}\right| = \left| \begin{matrix} 1 & t & - 1 \\ t & 4 & 2 \\ - 1 & 2 & 4 \end{matrix}\right| = - 4\left( {t - 1}\right) \left( {t + 2}\right) ,\left| {A}_{4}\right| = - {12}\left( {t - 1}\right) \left( {t + 2}\right) .
\]
要使 \(A\) 正定,必须
\[
4 - {t}^{2} > 0, - 4\left( {t - 1}\right) \left( {t + 2}\right) > 0.
\]
得 \(- 2 < t < 1\) .
\end{solution}
\begin{corollary}\label{corollary:8.4.1}
若 \(A\) 是$ n$阶正定阵,则有,
\begin{enumerate}[(1)]
\item \(A\) 的任一 \(k\) 阶主子阵,即由 \(A\) 的第 \({i}_{1},{i}_{2},\cdots ,{i}_{k}\) 行及 \(A\) 的第 \({i}_{1},{i}_{2},\cdots ,{i}_{k}\) 列交点上元素组成的矩阵, 必是正定阵;
\item \(A\) 的所有主子式全大于零,特别, \(A\) 的主对角元素全大于零;
\item \(A\) 中绝对值最大的元素仅在主对角线上.
\end{enumerate}
\end{corollary}
\begin{proof}
设二次型$ f(x_1,x_2,\cdots,x_n)$相伴的对称阵为$ A$.
\begin{enumerate}[(1)]
\item 设$ A$的第 \({i}_{1},{i}_{2},\cdots ,{i}_{k}\) 行,列的主子阵为$ B$.定义如下的二次型:
\[ f_{B}(x_{i_1},x_{i_2},\cdots, x_{i_k}) = f(\cdots,x_{i_1},0,\cdots,x_{i_2},\cdots,), \]
由$ f$正定可知$ f_B$正定,从而$ f_B$相伴的对称阵$ B$正定.
\item 由(1)知结论成立.
\item 用反证法. 假定 \({a}_{ij}\left( {i \neq j}\right)\) 是 \(A\) 的绝对值最大的元素. 根据 (1),我们只需证明第 \(i,j\) 行与第 \(i,j\) 列交点上元素组成的矩阵不是正定阵即可. 考虑矩阵 (由 \(A\) 的对称性不妨设 \(i < j\) )
\[\begin{pmatrix}
{a}_{ii} & {a}_{ij} \\ {a}_{ji} & {a}_{jj}
\end{pmatrix} \]
注意到 \({a}_{ij} = {a}_{ji}\) 且 \(\left| {a}_{ij}\right| \geq \left| {a}_{ii}\right| ,\left| {a}_{ij}\right| \geq \left| {a}_{jj}\right|\) ,上述矩阵的行列式值 \({a}_{ii}{a}_{jj} - {a}_{ij}^{2} \leq 0\) . 所以这个矩阵一定不是正定阵.
\end{enumerate}
\end{proof}
设$ \xi=(a_1,a_2,\cdots,a_n)'\neq0\in \mathbb{C}^n $,则
\[ \overline{\xi}' \xi >0, \]
因为 \[ \overline{\xi}'\xi = ( \overline{a_1}, \overline{a_2},\cdots,\overline{a_n}) \begin{pmatrix}
a_1\\
a_2\\
\vdots\\
a_n
\end{pmatrix} = \sum_{i=1}^n \overline{a_i}a_i = \sum_{i=1}^{n}|a_i|^2 >0.\]
\begin{corollary}\label{corollary:8.4.2}
设$ A$为$ n$阶正定实对称阵,则$ A$的特征值全大于0.
\end{corollary}
\begin{proof}
设$ A$的一特征值为$ \lambda_0$,特征向量为$ \xi $.因为$ A$正定,则存在非异实矩阵使得 \[ A = C'I_nC = C'C, \]
由$ A \xi = \lambda_0\xi$,同时左乘$ \overline{\xi}'$得到
\[ \overline{\xi}' \lambda_0\xi = \overline{\xi}'A\xi =\overline{\xi}'C'C\xi = \overline{(C\xi)}'(C\xi),\]
由$ \xi\neq 0$得到$ \overline{\xi}'\xi>0$;由$ C\xi\neq 0$得到 $ \overline{(C\xi)}'(C\xi)>0$.从而\[ \lambda_0 = \frac{\overline{(C\xi)}'(C\xi)}{\overline{\xi}'\xi}>0. \]
\end{proof}
\begin{theorem}
设$ A$是$ n$阶实对称阵,则以下结论等价:
\begin{enumerate}[(1)]
\item $ A$正定;
\item $ A$合同于$ I_n$;
\item 存在非异实矩阵$ C$,使得$ A = C'C$;
\item $ A$的所有主子式全大于零;
\item $ A$的$ n$个顺序主子式全大于零
\item $ A$的所有特征值都大于零.
\end{enumerate}
\end{theorem}
\begin{proof}
根据前面的结果有
\[ (1) \stackrel{\text{定理}\ref{theorem:8.4.2}}{\Leftrightarrow}(2)\stackrel{\text{矩阵合同定义}}{\Leftrightarrow}(3), \]
\[ (1)\stackrel{\text{推论}\ref{corollary:8.4.1}}{\Rightarrow}(4)\Rightarrow(5)\stackrel{\text{定理}\ref{theorem:8.4.3}}{\Rightarrow}(1), \]
\[ (1) \stackrel{\text{推论}\ref{corollary:8.4.2}}{\Rightarrow},\]
(6)$ \Rightarrow$(1)将在第九章中证明.
\end{proof}
\begin{lemma}
设$ A$是$ n$阶实对称矩阵,则$ A$为半正定矩阵的充分必要条件为存在实矩阵$ C$,使得
\[ A = C'C,\]
特别地,$ |A|\geq 0$.
\end{lemma}
\begin{proof}
必要性:设$ A$为半正定矩阵,即$ A$合同于 \[ \begin{pmatrix}
I_r&O\\O&O
\end{pmatrix}, \]
即存在非异阵$ B$使得 \[ A = B'\begin{pmatrix}
I_r&O\\O&O
\end{pmatrix} B,\]
由于$ \begin{pmatrix}
I_r&O\\O&O
\end{pmatrix}$为幂等阵,令
\[ C = \begin{pmatrix}
I_r&O\\O&O
\end{pmatrix}B,\]
即有$ A = C'C$.
充分性:设$ A = C'C$,对$ 0\neq \alpha\in \mathbb{R}^n$,有
\[ \alpha'A\alpha = \alpha'C'C\alpha = (C\alpha)'(C\alpha), \]
记$ C\alpha = \begin{pmatrix}
a_1\\
a_2\\
\vdots\\
a_n
\end{pmatrix}$,则上式写为
\[ \alpha'A\alpha = \sum_{i=1}^{n}a_i^2\geq 0.\]
从而$ A$为半正定阵.
\end{proof}
\begin{lemma}
设$ A$是$ n$阶实对称矩阵,则$ A$半正定当且仅当$ A+t I_n$为正定阵,$ \forall t\in \mathbb{R}^+$.
\end{lemma}
\begin{proof}
必要性:$ \forall \alpha=\neq \in \mathbb{R}^n$,有
\[ \alpha'(A+tI_n)\alpha = \alpha'A\alpha + t\alpha'\alpha >0, \]
于是$ A+tI_n$为正定阵.
充分性:$ \forall \alpha=\neq \in \mathbb{R}^n$,有
\[ \alpha'(A+tI_n)\alpha = \alpha'A\alpha + t\alpha'\alpha >0, \]
令$ t\lim_{t\to 0^+}$,有 $ \alpha'A\alpha \geq 0$,从而$ A$是半正定矩阵.
\end{proof}
\begin{example}
$ A = \operatorname{diag}\{1,0,-1\}$,$ |A_1| = 1,|A_2| = |A_3| = 0$,但是该矩阵是不定的.也就是说所有顺序主子式大于等于零,不能得到该矩阵是半正定的.
\end{example}
\begin{lemma}
设$ A$ 是$ n$阶实对称矩阵,则$ A$半正定当且仅当 $ A$的所有主子式大于等于零.
\end{lemma}
\begin{proof}
必要性:设$ A$相伴的二次型为$ f(x_1,x_2,\cdots,x_n) = x'Ax$为半正定,取$ A$的一个主子阵为 \[ B = A\begin{pmatrix}
i_1&\cdots,i_r\\
i_1&\cdots,i_r
\end{pmatrix}, \]
定义如下的二次型 \[ f_B(x_{i_1}, x_{i_2},\cdots,x_{i_r}) = f(0,\cdots,0,x_{i_1},0,\cdots,x_{i_2},\cdots,), \]
由于$ f$半正定从而$ f_B$半正定,即$ B$ 是半正定阵.
充分性:考虑$ |A+tI_n|$的行列式,
\[ | A+tI_n| = t^n+ c_1t^{n-1}+\cdots+c_{n-1}t+c_n, \]
其中$ c_i$是$ A$的所有$ i$阶主子式之和,从而$ c_i\geq 0,\forall 1\leq i\leq n$.
于是 \[ \forall t\in \mathbb{R}^+,| A+tI_n|>0, \]
设$ A_k$为$ A$的顺序主子阵($ k=1,2,\cdots,n$),由于$ A_k$的任意主子式都是$ A$的主子式,可得$ A_k$的所有主子式都大于等于零,从而有
\[ \forall t\in \mathbb{R}^+,\forall 1\leq k\leq n,| A_k+tI_k|>0, \]
从而$ A+tI_n$为正定阵($ \forall t\in \mathbb{R}^+$),由上述引理可知$ A$为半正定矩阵.
\end{proof}
\begin{lemma}
设$ A$是$ n$阶实对称矩阵,则$ A$半正定当且仅当$ A$的所有特征值都大于等于零
\end{lemma}
\begin{proof}
设$ A$的所有特征值为$ \lambda_1,\lambda_2,\cdots,\lambda_n$,
\[ A\text{半正定}\Leftrightarrow A+tI_n \text{正定}\Leftrightarrow \lambda_i+t> 0,\forall i=1,2,\cdots,n.,\forall t>0,\Leftrightarrow \lambda_i\geq 0,\forall i=1,2,\cdots,n.\]
\end{proof}
\begin{theorem}
设$ A$是$ n$阶实对称矩阵,则下列结论等价:
\begin{enumerate}[(1)]
\item $ A$ 是半正定矩阵;
\item $ A$合同于$\begin{pmatrix}
I_r&O\\
O&O
\end{pmatrix}$;
\item 存在$ C\in \mathcal{M}_n(\mathbb{R})$,使得$ A = C'C$;
\item $ A$的所有主子式都大于等于零;
\item $ A$的 所有特征值大于等于零.
\end{enumerate}
\end{theorem}
\begin{proposition}
设$ A = (a_{ij})_{n\times n}$为半正定阵,若$ a_{ii}=0$,则$ A$的第$ i$行第$ i$列元素全为0.
\end{proposition}
\begin{proof}
任取$ a_{ij},a_{ji}(i\neq j)$所在的二阶主子式$ \begin{vmatrix}
a_{ii}&a_{ij}\\
a_{ji}&a_{jj}
\end{vmatrix} = -a_{ij}^2>0$(半正定阵的任意主子式大于等于零).
从而$ a_{ij} = a_{ji} = 0,\forall i\neq j$.
\end{proof}
\begin{proposition}
设$ A = (a_{ij})_{n\times n}$为半正定阵,$ \alpha\in \mathbb{R}^n$使得$ \alpha'A\alpha = 0$,则有$ A\alpha = 0$.
\end{proposition}
\begin{proof}
$ A$半正定,即存在$ C\in \mathcal{M}_n(\mathbb{R})$,使得$ A = C'C$,代入有
\[ \alpha'A\alpha = \alpha'C'C\alpha = (C\alpha)'( C\alpha) = 0, \]
从而$ C\alpha = 0$.
于是\[ A \alpha = C'C\alpha = 0, \]
\end{proof}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%-----------------Hermite 型
\section{Hermite型}
前面讲述了实矩阵的二次型,现在来讨论在复数域上的情况,设 \[ f(x_1,x_2,\cdots, x_n) = d_1x_1^2 + d_2x_2^2 + \cdots + d_rx_r^2, \]
其中$ d_i\in \mathbb{C},x_i \in \mathbb{C}^n$.
但是此时我们无法直接将实二次型正定性的讨论直接搬过来,因为$ \forall \alpha = (a_1,\cdots,a_n)'\in \mathbb{C}^n$,$ d_i a_i^2\in \mathbb{C}$,无法讨论正负性.但是可以通过下面的调整来做:
\begin{enumerate}[(1)]
\item 加限制条件,使得$ d_i$为实数;
\item 将$ x_i^2$变为$ |x_i|^2= \overline{x_i}x_i$.
\end{enumerate}
这样上式就变为了
\[ f(x_1,x_2,\cdots, x_n) = d_1\overline{x_1}x_1+ d_2\overline{x_2}x_2+ \cdots + d_r\overline{x_r}x_r,\]
其中$ d_i\in \mathbb{R},\overline{x_i}x_i \in \mathbb{R}$.
\begin{definition}[Hermite型]
下列$ n$个复变元的二次齐次函数称为Hermite型:
\[ f(x_1, x_2,\cdots,x_n) = \sum_{j=1}^{n}\sum_{i=1}^{n}a_{ij}\overline{x_i}x_j, \]
其中$ \overline{a_{ij}} = a_{ji},\forall i,j=1,2,\cdots,n$.
\end{definition}
上述定义中的函数是复变元的实值函数.
\[ \overline{f} = \sum_{j=1}^{n}\sum_{i=1}^{n}\overline{a_{ij}}x_i\overline{x_j} = \sum_{j=1}^{n}\sum_{i=1}^{n}a_{ij}\overline{x_j} x_i = f. \]
$ f$的系数矩阵构成一个复矩阵$ A = (a_{ij})_{n\times n}$,其中$ A$满足$ \overline{A}' = A$.
\begin{definition}
设$ A \in \mathcal{M}_n(\mathbb{C})$,若$ \overline{A}' = A$,则称$ A$为 Hermite矩阵.
\end{definition}
Hermite 型可写成如下的矩阵相乘的形式:
\[
f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right) = {\overline{\mathbf{x}}}^{\prime }A\mathbf{x}
\]
其中
\[ A = \begin{pmatrix}
{a}_{11} & {a}_{12} & \cdots & {a}_{1n} \\ {a}_{21} & {a}_{22} & \cdots & {a}_{2n} \\ \vdots & \vdots & & \vdots \\ {a}_{n1} & {a}_{n2} & \cdots & {a}_{nn}
\end{pmatrix},x = \begin{pmatrix}
{x}_{1} \\ {x}_{2} \\ \vdots \\ {x}_{n}
\end{pmatrix}, \]
与实二次型类似, Hermite 型与 Hermite 矩阵之间有着一一对应关系,即给定一个 \(n\) 变元的 Hermite 型必相伴有一个 \(n\) 阶 Hermite 矩阵,反之给定一个 \(n\) 阶 Hermite 矩阵,必有一个 \(n\) 元 Hermite 型与之对应.
设 \(\mathbf{x} = \mathbf{{Cy}}\) ,其中 \(C\) 是一个非异复矩阵,而
\[
\mathbf{y} = \left( \begin{matrix} {y}_{1} \\ {y}_{2} \\ \vdots \\ {y}_{n} \end{matrix}\right)
\]
则
\[
f = {\left( \overline{Cy}\right) }^{\prime }A\left( {Cy}\right) = {\bar{y}}^{\prime }{\bar{C}}^{\prime }{ACy}.
\]
矩阵 \({\overline{C}}^{\prime }AC\) 仍是一个 Hermite 矩阵.
\begin{definition}
设 \(A,B\) 是两个 Hermite 矩阵,若存在非异复矩阵 \(C\) ,使
\[
B = {\bar{C}}^{\prime }{AC}
\]
则称 \(A\) 与 \(B\) 是复相合的.
\end{definition}
容易证明复相合是一个等价关系.
与实二次型类似, Hermite 型
\begin{align}
{a}_{1}{\overline{y}}_{1}{y}_{1} + {a}_{2}{\overline{y}}_{2}{y}_{2} + \cdots + {a}_{n}{\overline{y}}_{n}{y}_{n}
\end{align}
称为标准型. Hermite 型的基本问题是如何把一个 Hermite 型化成像 上式那样的标准型. 这个问题等价于寻找非异阵 \(C\) ,使 \({\bar{C}}^{\prime }{AC}\) 成为对角阵.
\begin{proposition}
共轭对称初等变换是复相合变换:
\begin{enumerate}[(1)]
\item 对换第$ i$行与第$ j$行,对换第$ i$列与第$ j$列;
\item 第$ i$行乘以复数$ c$,第$ i$列乘以$ \overline{c}$;
\item 第$ i$行乘以复数$ c$加到第$ j$行, 第$i $列乘以 $\overline{c}$加到第$ j$列.
\end{enumerate}
\end{proposition}
\begin{lemma}
设$ A\in \mathcal{M}_n(\mathbb{C})$,则必存在复非异阵$ C$使得$ \overline{C}'AC$的第(1,1)位置不为0.
\end{lemma}
\begin{proof}
若$ a_{11}\neq 0$,结论成立;若$ a_{ii}\neq 0,2\leq i\leq n$,可以通过第一类共轭对称初等变换使得$ a_{ii}$放到第(1,1)位置,结论成立;
若$ a_{ii} = 0,1\leq i\leq n$,设$ a_{ij}\neq 0,i<j$.考虑$ i,j$位置的二阶主子式\[ \begin{pmatrix}
0&a_{ij}\\
\overline{a_{ij}}&0
\end{pmatrix} ,\]
经过第三类共轭对称初等变换得到
\[ \begin{pmatrix}
2|a_{ij}|^2&a_{ij}\\
\overline{a_{ij}}&0
\end{pmatrix}, \]
再通过前面的方法使得$ (1,1)$位置不为0.
\end{proof}
\begin{theorem}
若 \(A\) 是一个 Hermite 矩阵,则必存在一个复非异阵 \(C\) ,使 \({\bar{C}}^{\prime }{AC}\) 是一个对角阵且主对角线上的元素都是实数.
\end{theorem}
\begin{proof}
对阶数$ n$进行归纳.当$ n=1$时,结论成立.设当阶数小于$ n$ 时,结论成立.当$ A = 0$时成立,下设$ A \neq 0$且阶数为$ n$的情形.
由前面引理,不妨设$ a_{11}\neq 0$.利用第三类共轭对称初等变换通过$ a_{11}$将同行同列其他元素消为零,可以得到\[ \begin{pmatrix}
a_{11} &O\\
O&A_{n-1}
\end{pmatrix}, \]
此时$ A_{n-1}$是一个$ n-1$阶的Hermite矩阵,由归纳假设,存在复非异阵$ D$使得$ \overline{D}'A_{n-1}D$为一个对角阵且主对角线上的元素都是实数.于是
\[ \begin{pmatrix}
1&O\\
O&\overline{D}'
\end{pmatrix} \begin{pmatrix}
a_{11} &O\\
O&A_{n-1}
\end{pmatrix}\begin{pmatrix}
1&O\\
O&D
\end{pmatrix} = \begin{pmatrix}
a_{11} &O\\
O&\overline{D}'A_{n-1}D
\end{pmatrix} ,\]
是一个对角阵且主对角线上的元素都是实数.并且
\[ \overline{\begin{pmatrix}
1&O\\
O&\overline{D}'
\end{pmatrix}}' = \begin{pmatrix}
1&O\\
O&D
\end{pmatrix} , \]
因此$ A$复相合于一个对角阵且主对角线上的元素都是实数.
\end{proof}
类似实二次型, 我们可以证明 Hermite 型的惯性定理.
\begin{theorem}
设 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是一个 Hermite 型,则它总可以化为如下标准型:
\[
{\bar{y}}_{1}{y}_{1} + \cdots + {\bar{y}}_{p}{y}_{p} - {\bar{y}}_{p + 1}{y}_{p + 1} - \cdots - {\bar{y}}_{r}{y}_{r}
\]
且若 \(f\) 又可化为另一个标准型:
\[
{\bar{z}}_{1}{z}_{1} + \cdots + {\bar{z}}_{k}{z}_{k} - {\bar{z}}_{k + 1}{z}_{k + 1} - \cdots - {\bar{z}}_{r}{z}_{r}
\]
则 \(p = k\) .
\end{theorem}
我们称上式中的 \(r\) 为 \(f\) 的秩, \(p\) 为 \(f\) 的正惯性指数, \(q = r - p\) 为 \(f\) 的负惯性指数, \(p - q\) 为 \(f\) 的符号差. 同样地,秩与符号差 (或正负惯性指数) 是 Hermite 矩阵复相合的全系不变量.
由于 Hermite 型的值总是实数, 故可定义正定型、负定型、半正定型、半负定型及不定型的概念. 相应地, 有正定 Hermite 矩阵、负定 Hermite 矩阵、半正定 Hermite 矩阵、半负定 Hermite 矩阵的概念. 我们只对正定型及正定阵叙述其概念及判定正定 Hermite 矩阵的定理.
\begin{definition}
设 \(f\left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) 是 Hermite 型,若对任一组不全为零的复数 \({c}_{1},{c}_{2},\cdots ,{c}_{n}\) ,均有
\[
f\left( {{c}_{1},{c}_{2},\cdots ,{c}_{n}}\right) > 0
\]
则称 \(f\) 是正定 Hermite 型,它对应的矩阵称为正定 Hermite 矩阵.
\end{definition}
\begin{theorem}
\(n\) 阶 Hermite 矩阵 \(A\) 为正定的充分必要条件是它的 \(n\) 个顺序主子式全大于零.
\end{theorem}
\begin{theorem}
设$ A$为$ n$阶的Hermite矩阵,则下列结论等价:
\begin{enumerate}[(1)]
\item $ A$正定;
\item $ A$复相合于$ I_n$;
\item 存在复非异阵$ C$,使得$ A = \overline{C}'C$;
\item $ A$的所有主子式全大于0;
\item $ A$的$ n$个顺序主子式全大于0;
\item $ A$的特征值全大于0.
\end{enumerate}
\end{theorem}
\begin{theorem}
设$ A$为$ n$阶的Hermite矩阵,则下列结论等价:
\begin{enumerate}[(1)]
\item $ A$半正定;
\item $ A$复相合于$ \begin{pmatrix}
I_r&O\\
O&O
\end{pmatrix}$;
\item 存在复矩阵$ C$,使得$ A = \overline{C}'C$;
\item $ A$的所有主子式全大于等于0;
\item $ A$的特征值全大于等于0.
\end{enumerate}
\end{theorem}
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。