Kapitel 8: Quadriken

8.1 Was sind Quadriken?

In der Schule haben Sie vermutlich ausfĂŒhrlich quadratische Funktionen und ihre Schaubilder behandelt. In der Regel ist das Schaubild von \(p(x)=ax^2+bx+c\) eine Parabel, die irgendwie gestreckt und verschoben im Koordinatensystem liegt. Diese quadratischen Funktionen sind sozusagen die "einfachsten" nicht-linearen Funktionen.

Wir betrachten nun als Verallgemeinerung davon, quadratische Polynome in mehreren Variablen.

Definition (quadratisches Polynom):

Wir nennen eine Funktion \(q:\mathbb {R}^ n \to \mathbb {R}\) der Form


\(q(\vec{x})=\vec{x}^TA\vec{x}+\vec{a}^T\vec{x}+\alpha\)


mit einer symmetrischen \(n\times n\)-Matrix \(A\), einem Vektor \(\vec{a}\in \mathbb {R}^n\) und einer Zahl \(\alpha \in \mathbb{R}\) ein quadratisches Polynom in \(n\) Variablen.

Falls \(A=\mathrm{diag} (\lambda_1,\lambda_2,\dots ,\lambda_n)\) eine Diagonalmatrix ist, dann ist

\(q(\vec{x})=\vec{x}^T\left(\!\begin{array}{rrrr}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\{\vdots}&&\ddots&\vdots\\0&0&\dots&\lambda_n\end{array}\!\right)\vec{x}=\lambda_1x_1^2+\lambda_2x_2^2+\dots+\lambda_nx_n^2\)

eine Summe von "reinen" Quadraten. EintrÀge von \(A\) abseits der Diagonalen liefern dagegen gemischte Terme der Form \(x_ i x_ j\).

Beispiele:
  1. Im Fall \(n=2\) mit \(A=\left(\! \begin{array}{rr}a_{11}& a_{12}\\ a_{12}& a_{22}\end{array}\! \right)\) ist

    \(q(\vec{x})=\vec{x}^T\left(\!\begin{array}{rr}a_{11}&a_{12}\\a_{12}&a_{22}\end{array}\!\right)\vec{x}=a_{11}x_1^2+2a_{12}x_1x_2+a_{22}x_2^2\)

  2. FĂŒr die \(3\times 3\)-Matrix \(A=\left(\! \begin{array}{rrr} 2 & 0 & -1 \\ 0 & -1 & 0 \\ -1 & 0 & 1\end{array}\! \right)\), den Vektor \(\vec{a}=\left(\! \begin{array}{r} 2 \\ 3 \\ -4\end{array}\! \right)\) und \(\alpha =-5\) ist

    \(q(x_1,x_2,x_3)=2x_1^2-x_2^2+x_3^2-2x_1x_3+2x_1+3x_2-4x_3-5.\)

Anregung:
Machen Sie sich klar, warum es keine EinschrĂ€nkung ist, dass man die Matrix \(A\) als symmetrisch voraussetzt, d.h. ĂŒberlegen Sie sich, dass man jedes quadratische Polynom, das man mit einer nicht-symmetrischen Matrix \(A\) erzeugt, auch durch eine symmetrische Matrix \(\tilde{A}\) erhalten kann.

Definition (Quadrik):
Die Nullstellenmenge

\(\{\vec{x}\in\mathbb{R}^n;\;q(\vec{x})=0\}\)

einer quadratischen Funktion \(q\) nennt man Quadrik.

Im folgenden geht es darum, die Diagonalisierbarkeit symmetrischer Matrizen auszunutzen, um durch eine geeignete Koordinatentransformation die Quadrik in eine möglichst einfache Form zu bringen.

Dabei bedeutet "möglichst einfach":

  • von den quadratischen Termen sollen nur noch "‘reine"’ Terme wie \(x_1^2\), \(x_2^2,\ldots \) vorkommen, aber keine gemischten Glieder \(x_1x_2\), \(x_2x_4,\ldots \) etc.

  • von den linearen Termen sollen möglichst wenige ĂŒbrigbleiben, im Idealfall ĂŒberhaupt keine

  • die Koordinatentransformationen sollen LĂ€ngen und Winkel nicht Ă€ndern. Wir werden sehen, dass man mit Drehungen und Verschiebungen auskommen kann.


Wir starten mit der Beobachtung aus dem vorigen Kapitel, dass jede symmetrische Matrix diagonalisierbar ist, genauer, dass es zu einer vorgegebenen symmetrischen Matrix \(A\) eine orthogonale Matrix \(T\) gibt mit \(T^{-1}AT =T^ TAT=D\) wobei \(D\) eine Diagonalmatrix ist, deren Diagonalelemente die Eigenwerte von \(A\) sind. Mehrfache Eigenwerte kommen dabei entsprechend ihrer Vielfachheit auch mehrfach in \(D\) vor. Nun kann man diese Gleichung auch umgekehrt schreiben als

\(A=TDT^T\)

indem man die ursprĂŒngliche Gleichung von links mit \(T\) und von rechts mit \(T^ T\) multipliziert. Damit lĂ€sst sich \(q(\vec{x})\) umschreiben:

\(\begin{array}{rcl}q(\vec{x})&=&\vec{x}^TA\vec{x}+\vec{a}^T\vec{x}+\alpha\\&&\\&=&\vec{x}^TTDT^T\vec{x}+\vec{a}^T\vec{x}+\alpha\\&&\\&=&(T^T\vec{x})^TD(T^T\vec{x})+\vec{a}^T\underbrace{TT^T}_{=E_n}\vec{x}+\alpha\end{array}\)

Nun setzt man \(\vec{y}= T^ T \vec{x}\) und erhÀlt durch Einsetzen

\(\begin{array}{rcl}\tilde{q}(\vec{y})&=&\vec{y}^TD\vec{y}+\vec{a}^TT\vec{y}+\alpha\\&&\\&=&\lambda_1y_1^2+\lambda_2y_2^2+\dots+\lambda_ny_n^2+\vec{a}^TT\vec{y}+\alpha\\&&\\&=&\lambda_1y_1^2+\lambda_2y_2^2+\dots+\lambda_ny_n^2+\vec{b}^T\vec{y}+\alpha\end{array}\)

wobei der Vektor \(\vec{b}=T^ T\vec{a}\) aus \(\vec{a}\) genauso entsteht wie \(\vec{y}\) aus \(\vec{x}\).

Im nÀchsten Kapitel werden wir nachtragen, dass der Wechsel von \(\vec{x}\) zu \(\vec{y}\) mit einer orthogonalen Matrix \(T\) einer Drehung des Koordinatensystems entspricht.
Genauer ist damit Folgendes gemeint: Wenn wir \(\vec{x}=x_1 \vec{e}_1+x_2 \vec{e}_2+x_3 \vec{e}_3\) schreiben, dann entspricht wegen \(T\vec{y}=\vec{x}\)

\(\begin{array}{rcl}T\vec{y}=T(y_1\vec{e}_1+y_2\vec{e}_2+y_3\vec{e}_3)&=&x_1\vec{e}_1+x_2\vec{e}_2+x_3\vec{e}_3\\{\Leftrightarrow}y_1(T\vec{e}_1)+y_2(T\vec{e}_2)+y_3(T\vec{e}_3)&=&x_1\vec{e}_1+x_2\vec{e}_2+x_3\vec{e}_3\end{array}\)

der Vektor \((x_1,x_2,x_3)^ T\) im \(\vec{x}\)-Koordinatensystem genau dem Vektor \((y_1,y_2,y_3)^ T\), wenn man im \(\vec{y}\)-Koordinatensystem als Basisvektoren die drei Vektoren \(T\vec{e}_1\), \(T\vec{e}_2\) und \(T\vec{e}_3\) verwendet.


In einem weiteren Schritt kann man nun noch durch quadratisches ErgĂ€nzen einige oder alle linearen Terme entfernen. FĂŒr all diejenigen Indizes, fĂŒr die \(\lambda _ j\neq 0\) ist, kann der Term \(\lambda _ j y_ j^2+b_ j y_ j\) mit Hilfe der Transformation

\(z_j=y_j+\displaystyle\frac{b_j}{2\lambda_j}\)

die geometrisch einer Verschiebung entspricht, durch

\(\lambda_jy_j^2+b_jy_j=\lambda_j\left(z_j-\displaystyle\frac{b_j}{2\lambda_j}\right)^2+b_j\left(z_j-\displaystyle\frac{b_j}{2\lambda_j}\right)=\lambda_jz_j^2-\displaystyle\frac{b_j^2}{4\lambda_j}\)

ersetzt werden. So erreicht man schließlich die Normalform

\(\hat{q}(z)=\lambda_1z_1^2+\lambda_2z_2^2+\dots+\lambda_nz_n^2+c_1z_1+c_2z_2+\dots+c_nz_n+\beta\)

wobei

\(\lambda_jc_j=0\;\;\text{f\"ur\;\;alle\;\;}j\)

d.h. fĂŒr keinen Index kann gleichzeitig \(\lambda _ j\neq 0\) und \(c_ j\neq 0\) sein. Die Konstante \(\beta \) ergibt sich aus der ursprĂŒnglichen Konstante \(\alpha \) und der Summe aller "‘Reste"’ \(-\displaystyle\frac {b_ j^2}{4\lambda _ j}\), die beim quadratischen ErgĂ€nzen auftreten.

Zusammenfassung

Die Transformation einer Quadrik

\(q(\vec{x})=\vec{x}^TA\vec{x}+\vec{a}^T\vec{x}+\alpha=0\)

auf die sogenannte Normalform besteht aus drei Schritten.

  1. Wenn die orthogonale Matrix \(T\) so gewĂ€hlt ist, dass sie \(A\) diagonalisiert, d.h. \(T^ TAT=D\), dann fĂŒhrt man die Koordinatentransformation \(\vec{y}= T^ T \vec{x}\) durch, um die gemischten quadratischen Terme zu eliminieren.

    Bei diesem Schritt geht der Term \(\vec{a}^ T \vec{x}\) in einen Term \(\vec{b}^ T=T^ T\vec{a}\) ĂŒber, der konstante Term \(\alpha \) bleibt unverĂ€ndert.

  2. FĂŒr alle Indizes \(j\), fĂŒr die nun noch ein Term \(\lambda_j y_j^2\) vorhanden ist, kann man durch quadratische ErgĂ€nzung den linearen Anteil \(\tilde{a}_ j y_ j\) ebenfalls eliminieren. Dabei Ă€ndert sich der konstante Term.

  3. Anhand der Ordnung (quadratisch? linear?) und dem Vorzeichen der nun noch vorhandenen Terme lĂ€sst sich die Quadrik klassifizieren. Dies wird in den nĂ€chsten beiden Abschnitten fĂŒr ebene und rĂ€umliche Quadriken illustriert.

Last modified: Sunday, 27 January 2019, 11:22 PM