Kapitel 8: Quadriken

8.1 Was sind Quadriken?

In der Schule haben Sie vermutlich ausführlich quadratische Funktionen und ihre Schaubilder behandelt. In der Regel ist das Schaubild von \(p(x)=ax^2+bx+c\) eine Parabel, die irgendwie gestreckt und verschoben im Koordinatensystem liegt. Diese quadratischen Funktionen sind sozusagen die "einfachsten" nicht-linearen Funktionen.

Wir betrachten nun als Verallgemeinerung davon, quadratische Polynome in mehreren Variablen.

Definition (quadratisches Polynom):

Wir nennen eine Funktion \(q:\mathbb {R}^ n \to \mathbb {R}\) der Form


\(q(\vec{x})=\vec{x}^TA\vec{x}+\vec{a}^T\vec{x}+\alpha\)


mit einer symmetrischen \(n\times n\)-Matrix \(A\), einem Vektor \(\vec{a}\in \mathbb {R}^n\) und einer Zahl \(\alpha \in \mathbb{R}\) ein quadratisches Polynom in \(n\) Variablen.

Falls \(A=\mathrm{diag} (\lambda_1,\lambda_2,\dots ,\lambda_n)\) eine Diagonalmatrix ist, dann ist

\(q(\vec{x})=\vec{x}^T\left(\!\begin{array}{rrrr}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\{\vdots}&&\ddots&\vdots\\0&0&\dots&\lambda_n\end{array}\!\right)\vec{x}=\lambda_1x_1^2+\lambda_2x_2^2+\dots+\lambda_nx_n^2\)

eine Summe von "reinen" Quadraten. Einträge von \(A\) abseits der Diagonalen liefern dagegen gemischte Terme der Form \(x_ i x_ j\).

Beispiele:
  1. Im Fall \(n=2\) mit \(A=\left(\! \begin{array}{rr}a_{11}& a_{12}\\ a_{12}& a_{22}\end{array}\! \right)\) ist

    \(q(\vec{x})=\vec{x}^T\left(\!\begin{array}{rr}a_{11}&a_{12}\\a_{12}&a_{22}\end{array}\!\right)\vec{x}=a_{11}x_1^2+2a_{12}x_1x_2+a_{22}x_2^2\)

  2. Für die \(3\times 3\)-Matrix \(A=\left(\! \begin{array}{rrr} 2 & 0 & -1 \\ 0 & -1 & 0 \\ -1 & 0 & 1\end{array}\! \right)\), den Vektor \(\vec{a}=\left(\! \begin{array}{r} 2 \\ 3 \\ -4\end{array}\! \right)\) und \(\alpha =-5\) ist

    \(q(x_1,x_2,x_3)=2x_1^2-x_2^2+x_3^2-2x_1x_3+2x_1+3x_2-4x_3-5.\)

Anregung:
Machen Sie sich klar, warum es keine Einschränkung ist, dass man die Matrix \(A\) als symmetrisch voraussetzt, d.h. überlegen Sie sich, dass man jedes quadratische Polynom, das man mit einer nicht-symmetrischen Matrix \(A\) erzeugt, auch durch eine symmetrische Matrix \(\tilde{A}\) erhalten kann.

Definition (Quadrik):
Die Nullstellenmenge

\(\{\vec{x}\in\mathbb{R}^n;\;q(\vec{x})=0\}\)

einer quadratischen Funktion \(q\) nennt man Quadrik.

Im folgenden geht es darum, die Diagonalisierbarkeit symmetrischer Matrizen auszunutzen, um durch eine geeignete Koordinatentransformation die Quadrik in eine möglichst einfache Form zu bringen.

Dabei bedeutet "möglichst einfach":

  • von den quadratischen Termen sollen nur noch "‘reine"’ Terme wie \(x_1^2\), \(x_2^2,\ldots \) vorkommen, aber keine gemischten Glieder \(x_1x_2\), \(x_2x_4,\ldots \) etc.

  • von den linearen Termen sollen möglichst wenige übrigbleiben, im Idealfall überhaupt keine

  • die Koordinatentransformationen sollen Längen und Winkel nicht ändern. Wir werden sehen, dass man mit Drehungen und Verschiebungen auskommen kann.


Wir starten mit der Beobachtung aus dem vorigen Kapitel, dass jede symmetrische Matrix diagonalisierbar ist, genauer, dass es zu einer vorgegebenen symmetrischen Matrix \(A\) eine orthogonale Matrix \(T\) gibt mit \(T^{-1}AT =T^ TAT=D\) wobei \(D\) eine Diagonalmatrix ist, deren Diagonalelemente die Eigenwerte von \(A\) sind. Mehrfache Eigenwerte kommen dabei entsprechend ihrer Vielfachheit auch mehrfach in \(D\) vor. Nun kann man diese Gleichung auch umgekehrt schreiben als

\(A=TDT^T\)

indem man die ursprüngliche Gleichung von links mit \(T\) und von rechts mit \(T^ T\) multipliziert. Damit lässt sich \(q(\vec{x})\) umschreiben:

\(\begin{array}{rcl}q(\vec{x})&=&\vec{x}^TA\vec{x}+\vec{a}^T\vec{x}+\alpha\\&&\\&=&\vec{x}^TTDT^T\vec{x}+\vec{a}^T\vec{x}+\alpha\\&&\\&=&(T^T\vec{x})^TD(T^T\vec{x})+\vec{a}^T\underbrace{TT^T}_{=E_n}\vec{x}+\alpha\end{array}\)

Nun setzt man \(\vec{y}= T^ T \vec{x}\) und erhält durch Einsetzen

\(\begin{array}{rcl}\tilde{q}(\vec{y})&=&\vec{y}^TD\vec{y}+\vec{a}^TT\vec{y}+\alpha\\&&\\&=&\lambda_1y_1^2+\lambda_2y_2^2+\dots+\lambda_ny_n^2+\vec{a}^TT\vec{y}+\alpha\\&&\\&=&\lambda_1y_1^2+\lambda_2y_2^2+\dots+\lambda_ny_n^2+\vec{b}^T\vec{y}+\alpha\end{array}\)

wobei der Vektor \(\vec{b}=T^ T\vec{a}\) aus \(\vec{a}\) genauso entsteht wie \(\vec{y}\) aus \(\vec{x}\).

Im nächsten Kapitel werden wir nachtragen, dass der Wechsel von \(\vec{x}\) zu \(\vec{y}\) mit einer orthogonalen Matrix \(T\) einer Drehung des Koordinatensystems entspricht.
Genauer ist damit Folgendes gemeint: Wenn wir \(\vec{x}=x_1 \vec{e}_1+x_2 \vec{e}_2+x_3 \vec{e}_3\) schreiben, dann entspricht wegen \(T\vec{y}=\vec{x}\)

\(\begin{array}{rcl}T\vec{y}=T(y_1\vec{e}_1+y_2\vec{e}_2+y_3\vec{e}_3)&=&x_1\vec{e}_1+x_2\vec{e}_2+x_3\vec{e}_3\\{\Leftrightarrow}y_1(T\vec{e}_1)+y_2(T\vec{e}_2)+y_3(T\vec{e}_3)&=&x_1\vec{e}_1+x_2\vec{e}_2+x_3\vec{e}_3\end{array}\)

der Vektor \((x_1,x_2,x_3)^ T\) im \(\vec{x}\)-Koordinatensystem genau dem Vektor \((y_1,y_2,y_3)^ T\), wenn man im \(\vec{y}\)-Koordinatensystem als Basisvektoren die drei Vektoren \(T\vec{e}_1\), \(T\vec{e}_2\) und \(T\vec{e}_3\) verwendet.


In einem weiteren Schritt kann man nun noch durch quadratisches Ergänzen einige oder alle linearen Terme entfernen. Für all diejenigen Indizes, für die \(\lambda _ j\neq 0\) ist, kann der Term \(\lambda _ j y_ j^2+b_ j y_ j\) mit Hilfe der Transformation

\(z_j=y_j+\displaystyle\frac{b_j}{2\lambda_j}\)

die geometrisch einer Verschiebung entspricht, durch

\(\lambda_jy_j^2+b_jy_j=\lambda_j\left(z_j-\displaystyle\frac{b_j}{2\lambda_j}\right)^2+b_j\left(z_j-\displaystyle\frac{b_j}{2\lambda_j}\right)=\lambda_jz_j^2-\displaystyle\frac{b_j^2}{4\lambda_j}\)

ersetzt werden. So erreicht man schließlich die Normalform

\(\hat{q}(z)=\lambda_1z_1^2+\lambda_2z_2^2+\dots+\lambda_nz_n^2+c_1z_1+c_2z_2+\dots+c_nz_n+\beta\)

wobei

\(\lambda_jc_j=0\;\;\text{f\"ur\;\;alle\;\;}j\)

d.h. für keinen Index kann gleichzeitig \(\lambda _ j\neq 0\) und \(c_ j\neq 0\) sein. Die Konstante \(\beta \) ergibt sich aus der ursprünglichen Konstante \(\alpha \) und der Summe aller "‘Reste"’ \(-\displaystyle\frac {b_ j^2}{4\lambda _ j}\), die beim quadratischen Ergänzen auftreten.

Zusammenfassung

Die Transformation einer Quadrik

\(q(\vec{x})=\vec{x}^TA\vec{x}+\vec{a}^T\vec{x}+\alpha=0\)

auf die sogenannte Normalform besteht aus drei Schritten.

  1. Wenn die orthogonale Matrix \(T\) so gewählt ist, dass sie \(A\) diagonalisiert, d.h. \(T^ TAT=D\), dann führt man die Koordinatentransformation \(\vec{y}= T^ T \vec{x}\) durch, um die gemischten quadratischen Terme zu eliminieren.

    Bei diesem Schritt geht der Term \(\vec{a}^ T \vec{x}\) in einen Term \(\vec{b}^ T=T^ T\vec{a}\) über, der konstante Term \(\alpha \) bleibt unverändert.

  2. Für alle Indizes \(j\), für die nun noch ein Term \(\lambda_j y_j^2\) vorhanden ist, kann man durch quadratische Ergänzung den linearen Anteil \(\tilde{a}_ j y_ j\) ebenfalls eliminieren. Dabei ändert sich der konstante Term.

  3. Anhand der Ordnung (quadratisch? linear?) und dem Vorzeichen der nun noch vorhandenen Terme lässt sich die Quadrik klassifizieren. Dies wird in den nächsten beiden Abschnitten für ebene und räumliche Quadriken illustriert.

Zuletzt geändert: Sonntag, 27. Januar 2019, 23:22