Extremwert

Minima und Maxima der Funktion cos(3πx)/x im Bereich 0.1≤ x ≤1.1

In der Mathematik ist Extremwert (oder Extremum; Plural: Extrema) der Oberbegriff für ein lokales oder globales Maximum oder Minimum. Ein lokales Maximum bzw. lokales Minimum ist der Wert der Funktion an einer Stelle x {\displaystyle x} , wenn die Funktion in einer hinreichend kleinen Umgebung keine größeren bzw. kleineren Werte annimmt; die zugehörige Stelle x {\displaystyle x} wird lokaler Maximierer bzw. lokaler Minimierer, Maximalstelle bzw. Minimalstelle oder zusammenfassend auch Extremstelle genannt, die Kombination aus Stelle und Wert Extrempunkt oder je nach Art des Extremums Hoch- bzw. Tiefpunkt. Umgangssprachlich wird ein Hochpunkt auch als Gipfel bezeichnet.

Ein globales Maximum wird auch absolutes Maximum genannt, für ein lokales Maximum wird auch der Begriff relatives Maximum gebraucht. Lokale und globale Minima sind analog definiert.

Die Lösung einer Extremwertaufgabe, für eine einfache Darstellung siehe Kurvendiskussion, nennt man die extremale Lösung.

Eindimensionaler Fall

Formale Definitionen

Es sei D R {\displaystyle D\subseteq \mathbb {R} } eine Teilmenge der reellen Zahlen (z. B. ein Intervall) und f : D R {\displaystyle f\colon D\to \mathbb {R} } eine Funktion.

f {\displaystyle f} hat an der Stelle x 0 D {\displaystyle x_{0}\in D}

  • ein lokales Minimum, wenn es eine Umgebung U {\displaystyle U} von x 0 {\displaystyle x_{0}} in D {\displaystyle D} gibt, so dass f ( x 0 ) f ( x ) {\displaystyle f(x_{0})\leq f(x)} für alle x U {\displaystyle x\in U} gilt;
  • ein globales Minimum, wenn f ( x 0 ) f ( x ) {\displaystyle f(x_{0})\leq f(x)} für alle x D {\displaystyle x\in D} gilt;
  • ein lokales Maximum, wenn es eine Umgebung U {\displaystyle U} von x 0 {\displaystyle x_{0}} in D {\displaystyle D} gibt, so dass f ( x 0 ) f ( x ) {\displaystyle f(x_{0})\geq f(x)} für alle x U {\displaystyle x\in U} gilt;
  • ein globales Maximum, wenn f ( x 0 ) f ( x ) {\displaystyle f(x_{0})\geq f(x)} für alle x D {\displaystyle x\in D} gilt.[1]

Gibt es eine Umgebung U {\displaystyle U} von x 0 {\displaystyle x_{0}} , in der für alle x x 0 {\displaystyle x\neq x_{0}} sogar die strenge Ungleichung f ( x 0 ) < f ( x ) {\displaystyle f(x_{0})<f(x)} (bzw. f ( x 0 ) > f ( x ) {\displaystyle f(x_{0})>f(x)} ) gilt, so spricht man von einem strengen[2] oder isolierten[3] lokalen Minimum (bzw. Maximum).

Besitzt die Funktion an der Stelle x 0 {\displaystyle x_{0}} ein strenges lokales Maximum, so nennt man den Punkt ( x 0 , f ( x 0 ) ) {\displaystyle (x_{0},f(x_{0}))} Hochpunkt, hat sie dort ein strenges lokales Minimum, so heißt der Punkt Tiefpunkt. Liegt ein Hoch- oder ein Tiefpunkt vor, so spricht man allgemein von einem Extrempunkt.[4]

Existenz von Extrema

Jede stetige Funktion auf einem kompakten Intervall nimmt ein globales Maximum und ein globales Minimum an.[A 1] Dieser Satz vom Minimum und Maximum folgt aus dem Satz von Heine-Borel, wird aber oft auch nach Karl Weierstraß oder Bernard Bolzano benannt. Es handelt sich um eine reine Existenzaussage, die keine Informationen darüber liefert, wie die Extrema ggf. aufgefunden werden können.

Bestimmung von Extremstellen differenzierbarer Funktionen

Ist f {\displaystyle f} eine differenzierbare Funktion auf einer offenen Menge U R {\displaystyle U\subseteq \mathbb {R} } , so lässt sie sich mithilfe der Differentialrechnung auf Extremstellen untersuchen.

Notwendiges Kriterium

Hat f {\displaystyle f} an einer Stelle x 0 U {\displaystyle x_{0}\in U} ein lokales Extremum und ist dort differenzierbar, so ist dort die erste Ableitung gleich null:[2]

f ( x 0 ) = 0 {\displaystyle f'(x_{0})=0\,} .

Neben lokalen Extrema erfüllen auch Sattelpunkte dieses Kriterium.[A 2] Ein klassisches Beispiel ist die Funktion f ( x ) = x 3 {\displaystyle f(x)=x^{3}} , deren Ableitung im Punkt x = 0 {\displaystyle x=0} verschwindet, ohne dass die Funktion dort ein lokales Extremum hat. Zum Nachweis der Extrempunkteigenschaft bedarf es deshalb eines hinreichenden Kriteriums oder weiterer Überlegungen.

Hinreichende Kriterien

  • Ist f {\displaystyle f} zweimal differenzierbar, und gilt neben f ( x 0 ) = 0 {\displaystyle f'(x_{0})=0\,} auch f ( x 0 ) 0 {\displaystyle f''(x_{0})\neq 0\,} , so hat f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} ein strenges lokales Extremum. Ist f ( x 0 ) = 0 {\displaystyle f'(x_{0})=0\,} und f ( x 0 ) > 0 {\displaystyle f''(x_{0})>0\,} , handelt es sich dabei um ein strenges lokales Minimum, für f ( x 0 ) < 0 {\displaystyle f''(x_{0})<0\,} dagegen um ein strenges lokales Maximum (Kriterium der 2. Ableitung).[5]
  • Ist f ( x 0 ) = 0 {\displaystyle f'(x_{0})=0\,} und außerdem f {\displaystyle f'} lokal um x 0 {\displaystyle x_{0}} (streng) monoton wachsend (bzw. steigend), so hat f {\displaystyle f} bei x 0 {\displaystyle x_{0}} ein (strenges) lokales Minimum (bzw. Maximum).[6]
  • Aus den ersten beiden Kriterien folgt eine allgemeinere Aussage: Ist f {\displaystyle f} n-mal differenzierbar und gilt
f ( x 0 ) = f ( x 0 ) = = f ( n 1 ) ( x 0 ) = 0 , f ( n ) ( x 0 ) 0 , {\displaystyle f'(x_{0})=f''(x_{0})=\ldots =f^{(n-1)}(x_{0})=0\,,\quad f^{(n)}(x_{0})\neq 0,}
so folgt:
(1) Ist n {\displaystyle n} gerade sowie f ( n ) ( x 0 ) < 0 {\displaystyle f^{(n)}(x_{0})<0} (bzw. f ( n ) ( x 0 ) > 0 {\displaystyle f^{(n)}(x_{0})>0} ), so hat f {\displaystyle f} bei x 0 {\displaystyle x_{0}} ein strenges lokales Maximum (bzw. Minimum).
(2) Ist n {\displaystyle n} hingegen ungerade, so ist f {\displaystyle f} bei x 0 {\displaystyle x_{0}} streng monoton steigend oder fallend (hat also dort einen Sattelpunkt).[7]
  • Ist f ( x 0 ) = 0 {\displaystyle f'(x_{0})=0} und gilt zudem f ( x ) 0 {\displaystyle f'(x)\leq 0} (bzw. f ( x ) 0 {\displaystyle f'(x)\geq 0} ) für alle x < x 0 {\displaystyle x<x_{0}} und f ( x ) 0 {\displaystyle f'(x)\geq 0} (bzw. f ( x ) 0 {\displaystyle f'(x)\leq 0} ) für alle x > x 0 {\displaystyle x>x_{0}} in einer Umgebung von x 0 {\displaystyle x_{0}} , so hat f {\displaystyle f} bei x 0 {\displaystyle x_{0}} ein lokales Minimum (Maximum).[8] Gelten sogar die strengen Ungleichungen f ( x ) < 0 {\displaystyle f'(x)<0} und f ( x ) > 0 {\displaystyle f'(x)>0} , d. h. wechselt f {\displaystyle f'} bei x 0 {\displaystyle x_{0}} das Vorzeichen, so liegt ein strenges lokales Minimum bzw. Maximum vor (Vorzeichenwechselkriterium).[9]
  • Für stetige Funktionen auf Intervallen gilt: Zwischen zwei lokalen Minima einer Funktion liegt stets ein lokales Maximum, und zwischen zwei lokalen Maxima liegt stets ein lokales Minimum.
  • Für differenzierbare Funktionen auf Intervallen gilt: Gibt es zwei Stellen a , b {\displaystyle a,b} mit a < x 0 < b {\displaystyle a<x_{0}<b} , so dass die erste Ableitung im Intervall ( a , b ) {\displaystyle (a,b)} nur die Nullstelle x 0 {\displaystyle x_{0}} hat, und sind f ( a ) > f ( x 0 ) {\displaystyle f(a)>f(x_{0})} sowie f ( b ) > f ( x 0 ) {\displaystyle f(b)>f(x_{0})} , so hat f {\displaystyle f} bei x 0 {\displaystyle x_{0}} ein lokales Minimum. Gilt die analoge Bedingung mit f ( a ) < f ( x 0 ) {\displaystyle f(a)<f(x_{0})} und f ( b ) < f ( x 0 ) {\displaystyle f(b)<f(x_{0})} , so hat f {\displaystyle f} bei x 0 {\displaystyle x_{0}} ein lokales Maximum.

Es gibt allerdings auch Funktionen, bei denen keines der oben genannten Kriterien weiterhilft (siehe das letzte Beispiel).

Beispiele

  • f ( x ) = x 2 + 3. {\displaystyle f(x)=x^{2}+3.} Die erste Ableitung f ( x ) = 2 x {\displaystyle f'(x)=2x} hat nur bei x 0 = 0 {\displaystyle x_{0}=0} eine Nullstelle. Die zweite Ableitung f ( x ) = 2 {\displaystyle f''(x)=2} ist dort positiv, also nimmt f {\displaystyle f} bei 0 ein lokales Minimum an, nämlich f ( 0 ) = 3 {\displaystyle f(0)=3} .
  • f ( x ) = x 4 + 3. {\displaystyle f(x)=x^{4}+3.} Die erste Ableitung f ( x ) = 4 x 3 {\displaystyle f'(x)=4x^{3}} hat nur bei x 0 = 0 {\displaystyle x_{0}=0} eine Nullstelle. Die zweite Ableitung f ( x ) = 12 x 2 {\displaystyle f''(x)=12x^{2}} ist dort ebenfalls 0. Man kann nun auf verschiedene Arten fortfahren:
    • Auch die dritte Ableitung f ( x ) = 24 x {\displaystyle f'''(x)=24x} ist dort 0. Die vierte Ableitung hingegen ist mit f ( 4 ) ( x ) = 24 {\displaystyle f^{(4)}(x)=24} die erste höhere Ableitung, die nicht 0 ist. Da diese Ableitung einen positiven Wert hat und gerade ist, gilt nach (1), dass die Funktion dort ein lokales Minimum besitzt.
    • Die erste Ableitung hat bei 0 einen Vorzeichenwechsel von Minus nach Plus, also hat f {\displaystyle f} bei x 0 = 0 {\displaystyle x_{0}=0} ein lokales Minimum.
    • Es ist f ( 1 ) = f ( 1 ) = 4 > 3 = f ( 0 ) {\displaystyle f(-1)=f(1)=4>3=f(0)} , also hat f {\displaystyle f} im Intervall ( 1 , 1 ) {\displaystyle (-1,1)} ein lokales Minimum. Da die erste Ableitung in diesem Intervall nur die Nullstelle x 0 = 0 {\displaystyle x_{0}=0} hat, muss das lokale Minimum dort angenommen werden.
  • Die Funktion, die durch f ( x ) = exp ( 1 / x 2 ) sin 2 ( 1 / x 2 ) {\displaystyle f(x)=\exp(-1/x^{2})\cdot \sin ^{2}(1/x^{2})} für x 0 {\displaystyle x\neq 0} und durch f ( 0 ) = 0 {\displaystyle f(0)=0} definiert ist, hat die folgenden Eigenschaften:
    • Sie hat bei x = 0 {\displaystyle x=0} ein globales Minimum.
    • Sie ist beliebig oft differenzierbar.
    • Alle Ableitungen bei x = 0 {\displaystyle x=0} sind gleich 0.
    • Die erste Ableitung hat keinen Vorzeichenwechsel bei 0.
    • Auch die anderen beiden oben genannten Kriterien sind nicht anwendbar.

Anwendungsbeispiel

In der Praxis können Extremwert-Berechnungen zur Lösung von Optimierungsproblemen verwendet werden, wie das folgende Beispiel zeigt:

  • Wie muss ein Rechteck aussehen, das bei einem gegebenen Umfang einen maximalen Flächeninhalt hat?

Lösungsweg:

Wird die Länge des Rechtecks mit a {\displaystyle a} bezeichnet und seine Breite mit b {\displaystyle b} ( a , b > 0 {\displaystyle a,b>0} ), so lautet die Formel für die zu maximierende Rechtecksfläche A = a b {\displaystyle A=a\cdot b} (Zielfunktion). Durch Umstellen der Umfangsformel U = 2 ( a + b ) {\displaystyle U=2(a+b)} erhält man b = 1 2 U a {\textstyle b={\frac {1}{2}}U-a} . Einsetzen in die Flächenformel eliminiert die Variable b {\displaystyle b} in der Zielfunktion:

A ( a ) = a 2 + 1 2 U a {\displaystyle A(a)=-a^{2}+{\frac {1}{2}}Ua} .

Die notwendige Bedingung liefert Kandidaten für ein lokales Maximum. Dazu bildet man die erste Ableitung

A ( a ) = 2 a + 1 2 U {\displaystyle A'(a)=-2a+{\frac {1}{2}}U}

und setzt sie gleich null:

2 a + 1 2 U = 0 {\displaystyle -2a+{\frac {1}{2}}U=0} .

Hieraus erhält man durch elementare Umformungen als einzigen Kandidaten a 0 = 1 4 U {\textstyle a_{0}={\frac {1}{4}}U} .

Die zweite Ableitung lautet

A ( a ) = 2 a {\displaystyle A''(a)=-2a} .

Sie ist für jedes a > 0 {\displaystyle a>0} negativ, also insbesondere für a 0 = 1 4 U {\textstyle a_{0}={\frac {1}{4}}U} . Somit liegt dort ein lokales Maximum vor, das zugleich das globale Maximum ist (da a 0 {\displaystyle a_{0}} der einzige Kandidat für ein lokales Maximum ist). Durch Einsetzen der Maximalstelle in b = 1 2 U a {\textstyle b={\frac {1}{2}}U-a} erhält man auch b 0 = 1 4 U {\textstyle b_{0}={\frac {1}{4}}U} . Also ist der größtmögliche Flächeninhalt eines Rechtecks bei vorgegebenen Umfang dann zu erzielen ist, wenn beide Seitenlängen gleich sind (was einem Quadrat entspricht). Umgekehrt lässt sich aber auch sagen, dass ein Rechteck mit vorgegebenem Flächeninhalt den geringsten Umfang aufweist, wenn seine Länge und sein Höhe im Verhältnis 1 : 1 {\displaystyle 1:1} zueinander stehen, d. h. wenn das Rechteck ein Quadrat ist.

Mehrdimensionaler Fall

Es seien U R n {\displaystyle U\subseteq \mathbb {R} ^{n}} und f : U R {\displaystyle f\colon U\to \mathbb {R} } eine Funktion. Weiterhin sei x U {\displaystyle x\in U} . Ein lokales Minimum/Maximum in x {\displaystyle x} ist dann gegeben, wenn eine Umgebung von x {\displaystyle x} existiert, in welcher kein Punkt einen kleineren bzw. größeren Funktionswert annimmt.

Analog zum eindimensionalen Fall ist das Verschwinden des Gradienten

D f ( x ) = grad f ( x ) {\displaystyle Df(x)=\operatorname {grad} f(x)}

eine notwendige Bedingung dafür, dass f {\displaystyle f} in einem Punkt x {\displaystyle x} im Inneren von U {\displaystyle U} ein Extremum annimmt. Hinreichend ist in diesem Fall die Definitheit der Hesse-Matrix D 2 f ( x ) {\displaystyle D^{2}f(x)} : Ist sie positiv definit, liegt ein lokales Minimum vor; ist sie negativ definit, handelt es sich um ein lokales Maximum; ist sie indefinit, liegt kein Extrempunkt, sondern ein Sattelpunkt vor. Wenn sie nur semidefinit ist, ist keine Entscheidung anhand der Hesse-Matrix möglich (siehe peanosche Fläche).

Unendlichdimensionaler Fall

Definition

Der Begriff des Maximums und des Minimums überträgt sich direkt auf den unendlichdimensionalen Fall. Seien X {\displaystyle X} ein Vektorraum und D X {\displaystyle D\subset X} eine Teilmenge dieses Vektorraumes sowie f : D R {\displaystyle f\colon D\to \mathbb {R} } ein Funktional. Dann hat f {\displaystyle f} an der Stelle x ~ D {\displaystyle {\tilde {x}}\in D}

  • ein (globales) Minimum, wenn f ( x ~ ) f ( x ) {\displaystyle f({\tilde {x}})\leq f(x)} für alle x D {\displaystyle x\in D}
  • ein (globales) Maximum, wenn f ( x ~ ) f ( x ) {\displaystyle f({\tilde {x}})\geq f(x)} für alle x D {\displaystyle x\in D}

Der Zusatz „globales“ wird meist weggelassen, wenn aus dem Zusammenhang klar ist, was gemeint ist. Ist X {\displaystyle X} zusätzlich mit einer Topologie versehen, also ein topologischer Raum, dann hat f {\displaystyle f} an der Stelle x ~ D {\displaystyle {\tilde {x}}\in D}

  • ein lokales Minimum, wenn es eine Umgebung U {\displaystyle U} von x ~ {\displaystyle {\tilde {x}}} gibt, so dass f ( x ~ ) f ( x ) {\displaystyle f({\tilde {x}})\leq f(x)} für alle x U D {\displaystyle x\in U\cap D} gilt.
  • ein lokales Maximum, wenn es eine Umgebung U {\displaystyle U} von x ~ {\displaystyle {\tilde {x}}} gibt, so dass f ( x ~ ) f ( x ) {\displaystyle f({\tilde {x}})\geq f(x)} für alle x U D {\displaystyle x\in U\cap D} gilt.

Ein Punkt heißt ein (lokales) Extremum, wenn er ein (lokales) Minimum oder ein (lokales) Maximum ist. Jedes globale Minimum (Maximum) ist ein lokales Minimum (Maximum).

Existenz, Eindeutigkeit und Geometrie von Extrema

Existenz

Entsprechend den Existenzaussagen für reelle Funktionen gibt es auch Aussagen für die Existenz von Extremalstellen von Funktionalen. Ist X {\displaystyle X} ein normierter Raum, so gilt:

Da diese Version für die Anwendung und Überprüfung oft unpraktisch ist, schwächt man dies ab zu der Aussage, dass jedes stetige quasikonvexe Funktional auf einer beschränkten, konvexen und abgeschlossenen Teilmenge eines reflexiven Banachraums ein Minimum annimmt. Diese Aussage gilt auch für alle konvexen Funktionale, da diese immer quasikonvex sind. Im Endlichdimensionalen kann auf die Konvexität der Teilmenge verzichtet werden.

Eindeutigkeit

Unter gewissen Umständen sind die Optimalpunkte sogar eindeutig bestimmt. Dazu gehört zum Beispiel die strikte Konvexität.

Geometrie

Schränkt man sich auf gewisse Klassen von Funktionalen ein, so kann man Aussagen über die Geometrie der Menge der Extremalpunkte treffen.

  • Ist das Funktional quasikonvex auf einer konvexen Menge, so ist die Menge der Minima konvex.
  • Ist das Funktional quasikonkav auf einer konvexen Menge, so ist die Menge der Maxima konvex.
  • Ist das Funktional konvex auf einer konvexen Menge, so ist jedes lokale Minimum ein globales Minimum.
  • Ist das Funktional konkav auf einer konvexen Menge, so ist jedes lokale Maximum ein globales Maximum.

Andere Extremwerte

Diskrete Optimierung

Bei diskreten Optimierungsproblemen ist der oben definierte Begriff des lokalen Extremums nicht geeignet, da in jedem Punkt ein lokales Extremum in diesem Sinne vorliegt. Für Extrema einer Funktion f : D R {\displaystyle f\colon D\to \mathbb {R} } wird daher ein anderer Umgebungsbegriff verwendet: Man benutzt eine Nachbarschaftsfunktion N {\displaystyle N} , die jedem Punkt die Menge seiner Nachbarn zuordnet,

N : D P ( D ) ; {\displaystyle N\colon D\to {\mathcal {P}}(D);}

dabei steht P ( D ) {\displaystyle {\mathcal {P}}(D)} für die Potenzmenge von D {\displaystyle D} .

f {\displaystyle f} hat dann ein lokales Maximum in einem Punkt x 0 D {\displaystyle x_{0}\in D} , wenn f ( x ) f ( x 0 ) {\displaystyle f(x)\leq f(x_{0})} für alle Nachbarn x N ( x 0 ) {\displaystyle x\in N(x_{0})} gilt. Lokale Minima sind analog definiert.

Variationsrechnung

Extremwerte von Funktionen, deren Argumente selbst Funktionen sind, z. B. die Kontur eines Regentropfens mit minimalem Luftwiderstand, sind Gegenstand der Variationsrechnung.

Anmerkungen

  1. Dabei können die Extremstellen auch in den Randpunkte des Intervalls liegen. In diesem Fall spricht man auch von einem Randminimum bzw. Randmaximum.
  2. Eine Stelle x 0 U {\displaystyle x_{0}\in U} , an denen die Bedingung f ( x 0 ) = 0 {\displaystyle f'(x_{0})=0} erfüllt ist, heißt kritischer Punkt oder stationärer Punkt. Kritische Punkte sind mögliche Kandidaten für Extremstellen. Mithilfe der hinreichenden Kriterien identifiziert man unter den kritischen Punkten diejenigen, die tatsächlich Extremstellen sind.

Siehe auch

Wiktionary: Extremwert – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
  • Extremwerte (erklärt für Schüler)

Literatur

  • Richard Courant: Vorlesungen über Differential- und Integralrechnung 1. 4. Aufl., Springer, Berlin / Heidelberg 1971, ISBN 3-540-05466-9, S. 141–148, 287–288.
  • Otto Forster, Florian Lindemann: Analysis 1. 13. Auflage. Springer Spektrum, Wiesbaden 2023, ISBN 978-3-658-40129-0, S. 247–254.
  • Silvanus P. Thompson: Analysis leicht gemacht. 12. Auflage. Verlag Harri Deutsch, Thun und Frankfurt am Main 1988, ISBN 3-87144-739-0, S. 82–98
  • Theodor Bröcker: Analysis 1. Spektrum Akademischer Verlag, 1995, ISBN 978-3-86025-417-2, S. 97–100.
  • Vladimir A. Zorich: Analysis I. Springer, Berlin / Heidelberg 2006, ISBN 978-3-540-33277-0.

Einzelnachweise

  1. Herbert Amann, Joachim Escher: Analysis I. 3. Auflage. Birkhäuser Verlag, Basel 2006, ISBN 3-7643-7755-0, S. 333. 
  2. a b Otto Forster, Florian Lindemann: Analysis 1. 13. Auflage. S. 247. 
  3. Vladimir A. Zorich: Analysis I. S. 223. 
  4. Andreas Büchter, Hans-Wolfgang Henn: Elementare Analysis. Spektrum Akademischer Verlag, Heidelberg 2010, ISBN 978-3-8274-2091-6, S. 254. 
  5. Otto Forster, Florian Lindemann: Analysis 1. 13. Auflage. S. 254. 
  6. Theodor Bröcker: Analysis 1. S. 98. 
  7. Theodor Bröcker: Analysis 1. S. 99. 
  8. Konrad Königsberger: Analysis 1. 6. Auflage. Springer, Berlin / Heidelberg 2004, ISBN 978-3-540-40371-5, S. 146. 
  9. Vladimir A. Zorich: Analysis 1. S. 248.