Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Gradient und Jakobimatrix

In diesem Beitrag wollen wir uns mit den Begriffen Gradient und Jacobi-Matrix auseinandersetzen. Erst einmal schreibe ich die Definitionen an, die stehen schon an der Tafel. Die will ich erläutern. Und nachher nenne ich zwei wichtige Eigenschaften des Gradienten und illustriere sie an einem Beispiel. Das ist das Programm. Gut, Gradient. Was man sich vor allem merken soll, dass man den Gradienten für reellwertige Funktionen berechnet. Wir haben f wie immer eine reellwertige Funktion. Wir setzen voraus, dass sie in einem bestimmten Punkt des Definitionsbereichs partiell differenzierbar ist. Das heißt, es existieren partielle Ableitungen, und wenn man diese partiellen Ableitungen nach x1, nach x2 uns so weiter und nach xn berechnet und alle sie in einen Zeilenvektor packt, dann nennt man diesen Zeilenvektor Gradient der Funktion f im Punkt x0. Also, es passiert nichts Neues. Also, partielle Ableitungen haben wir schon besprochen, in entsprechenden Beiträgen. Nun berechnen wir diese n Zahlen und packen sie, wohlgemerkt, in einen Zeilenvektor, ja, und dieser Vektor wird Gradient genannt. Ja, und das passiert nicht umsonst, diesen Vektor braucht man, diesen Vektor interpretiert man. Und das werden wir später sehen. Gut, und weil der Vektor sehr populär ist, sehr beliebt, da hat man jede Menge Bezeichnungen für ihn. Ich habe da hier Bezeichnungen geschrieben, die ich benutze, die ich gerne benutze. Ich benutze grad f und dann in Klammern den Punkt, an dem die partiellen Ableitungen ausgewertet werden. Es gibt viele andere Notationen, ich habe hier viele Beispiele genommen. Also man kann diesen Punkt, wo der Gradient ausgewertet wird, man kann diesen Punkt überhaupt unterdrücken. Man kann einfach nur grad f schreiben, wenn es klar ist, an welcher Stelle er ausgewertet wird. Man kann Punkt unter Grad schreiben. Man kann sagen grad x0 f, das darf man auch machen. Dann kann man das auf der Spitze stehendes Dreieck benutzen, dieses Dreieck nennt man Nabla, das ist auch Gradient. Mit dem Punkt kann man beliebig verfahren. Den Punkt kann man entweder in Klammern hinschreiben oder gar nicht schreiben, unterdrücken oder halt unterhalb des Dreiecks schreiben. Das alles geht und seid nicht verwirrt, wenn ihr in den Büchern oder wo auch immer andere Notationen seht. Man kann ja ganz nebulös sein, man kann einfach nur f' schreiben, weil eigentlich f', das ist eine Ableitung ??? und man bezeichnet diesen Vektor mit f' und meint Gradient damit. Das ist die übliche Notation und man muss sich dran gewöhnen. Das war der Gradient. Nun wollen wir Jacobi-Matrix besprechen. Wenn man nicht reellwertige Funktionen hat, sondern eine vektorwertige Funktion hat. Ich habe hier oben reellwertige Funktion f klein und unten vektorwertige Funktion F groß, das heißt, jedem Punkt wird ein Vektor zugeordnet. Ich habe Vektor F groß mit Komponenten F1, F2 und so weiter bis Fk. Also für eine vektorwertige Funktion kann man keinen Gradienten ausrechnen. Gradienten gibt es nur für reellwertige Funktionen. Das soll man sich merken. Gradienten gibt es nur für reellwertige Funktionen. Für vektorwertige Funktionen heißen die entsprechenden Objekte Jacobi-Matrizen. Na also. Wir haben hier eine vektorwertige Funktion F groß mit Komponenten F1 bis Fk. Ja, wir setzen voraus, dass sie an einem bestimmten x0 partiell differenzierbar ist. Und dann berechnen wir alle partiellen Ableitungen von allen Komponentenfunktionen und organisieren sie in eine Matrix. Also wir schreiben die erste partielle Ableitung der ersten Komponentenfunktion, dann die zweite partielle Ableitung der ersten Komponentenfunktion und so weiter. Alles, was zu der ersten Komponentenfunktion gehört, wird in der ersten Zeile geschrieben. Dann dasselbe mit der zweiten Komponentenfunktion und so weiter und dasselbe mit der letzten Komponentenfunktionen machen. Also alle partiellen Ableitungen organisisert man in dieser Matrix, und die Matrix nennt man Jacobi-Matrix. Sie hat auch einen eigenen Namen erhalten, Jacobi-Matrix, sie ist sehr prominent. Wir werden der Jacobi-Matrix noch an zwei Stellen begegnen, beim Thema vollständige Differenzierbarkeit oder totale Differenzierbarkeit und bei dem Thema Kettenregel. Die Beiträge gibt es auch auf der Seite. Nun bringen die Leute ja häufig durcheinander, wie denn die partiellen Ableitungen hier in der Matrix organisiert werden sollen. Was passiert spaltenweise, was passiert zeilenweise. Und dazu gibt es eine angenehme Merkregel. Merkt euch einmal für allemal, für den Rest eures Lebens. Man berechnet von Komponentenfunktionen die Gradienten und ordnet sie zeilenweise in die Jacobi-Matrix an. Also, man nimmt den Gradienten der ersten Komponentenfunktion, grad F1, und schreibt den in der ersten Zeile auf. Dann nimmt man den Gradienten der zweiten Komponentenfunktion und schreibt den Gradienten in der zweiten Zeile auf, und so weiter bis zur letzten Komponentenfunktion. Und bitte merkt euch: Die Jacobi-Matrix besteht aus den Gradienten der Komponentenfunktionen zeilenweise. Ja, und Jacobi-Matrix ist sehr beliebt, deswegen gibt es eine unüberschaubare Anzahl von Bezeichnungen für die Jacobi-Matrix und die will ich hier kurz angeben. Jetzt Gradient weg. Mit dem Gradienten werden wir uns noch beschäftigen. Jetzt die alternativen Bezeichnungen für die Jacobi-Matrix. Bezeichnungen: Ich habe hier geschrieben geschwungenes DF von x0^->. Man kann x0 weglassen, den Punkt unterdrücken, das gebe ich nicht extra an. Man kann statt geschwungenem D einfach nur ganz normales Blockschrift D angeben. Man kann es ein bisschen fantasievoller machen, man kann, weil es Jacobi-Matrix ist, dann kann man J schreiben. J und unten F und rechts in Klammern x0, den Punkt. Man kann den Punkt unterdrücken, man kann meinetwegen x0 und F vertauschen miteinander, das werde ich nicht mehr ausschreiben. Man kann es ganz umständlich machen. Man kann alle Komponentenfunktionen nehmen,  F1 bis Fk, sie direkt angeben. Also man schreibt geschwungenes D F1, .. und so weiter bis Fk, Strich, Bruchstrich, D und dann die Variablen aufzählen, x1 uns so weiter bis xn. Das ist ein bisschen in die Jahre gekommen von den Bezeichnungen her. Das sieht man in den alten Büchern und manchmal ist auch sie vorteilhaft. Man kann ja ganz knapp sein und einfach nur F' schreiben. Mit F' kann man an dieser Stelle die Jacobi-Matrix meinen. Manchmal ist mit F' einfach nur Ableitung gemeint, manchmal ist Gradient gemeint, manchmal Jacobi-Matrix. Man muss ja auch den Zusammenhang sehen. Ich habe auch den Pfeil unterdrückt. Also den Pfeil kann man auch angeben, kann man auch nicht angeben. Das waren erst einmal die Definitionen und Notation. Nun wollen wir uns, vergessen wir die Jacobi-Matrix. Wie gesagt, Jacobi-Matrix wird eine Rolle spielen bei totalen Differenzierbarkeit, wird eine Rolle spielen bei Kettenregel. Aber den Rest dieses Beitrags wollen wir mit dem Gradienten verbringen, bemerkenswerte Eigenschaften, die wir erläutern wollen und an einem Beispiel veranschaulichen. Ja, da gibt es grafische Interpretationen, man kann schöne Bilder machen, und das macht Spaß hoffentlich. Wissenswertes über den Gradienten. Wissenswertes. Zweierlei müsst ihr euch merken. Erstens, Gradient zeigt immer in die Richtung des stärksten Anstiegs der Funktion. Das will ich fixieren schriftlich und erläutern. 1. Gradient grad f zeigt immer in die Richtung des stärksten Anstiegs der Funktion, des stärksten Anstiegs der Funktion f im entsprechenden Punkt x0. Ich habe den Punkt hier unterdrückt. Zweite Eigenschaft, die man sich merken soll: Gradient steht immer senkrecht auf der Niveaulinie der Funktion oder auf der Niveaufläche, je nachdem, von wie vielen Veränderlichen die Funktion abhängig ist. Gradient steht immer senkrecht auf den Niveaulinien von f. Gemeint ist, Gradient der Funktion f steht immer senkrecht auf den Niveaulinien von f. Das ist ja schön gesagt. Jetzt wollen wir das uns klarmachen an einem Beispiel, und Beispiel nehme ich ein denkbar einfaches, damit wir schneller rechnen und besser zeichnen können. Beispiel: Ich betrachte eine Funktion von IR2 -> IR, und die Abbildungsvorschrift ist sehr einfach. x2+y2. Diese Funktion können wir sehr schnell veranschaulichen.Gut, wir sollen eine Fläche zeichnen mit der Formel z=x2+y2. Wie geht denn das? Wir betrachten erst einmal die Achsen x und z. Erst einmal bleiben wir zweidimensional und die y-Achse, sie geht in die Tafel hinein, die y-Achse, und auf der x, z-Ebene ist y-Koordinate gleich 0. Auf der x, z-Ebene, man hat die Formel z= x2, y=0 in dieser Ebene. z= x2 ist natürlich eine Parabel. Und dasselbe passiert, wenn wir statt der Ebene x, z die Ebene y, z betrachten, das ist wieder eine Parabel. Und den Graphen dieser Funktion erhält man, indem man die Parabel um die z-Achse rotiert. Und die Veranschaulichung ist sehr einfach. Also der Graph sieht so aus. Das sind die Achsen, das ist ja die Spur der rotierenden Parabel, so eine Schale. Und vielleicht markiere ich ungefähr so, wie die Achsen gehen. 0, x, y, ja, das ist so eine Schale. Hier vielleicht noch ein paar Linien. So, und nun wollen wir den Gradienten dieser Funktion berechnen. Der Gradient der Funktion f(x,y) besteht aus den partiellen Ableitungen davon. df/dx (x,y) und ich bin da nicht so ganz konsequent, per Definition habe ich den Gradienten als Zeilenvektor hingeschrieben, diese Schreibweise behalte ich bei. (df/dx (x,y), df/dy (x, y)). Ja und das ist ein leichtes Spiel, die partiellen Ableitungen zu berechnen. partielle Ableitung nach x ist 2x, partielle Ableitung nach y ist 2y. Zum Beispiel grad f(1, 0) = (2, 0). Zum Beispiel grad f(1, 1) =(2, 2). Und jetzt wollen wir versuchen, das zu veranschaulichen. Das ist überhaupt nicht schwer. Zuerst haben wir den Punkt (1, 0) betrachtet. Der Punkt (1, 0) liegt auf der x-Achse, und der Gradient zeigt in diese Richtung, der Gradient hat Koordinaten (2, 0), hier ist dieser Vektor. Dann den Punkt (1, 1). Er ist ungefähr hier. (1, 1), und der Gradient hat die Koordinaten (2, 2), so, hier ist dieser Vektor. Was bemerken wir? Die Gradienten in diesem Fall, speziell für diese Funktion, nicht allgemein, speziell für diese Funktion, liegen immer au dem radialen Strahl, der im Ursprung und den entsprechenden Punkt verbindet. Die Gradienten liegen immer radial. Wir sehen, dass die Funktion, die wir hier haben, die ist so beschaffen, dass sie immer in die radiale Richtung ansteigt. Wenn wir in radialer Richtung uns vom Ursprung entfernen, dann die entsprechen Kurve auf der Fläche des Graphen sieht so aus. Das heißt, die Funktion steigt immer in die radiale Richtung am stärksten an. Und das ist die Veranschaulichung der ersten Eigenschaft. Gradient zeigt immer in die Richtung des stärksten Anstiegs von f. Hier bei der Funktion f, Gradient zeigt immer in die radiale Richtung und in radialer Richtung wächst Funktion am stärksten an. Nun, was die Niveaulinien betrifft. Wir nehmen dann einfach die Niveaulinie zum Wert 1. Niveaulinie zum Wert 1, also es ist durch diese Gleichung x2+y2=1 gegeben, und natürlich ist das ein Kreis mit dem Mittelpunkt im Ursprung und dem Radius 1. Und nun, wenn wir zum Beispiel eine beliebigen Punkt nehmen und in diesem Punkt Gradienten berechnen, dann wird der Gradient in radiale Richtung zeigen. Und die Vektoren, die in die radiale Richtung zeigen, stehen genau senkrecht auf dem Kreis. Und hier ist die zweite Eigenschaft bestätigt. Gradient einer Funktion steht immer senkrecht zur Niveaulinie. Und das sehen wir hier an diesem Beispiel hervorragend anschaulich. Gradienten stehen senkrecht auf Niveaulinie. Das war's.  

Informationen zum Video