Textversion des Videos

Transkript Die Kettenregel – Theorie

In diesem Beitrag beschäftigen wir uns mit der Kettenregel im Mehrdimensionalen, wir sind ja in Analysis 2. Ich habe aber angefangen mit der Kettenregel im Eindimensionalen. Die Kettenregel, die jeder von euch aus der Schule oder von Analysis 1 her kennt. Und wir wollen aus dieser eindimensionalen Kettenregel die mehrdimensionale Kettenregel gewinnen. Also noch einmal. Ich habe hier die Funktionen f und g, beide bilden von R nach R ab, wenn sie differenzierbar sind und dann mit den Definitionsbereichen alles stimmt, dann muss auch die Komposition f und g differenzierbar sein und dank der ableitenden Komposition kennen wir diese Formel. Diese Formel heißt: Kettenregel. Nun wollen wir das verallgemeinern und die gute Nachricht ist die, dass wir nichts grundsätzlich Neues lernen sollen, weil die Formel bleibt im Wesentlichen erhalten, auch wenn wir vektorwärtige Funktionen haben. Und das funktioniert so. Ja jetzt machen wir überall Pfeile. Funktion f bildet nicht mehr von R nach R ab, sondern das ist eine vektorwärtige Funktion und bildet von Rn nach Rm ab. Die Funktion g ist auch vektorwärtig. Sie bildet von Rk nach Rn ab. Es ist wichtig, das die Dimension des Bildes der Funktion g mit der Dimension des Definitionsbereiches der Funktion f übereinstimmt und das wir g in die Funktion f heineinbacken können, sodass die Komposition hier wohl definiert ist. Deswegen ist es sehr wichtig, dass an den beiden Stellen, die ich hier andeute, Rm steht, aber das sind ja Einzelheiten. Dann, wenn die vektorwärtige Funktion von R von g/pfeil differenzierbar sind, dann ist auch die Komposition differenzierbar. Und jetzt die gute Nachricht. Die Formel bleibt erhalten ohne jegliche Korrekturen. Ich male noch Pfeilchen hier drauf, aber ansonsten bleibt alles dasselbe. Das große Fazit: Wir müssen nichts Neues auswendig lernen. Das ist dieselbe Formel, bloß die Ableitenden hier mit der neuen Formel bekommen eine andere Bedeutung. Das sind nicht nur Ableitungen, das sind Ableitungsmatrizen oder Jacobimatrizen. Oder je nach Dimension die Gradienten. Das ist die Kettenregel im Mehrdimensionalen. Wie wir sehen: Nichts wirklich Neues. Und Jacobimatrizen gibt es verschiedene Notationen. Ich schreibe diese Formel noch einmal in einer anderen Notation hin, mit D. D Jacobimatrix von f Kringel g an der Stelle xPfeil = die Jacobimatrix der Abbildung f an der Stelle gPfeil von xPfeil mal die Jacobimatrix von der Abbildung g. Oder in der anderen Notation. Das ist die Kettenregel im Mehrdimensionalen. Bloß weil wir hier keine Zahlen mehr haben, sondern Matrizen die miteinander multipliziert werden, die bestehen eventuell aus mehreren Zeilen und mehreren Spalten. Man kann da ein bisschen durcheinander kommen. Und deshalb will ich diese Formel mit Matrizen noch ein wenig erläutern. An einem konkreten Beispiel. Wir wollen sehen, wie diese Formel mit Matrizen funktioniert. Spezialfall. Wir betrachten folgende Situation. Ich male jetzt eine Abbildungskomposition hin, und diese Abbildungskomposition wollen wir mit der Kettenregel differenzieren und sehen, wie diese Formel mit den Matrizen funktioniert. Betrachte: Funktion F von R3 nach R, und die ist abhängig von den Koordinaten x,y,z. Der Punkt x,y,z wird abgebildet auf F(x,y,z). Ich betrachte dann die Funktionen f,g,h. Die gehen von R2 nach R und sind abhängig von der den Variablen u,v. Ich schrieb hier schlampig, ich meine f,g,h hängen von den Koordinaten u,v ab und für die Formel, die diese Abhängigkeit beschreibt interessieren wir uns momentan nicht, wir konzentrieren uns auf die Kettenregel. Um die vorläufigen Rechnungen geht es momentan nicht in erster Linie, wir wollen die Kettenregel anwenden. Daher gewinnen wir aus diesen Bausteinen eine neue Funktion. Setze Phi(u,v), und die Funktion Phi wollen wir so machen: Die die Funktion F setzten wir an der Stelle x,y,z f,g,h ein, und auf diese Weise entsteht eine neue Funktion und diese neue Funktion nennen wir Phi. F(f (u,v), g (u,v), h(u,v)). Phi ist eine verkettete Funktion. Nun wollen wir die partiellen Ableitungen von Phi berechnen. Wir wollen sie durch die partiellen Ableitungen von F , f, g und h ausdrücken und dabei die Kettenregel ausdrücken. Ziel: Drücke die partiellen Ableitungen von Phi durch die partiellen Ableitungen von den gegebenen Funktionen aus. Drücke d Phi/ d u, d Phi/ d v durch Ableitungen von F, f, g, h aus. Das ist eine direkte Anwendung der Kettenregel, bloß man muss da ein bisschen vorsichtig sein. Das sind zwei Matrizen, man muss ja wissen, wie man sie bildet. Dann wische ich jetzt alles weg von der Tafel und wir rechnen weiter. Ich erkläre dann eine Hilfsfunktion, also betrachte eine neue Hilfsfunktion, die Funktion G. Sie geht von R2 nach R3, man kann hier auch Pfeilchen schreiben, aber ich verzichte momentan darauf. Also aus der Art, wie ich die Funktion definiere, geht hervor, dass es eine vektorwärtige Funktion ist. Ich nehme die Funktionen f,g,h und packe sie in einen Vektor zusammen und nenne diesen Vektor insgesamt G. Und das alles hängt von den Variablen u.v ab. Wieso habe ich das gemacht? Das werden wir gleich sehen. Dann ist: Phi (u,v). Ich habe ja gerade weggewischt. Ich schreibe sie also noch einmal auf, sie war so definiert. Die kann man aber kompakter schreiben mit der neuen Funktion G. Phi ist Komposition (F Kringel G). Um die Funktion Phi klar zu differenzieren, da sehen wir klar, an welcher Stelle wir die Kettenregel benutzen sollen. Also, dann ist die Ableitungsmatrix von Phi an der Stelle u,v = der Ableitungsmatrix von F an der Stelle G(u,v) mal Ableitungsmatrix von G (u,v). So einfach schreibt sich die Kettenregel. Das ist halt die neue Kettenregel, die eigentlich die alte ist. Nun denke daran, das sind ja Ableitungsmatrizen, nicht nur Ableitungen, sondern Ableitungsmatrizen. Phi ist eine Funktion, die von zwei Veränderlichen abhängig ist und reelwärtig ist. Die Ableitungsmatrix davon ist einfach nur gradiert. Also die Ableitungsmatrix links besteht aus den Einträgen (d Phi/ d u und d Phi/ d v). Das werden wir gleich sehen. Gradient ist eine Spalte und besteht nur aus partiellen Ableitungen, das haben wir links geschrieben. Dasselbe machen wir rechts. Die Funktion F ist reelwärtig, ihre Ableitungsmatrix ist eigentlich Gradient von F. Und der Gradient besteht aus partiellen Ableitungen. Die Variablen der Funktion F sind x,y,z. Also wir schreiben dann die partiellen Ableitungen der Funktion F nach x,y,z auf. Das war die Ableitungsmatrix von F und wir denken daran, dass die Ableitungsmatrix von F an der Stelle G (u,v) ausgewertet ist. Ich werde das jetzt nicht hinschreiben, sonst wird das alles zu unübersichtlich. Aber wir denken daran, dass diese Ableitungsmatrix an der Stelle G (u,v) ausgewertet wird. Und als Letztes bleibt die Ableitungsmatrix, oder Jacobimatrix, der Funktion G. Ja, und wie die Ableitungsmatrix aussieht, das kennt man ja. Man nimmt die Gradienten der Komponentenfunktionen und ordnet sie zeilenweise an. Also wir nehmen die erste Komponentenfunktion von G, das ist g, und schrieben den Gradienten davon auf. Also: d f/ d u und d f/ d v in der ersten Zeile. Und dasselbe passiert in der zweiten und in der dritten Zeile. In der zweiten Zeile nehmen wir die Komponentenfunktion. Sie heißt g. In der dritten Zeile haben wir die dritte Komponentenfunktion, sie heißt h. An dieser Stelle sehen wir, die neue Kettenregel sieht schon etwas umständlicher aus. Nun müssen wir diese zwei Matrizen ausmultiplizieren. Ich erinnere euch, dass unser Ziel war, d Phi/ d u und d Phi/ d v durch die ableitende Gegebenenfunktion auszudrücken. Und wir sind jetzt am Ziel angelangt. Nun müssen wir einfach nur die rechts stehenden Matrizen nacheinander ausmultiplizieren nach den üblichen Rechenregeln. Daraus ergibt sich, dass d Phi/ du =, nun multipliziere ich diese Zeilenmatrix mit der Ableitungsmatrix von G. Die Ableitungsmatrix von F multipliziere ich mit der ersten Spalte von der Ableitungsmatrix von G und bekomme dann die partielle Ableitung der Variablen Phi nach u. Also d F/d x. So, das hier wird mit dem multipliziert, das hier wird mit dem multipliziert, und so weiter. Und das hier wird mit dem multipliziert. Die bekannten Rechenregeln. Also d F/d x mal d f/ d u + d F/ d y mal d g/d u + d F/ d z mal d h/d u. Und dementsprechend die partielle Ableitung nach u. ich mache das jetzt. Ich multipliziere die Ableitungsmatrix von F mit der zweiten Spalte der Ableitungsmatrix von G, und da bekomme ich Folgendes. d F/ d x mal d f/d v + d F/d y mal d g/ d v+ d F/ d z mal d h/ d v. So da habe ich diese zwei Formeln, das ist auch Kettenregel, sieht aber sehr viel komplizierter als die Kettenregel mit Strichen aus, ist aber im Wesentlichen dasselbe. Ich möchte eine Eselsbrücke geben, beschreiben, wie man dann diese komplizierte Kettenregel, kompliziert aussehende Kettenregel, sich einfach merken kann. Wir vergleichen die letzten beiden Zeilen. Wie unterscheiden sie sich? Ich habe mich verschrieben, Entschuldigung. Unten steht die partielle Ableitung nach v. Nun ist ja alles richtig. Ja, was ist denn der Unterschied? Unten steht überall nach d u, nach d u, nach d u, ja und, oben steht nach d u. Das ist der einzige Unterschied zwischen den zwei unteren Formeln und das ist auch der Ansatz, wie man sich diese Formalen merken kann. Das ist der einzige Unterschied zwischen den zwei unteren Formeln und das ist auch der Ansatz, wie man sich diese Formalen merken kann. Also sehr euch das alles an, und nun versuche ich von Neuem das alles neu anzugeben, ohne auf die Matrizenmultiplikation zurückzugreifen. Ich will euch beschreiben, wie man sich das merken kann. Nun gut, also wir haben die Funktion phi. Ich wische alles weg, bis auf die Definition der Funktion phi. G will ich auch nicht mehr haben, sie hat ausgedient. Also ich habe die Funktion phi. Und wenn ich die Funktion phi nach u differenzieren möchte, d phi/d u, da mache ich ja Folgendes: Nehme die äußere Funktion und differenziere sie nach der ersten Variablen, mal. Dann nehme ich das, was an der Stelle der ersten Variablen in der äußeren Funktion steht, und dieses etwas differenziere ich nach der Variablen u +. Und nun geht das Spiel von vorne los. Ich nehme die äußere Funktion, differenziere sie nach der zweiten Variablen, dann schaue ich, was steht denn an der Stelle der zweiten Variablen, und das, was dort steht, differenziere ich nach u. Und nun wieder dasselbe, aber mit der dritten Variablen. Ich nehme die äußere Funktion, differiere sie nach der dritten Variablen, und nehme das, was an der Stelle der dritten Variablen da in der Funktion steht, das ist h, und differenziere das nach u. Analog die Ableitung nach v. Die äußere Funktion nach x. Dann das, was an der Stelle von x steht nach v. Die äußere Funktion nach y, dann das, was dort an der Stelle von y steht nach v ableiten. Die äußere Funktion nach z, dann das, was dort an dieser Stelle steht, nach v ableiten. So kann man sich das alles sehr gut merken. Ich betone noch einmal. Die Ableitungen der äußeren Funktionen sind ausgewertet an der Stelle f,g,h von u,v. Also hier müsste man eigentlich das hier schreiben, aber dann kann man die Formel überhaupt nicht lesen. Deshalb lässt man das weg, aber man sollte, wenn man konkret rechnet, daran denken, wo die Ableitungen der äußeren Funktion ausgewertet werden. Und Beispiele zu dieser Rechnerei stehen bereit zum Download.

Informationen zum Video