Matematyka:Matematyka II NI/Rachunek różniczkowy
Rachunek różniczkowy
Pochodne cząstkowe, różniczkowalność funkcji, przyrosty
Niech [math] {\cal O}\subset { \mathbb R}^N[/math] będzie zbiorem otwartym, zaś [math]f: {\cal O}\rightarrow { \mathbb R}[/math] — funkcją ciągłą.
Niech [math]x\in {\cal O}[/math]. Wypiszmy jawnie składowe [math]x[/math]:
- [math] x=(x^1, x^2, \dots , x^N), \;\;\; f(x) = f(x^1, x^2, \dots , x^N). [/math]
Wybierzmy teraz [math]k\in \lbrace 1,2,\dots , N \rbrace [/math] i traktujmy zmienne [math]x^l[/math], gdzie [math]l\ne k[/math] jako stałe.
Pochodna cząstkowa
Rozważmy granicę:
Def. Powyższą granicę nazywamy pochodną cząstkową funkcji [math]f[/math] po zmiennej [math]x^k[/math] (liczoną w punkcie [math]x[/math]).
Funkcja jest różniczkowalna
Niech [math] {\cal O}\subset { \mathbb R}^N[/math] będzie zbiorem otwartym, zaś [math]f: {\cal O}\rightarrow { \mathbb R}[/math] — funkcją ciągłą. (Ten ostatni warunek piszemy też: [math]f\in C( {\cal O})[/math]).
Mówimy, że [math]f[/math] jest różniczkowalna [math]r[/math] razy w sposób ciągły, jeżeli istnieją wszystkie pochodne cząstkowe aż do rzędu [math]r[/math] i są one ciągłe.
Uwaga (terminologiczna)
Ten ostatni warunek zapisujemy krócej jako: [math]f\in C^r( {\cal O})[/math], gdzie przez [math]C^r( {\cal O})[/math] oznaczamy zbiór funkcji różniczkowalnych [math]r[/math] razy w sposób ciągły. Stosujemy też oznaczenie [math]C^\infty ( {\cal O})[/math] dla funkcji, które posiadają pochodne ciągłe dowolnie wysokiego rzędu. Funkcje takie nazywamy funkcjami gładkimi (należą do nich np. wielomiany).
Twierdzenie
Niech [math] {\cal O}[/math] — otwarty podzbiór [math] { \mathbb R}^N[/math], oraz [math]f\in C^1( {\cal O})[/math]. Niech [math]x_0\in {\cal O}[/math], i niech [math]h\in { \mathbb R}^N[/math] — dostatecznie małe, tzn. [math]||h||\lt \epsilon [/math] dla pewnego [math]\epsilon [/math] — tak, by [math]x_0+h\in {\cal O}[/math] RYS.
Zdefiniujmy [math]r(x_0,h)[/math] przez:
- [math] f(x_0+h)-f(x_0) =\sum _{k=1}^N \frac{\partial f}{\partial x^k}(x_0) h^k + r(x_0,h). [/math]
Wtedy zachodzi:
Uwaga
Znaczenie tego wzoru: Pozwala on wyznaczać przyrost funkcji: Im mniejsze [math]h[/math], tym lepiej przyrost jest przybliżany przez część liniową.
Dowód
Będzie dla (najważniejszego w zastosowaniach) przypadku [math]N=3[/math]; dla dowolnego [math]N[/math] jest analogiczny.
- [math] f(x_0+h)-f(x_0) = f(x_0^1 + h^1,x_0^2 + h^2,x_0^3 + h^3)-f(x_0^1, x_0^2, x_0^3)= [/math]
- [math] f(x_0^1 + h^1,x_0^2 + h^2,x_0^3 + h^3)-f(x_0^1,x_0^2 + h^2,x_0^3 + h^3)\;\;\;\;\; I [/math]
- [math] +f(x_0^1,x_0^2 + h^2,x_0^3 + h^3)-f(x_0^1,x_0^2,x_0^3 + h^3)\;\;\;\;\;\;\;\;\;\; I I [/math]
- [math] +f(x_0^1,x_0^2,x_0^3 + h^3)-f(x_0^1,x_0^2,x_0^3)\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; I II [/math]
Z twierdzenia Lagrange'a o wartości średniej dla funkcji jednej zmiennej mamy
- [math] III= \frac{\partial }{\partial x^3} f(x_0^1, x_0^2, y^3) h^3, [/math]
gdzie [math]y^3[/math] — punkt pomiędzy [math]x_0^3[/math] a [math]x_0^3 + h^3[/math];
- [math] II= \frac{\partial }{\partial x^2} f(x_0^1, y^2, x_0^3+h^3) h^2,\;\;\;\;\;y^2\in ]x_0^2, x_0^2+h^2[; [/math]
- [math] I= \frac{\partial }{\partial x^1} f(y^1, x_0^2+h^2, x_0^3+h^3) h^1,\;\;\;\;\;y^2\in ]x_0^1, x_0^1+h^1[. [/math]
Tak więc
- [math]\begin{matrix} r(x_0,h) = f(x_0+h)-f(x_0) -\frac{\partial f}{\partial x^1}(x_0) h^1 -\frac{\partial f}{\partial x^2}(x_0) h^2-\frac{\partial f}{\partial x^3}(x_0) h^3 \\ = \left[ \frac{\partial }{\partial x^1}f(y^1,x_0^2 + h^2,x_0^3 + h^3)-\frac{\partial }{\partial x^1}f(x_0^1, x_0^2, x_0^3) \right]h^1 \\ +\left[ \frac{\partial }{\partial x^2}f(x_0^1,y^2,x_0^3 + h^3)-\frac{\partial }{\partial x^2}f(x_0^1,x_0^2 ,x_0^3) \right] h^2 \\ +\left[ \frac{\partial }{\partial x^3}f(x_0^1,x_0^2,y^3)-\frac{\partial }{\partial x^3}f(x_0^1,x_0^2,x_0^3) \right]h^3 \end{matrix}[/math]
Składowe wektora [math]h[/math] szacują się przez:
- [math] \frac{|h^k|}{||h||}\le 1. [/math]
Ponadto, jeżeli [math]h\rightarrow 0[/math], to:
- [math] y^1\rightarrow x^1;\;\;\;\;\; y^2\rightarrow x^2;\;\;\;\;\; y^3\rightarrow x^3. [/math]
Ponieważ pochodne cząstkowe są ciągłe, to różnice w (%i ???) dążą do zera i mamy
- [math] \frac{r(x_0,h)}{||h||} \stackrel{h\rightarrow 0}{\longrightarrow }0. [/math]
CBDO
Pochodna funkcji złożonej
Oznaczenia
Usystematyzujmy oznaczenia, przydając im, jeśli trzeba, dodatkowe jeszcze wyjaśnienia:
- [math]h=\Delta x[/math] — przyrost zmiennej (-ych);
- [math]f(x+h)-f(x)=\Delta f[/math] — przyrost funkcji;
- [math]\displaystyle \mathop {\sum }_{k=1}^N \frac{\partial f}{\partial x^k}(x_0) h^k = {\sf d}f[/math] — różniczka funkcji;
- [math]r[/math] — reszta.
Pamiętajmy, że wszystkie powyższe obiekty: [math]\Delta x, \Delta f, {\sf d}f, r[/math] są funkcjami od [math]x[/math] i [math]h[/math].
Mamy też:
- [math] \Delta f = {\sf d}f+r; [/math]
im mniejsze [math]h[/math], tym mniejsze [math]r[/math] i w wielu zastosowaniach fizycznych na ogół przyjmuje się, że dla małych [math]h[/math], [math]r[/math] jest zaniedbywalny.
Twierdzenie (Prototyp twierdzenia o pochodnej odwzorowania złożonego)
Niech [math]g: {\cal U}\rightarrow {\cal O}[/math], gdzie [math] {\cal U}\subset { \mathbb R}[/math], [math] {\cal O}\subset { \mathbb R}^N[/math], oraz [math]f: {\cal O}\rightarrow { \mathbb R}[/math]. (Pisząc jawnie argumenty, mamy: [math]f(y^1,y^2, \dots , y^N)[/math] oraz [math]g(x)=g^1(x), g^2(x), \dots , g^N(x)[/math]). Niech [math]k=f\circ g[/math], tzn. [math]k(x) = f(g(x))[/math] lub, pisząc bardziej jawnie, ale też bardziej rozwlekle argumenty: [math]k(x) = f(g^1(x), g^2(x), \dots , g^N(x))[/math].
Jeżeli [math]f\in C^1( {\cal O}), g\in C^1( {\cal U})[/math], to [math]k\in C^1( {\cal U})[/math] oraz
Dowód
Liczymy iloraz różnicowy:
- [math] \frac{k(x+h)-k(x)}{h} = \frac{f(g(x+h))-f(g(x))}{h}= \spadesuit [/math]
(tu [math]h\in { \mathbb R}[/math]). Oznaczmy: [math]\Delta y = g(x+h) - g(x)[/math] (tzn. [math]\Delta y^i = g^i(x+h) - g^i(x)[/math]).
- [math] \spadesuit = \frac{f(g(x)+\Delta y))-f(g(x))}{h} = \frac{ \sum _{i=1}^N \frac{\partial f}{\partial y^i}(g(x))\Delta y^i + r( g(x),\Delta y) }{h} [/math]
Pierwszy wyraz w powyższym wyrażeniu (%i 4) to jest to co trzeba, ponieważ
- [math] \frac{\Delta y^i}{h} =\frac{g^i(x+h))-g^i(x)}{h} \stackrel{h\rightarrow 0}{\longrightarrow }\frac{\partial g^i}{\partial x} (x) [/math]
Natomiast drugi wyraz w wyrażeniu (%i 4) okazuje się ,że dąży do 0 gdy [math]h\rightarrow 0[/math]. Bowiem, gdy [math]\Delta y[/math] = 0, to [math]\frac{r( g(x),\Delta y)}{h}=0[/math]. Natomiast gdy [math]\Delta y\ne 0[/math], to mamy:
- [math] \frac{r( g(x),\Delta y)}{h} = \frac{r( g(x),\Delta y)}{||\Delta y||}\cdot \frac{||\Delta y||}{h} [/math]
W pierwszym czynniku mamy: [math]\Delta y \stackrel{h\rightarrow 0}{\longrightarrow }[/math] i co za tym idzie, cały wyraz też dąży do zera (z własności reszty). Drugi czynnik, tzn. iloraz [math]\frac{||\Delta y||}{h}[/math], spełnia:
- [math] \frac{||\Delta y||}{h} = \left|\left|\frac{\Delta y}{h}\right|\right| \stackrel{h\rightarrow 0}{\longrightarrow } [/math][math]\left|\left|\frac{{\sf d}g}{{\sf d}x}\right|\right|[/math]
CBDO Będziemy dalej potrzebować dwu prostych faktów dotyczących normy i odległości.
Stwierdzenie
Norma jest funkcją ciągłą swoich argumentów (tzn. składowych wektora).
Dowód
Przyjrzyjmy się wyrażeniu na normę wektora [math]x[/math]:
- [math] ||x|| = \sqrt{(x^1)^2 + (x^2)^2 +\dots + (x^N)^2} [/math]
i mamy:
- podnoszenie do kwadratu jest funkcją ciągłą,
- sumowanie jest funkcją ciągłą,
- pierwiastek jest funkcją ciągłą.
Stwierdzenie
Odległość jest funkcją ciągłą, tzn. jeżeli [math]x_n\stackrel{n\rightarrow \infty }{\longrightarrow }x[/math], [math]y_n\stackrel{n\rightarrow \infty }{\longrightarrow }y[/math], to
Dowód
Najsampierw pokażemy następującą nierówność czworoboku:
- [math] d(x,u)\le d(x,y)+d(y,z)+d(z,u); [/math]
bowiem, pisząc dwukrotnie nierówność trójkąta, mamy:
- [math] d(x,u)\le d(x,z)+d(z,u)\le d(x,z) + d(z,y)+d(y,u) [/math]
(szkoda tu pisać CBDO) i teraz, korzystając dwukrotnie z nierówności czworoboku:
- [math] d(x_n,y_n)\le d(x_n,x) + d(x,y) + d(y,y_n) \Longrightarrow d(x_n,y_n)- d(x,y)\le d(x_n,x) + d(y,y_n); [/math]
- [math] d(x,y)\le d(x,x_n) + d(x_n,y_n) + d(y_n,y) \Longrightarrow d(x,y)- d(x_n,y_n)\le d(x,x_n) + d(y_n,y); [/math]
czyli mamy
- [math] 0\le |d(x,y)- d(x_n,y_n)|\le d(x,x_n) + d(y_n,y); [/math]
Prawa strona powyższej nierówności z założenia dąży do zera, a z tego wynika (%i 5).
CBDO
Równość drugich pochodnych mieszanych
Twierdzenie (o równości drugich pochodnych mieszanych)
Niech [math] {\cal O}\subset { \mathbb R}^2[/math] — zbiór otwarty. Niech [math]f: {\cal O}\rightarrow { \mathbb R}[/math], [math]f\in C^2( {\cal O})[/math]. Wtedy:
Dowód
Najsampierw oznaczmy [math]x[/math] zamiast [math]x^1[/math] oraz [math]y[/math] zamiast [math]x^2[/math].
Oznaczmy:
- [math] \Delta x = h, \;\;\;\;\;\Delta y=k [/math]
oraz
- [math] w=f(x+h, y+k) - f(x+h, y) -f(x,y+k)+f(x,y) [/math]
Ustalmy teraz [math]x[/math] i [math]h[/math] i zdefiniujmy
- [math] \phi (y) = f(x+h, y) - f(x,y) [/math]
Możemy wyrazić [math]w[/math] przez [math]\phi [/math]:
- [math] w = \phi (y+k) - \phi (y) = \phi ^{\prime }(\xi ) \cdot k [/math]
gdzie [math]\xi \in ]y,y+k[[/math]; jest to wniosek z tw. Lagrange'a o wartości średniej. Mamy dalej
- [math] \phi ^{\prime }(\xi ) \cdot k = \left[ \frac{\partial f}{\partial y}(x+h,\xi ) - \frac{\partial f}{\partial y}(x,\xi ) \right] = \frac{\partial }{\partial x}\frac{\partial f}{\partial y}(\eta ,\xi )\cdot h \cdot k [/math]
gdzie [math]\eta \in ]x,x+h[[/math]; w ostatnim kroku znów skorzystaliśmy z tw. Lagrange'a o wartości średniej.
Zdefiniujmy teraz
- [math] \psi (x) = f(x, y+k)- f(x,y) [/math]
i podobnie jak wyżej, możemy wyrazić [math]w[/math] przez [math]\psi [/math]. Mamy:
- [math] w=\psi (x+h)-\psi (x) = \psi ^{\prime }(\tilde{\eta })\cdot h = \spadesuit [/math]
(tu [math]\tilde{\eta }\in ]x,x+h[[/math]; znów skorzystaliśmy z tw. Lagrange'a) i dalej
- [math] \spadesuit = \left[ \frac{\partial f}{\partial x}(\tilde{\eta },y+k) - \frac{\partial f}{\partial x}(\tilde{\eta },y) \right] = \frac{\partial }{\partial y}\frac{\partial f}{\partial x}(\tilde{\eta },\tilde{\xi })\cdot h \cdot k [/math]
gdzie [math]\tilde{\xi }\in ]y,y+k[[/math].
W powyższych wyrażeniach liczyliśmy tę samą wielkość [math]w[/math] na dwa różne sposoby. Mamy więc:
- [math] w= \frac{\partial }{\partial x}\frac{\partial f}{\partial y}(\eta ,\xi )\cdot h \cdot k =\frac{\partial }{\partial y}\frac{\partial f}{\partial x}(\tilde{\eta },\tilde{\xi })\cdot h \cdot k [/math]
Jeśli teraz [math]h\rightarrow 0[/math], to wtedy [math]\xi \rightarrow y[/math], [math]\eta \rightarrow x[/math], oraz [math]\tilde{\xi }\rightarrow y[/math], [math]\tilde{\eta }\rightarrow x[/math], zatem otrzymujemy równość pochodnych cząstkowych mieszanych w punkcie [math](x,y)[/math].
CBDO
Przykł.
Nie można opuścić założeń o ciągłości; Nierówność pochodnych mieszanych gdy f nie jest kl. [math]C^2[/math] .
Wyższe pochodne
Notacja pochodnych cząstkowych
Mówiąc o pochodnej cząstkowej trzeba podać nie tylko jej rząd (ilość różniczkowań), ale też powiedzieć, po jakich zmiennych się różniczkuje. Og/olnie pochodna [math]r[/math]-tego rzędu funkcji [math]N[/math] zmiennych ma postać:
- [math] \frac{\partial ^2 f}{\partial x^2}, \;\;\; \frac{\partial ^2 f}{\partial x \partial y}, \;\;\;\frac{\partial ^2 f}{\partial y^2}, [/math]
- [math] \frac{\partial ^r f}{(\partial x^1)^{r_1} (\partial x^2)^{r_2}\dots (\partial x^N)^{r_N}}, \;\;\;\mbox{ gdzie} \;\;\;r=r_1+r_2+\dots +r_N; [/math]
i tak wszystkie drugie pochodne funkcji dwóch zmiennych są
- [math] \frac{\partial ^2 f}{\partial x^2}, \;\;\; \frac{\partial ^2 f}{\partial x \partial y}, \;\;\;\frac{\partial ^2 f}{\partial y^2}, [/math]
pochodne trzeciego rzędu:
- [math] \frac{\partial ^3 f}{\partial x^3}, \;\;\; \frac{\partial ^3 f}{\partial x^2 \partial y}, \;\;\;\frac{\partial ^3 f}{\partial x \partial y^2}, \;\;\;\frac{\partial ^3 f}{\partial y^3}, [/math]
itd.
Różniczkowalność odwzorowań
Powyższe uwagi dotyczyły funkcji [math]N[/math] zmiennych. Gdy mamy odwzorowania, różniczkowalność tychże definiujemy analogicznie:
Niech [math]T[/math] odwzorowuje [math] {\cal O}\subset { \mathbb R}^N[/math] na [math] {\cal U}\subset { \mathbb R}^M[/math], [math] {\cal O}[/math] i [math] {\cal U}[/math] są otwarte. RYS.; niech [math]x\in {\cal O}[/math], [math]y\in {\cal U}[/math].
Niech [math]y=T(x)[/math]. Wypiszmy tę równość jawnie w składowych:
- [math] y^k=T^k(x^1, x^2, \dots , x^N), \;\;\; k=1,2,\dots , M. [/math]
Odwzrorowanie klasy [math]C^r[/math]
Mówimy, że [math]T[/math] jest klasy [math]C^r[/math], jeżeli wszystkie funkcje [math]T^k\in C^r( {\cal O})[/math].
Można wypisywać wszystkie pochodne cząstkowe rzędu [math]r[/math] dla odwzorowania — wzory są podobne jak na pochodną funkcji, tylko nieco bardziej skomplikowane. Będziemy je wypisywać, gdy będzie to potrzebne, a na razie wypiszmy jawnie pierwszą pochodną odwzorowania:
tzn. na skrzyżowaniu [math]i[/math]-tego wiersza i [math]j[/math]-tej kolumny mamy pochodną [math]\displaystyle \frac{\partial T^i}{\partial x^j}[/math]. Pamiętajmy, że każda z pochodnych [math]\displaystyle \frac{\partial T^i}{\partial x^j}[/math] jest funkcja [math]N[/math] zmiennych [math]x^1, \dots , x^N[/math].
Oznaczenia & terminologia
Macierz Jacobiego
Pochodną odwzorowania (%i 7) oznacza się też czasem [math]DT[/math]. Taka tablica liczb, jak pamiętamy z części algebraicznej wykładu, nazywa się macierzą; w tym konkretnym przypadku mamy macierz pochodnej odwzorowania albo macierz Jacobiego.
Przykł.
Macierz Jacobiego zamiany współrżednych kartezjańskich na biegunowe.
Pochodna odwzorowania złożonego
Złożenie odwzorowań (superopozycja)
Niech: [math]X\subset { \mathbb R}^N[/math], [math]Y\subset { \mathbb R}^M[/math], [math]Z\subset { \mathbb R}^k[/math] oraz [math]S: X\rightarrow Y[/math], [math]T: Y\rightarrow Z[/math]. Pamiętamy, że superpozycją (złożeniem odwzorowań [math]S[/math] i [math]T[/math] nazywamy odwzorowanie [math]T\circ S: X\rightarrow Z[/math], określone jako: [math](T\circ S) (x) = T(S(x))[/math].
RYS.
Pamiętamy też twierdzenie, że jeśli [math]S[/math] i [math]T[/math] są odwzorowaniami ciągłymi, to [math]T\circ S[/math] też jest odwzorowaniem ciągłym.
Wyprowadziliśmy niedawno wzór (%i 3) na pochodną odwzorowania złożonego w przypadku, gdy [math]X[/math] było podzbiorem [math] { \mathbb R}[/math], [math]Y[/math] podzbiorem [math] { \mathbb R}^n[/math], oraz [math]Z\subset { \mathbb R}[/math]:
RYS.
Zastosujmy teraz ten wzór w przypadku, gdy mamy pochodną [math]\displaystyle \frac{\partial (T\circ S)^k}{\partial x^l}(x)[/math].
RYS.
Mamy:
- [math] \frac{\partial (T\circ S)^k}{\partial x^l}(x) = \frac{\partial T^k( S^1(x^1, x^2,\dots ,x^N), S^2(x^1, x^2,\dots ,x^N),\dots , S^M(x^1, x^2,\dots ,x^N) )}{\partial x^l}(x) [/math]
- [math] = \frac{\partial T^k}{\partial y^1}(S(x))\cdot \frac{\partial S^1}{\partial x^l}(x) + \frac{\partial T^k}{\partial y^2}(S(x))\cdot \frac{\partial S^2}{\partial x^l}(x) +\dots +\frac{\partial T^k}{\partial y^M}(S(x))\cdot \frac{\partial S^M}{\partial x^l}(x) [/math]
To była konkretna składowa [math]\displaystyle \frac{\partial (T\circ S)^k}{\partial x^l}(x)[/math]. Dla całej macierzy Jacobiego można wypisać wzór, przypominający jako żywo pochodną funkcji złożonej — ale aby go prawidłowo rozczytać, trzeba pamiętać, co oznaczają poszczeg/olne symbole:
- [math] (T\circ S)^{\prime }(x) = T^{\prime }(S(x))\cdot S^{\prime }(x) [/math]
gdzie kropka oznacza mnożenie macierzy pochodnych.
Jeśli zarówno [math]S[/math] jak i [math]T[/math] są odwzorowaniami różniczkowalnymi klasy [math]C^1[/math], to i ich złożenie też jest odwzorowaniem różniczkowalnym klasy [math]C^1[/math]. Wynika to od razu z faktu, że sumy i iloczyny odwzorowań różniczkowalnych typu (%i 3) też są różniczkowalne, a we wzorze (%i 8) są tylko sumy i iloczyny takich wyrażeń.
Analogicznie się argumentuje pokazując, że jeśli [math]S[/math] oraz [math]T[/math] są odwzorowaniami różniczkowalnymi klasy [math]C^r[/math], to i ich złożenie też jest odwzorowaniem różniczkowalnym klasy [math]C^r[/math].
Powyższe można podsumować w twierdzeniu:
Twierdzenie
Jeśli [math]S[/math] i [math]T[/math] są odwzorowaniami klasy [math]C^r[/math], to również ich złożenie [math]T\circ S[/math] jest klasy [math]C^r[/math]. Pierwsza pochodna odwzorowania złożonego dana jest wzorem
bądź bardziej dobitnie,
Przykł.
[math]S: { \mathbb R}^2\ni (r,\phi )\rightarrow (x=r\cos \phi ,y=r\sin \phi )\in { \mathbb R}^2[/math], [math]T: { \mathbb R}^2\ni (x,y)\rightarrow (u=exp(x+y), v=\exp (x-y)\in { \mathbb R}^2[/math]. Policzymy pochodną wprost oraz jako iloczyn macierzy pochodnych [math]S[/math] i [math]T[/math].