解析概論/第2章

提供:Wikisource
移動: 案内, 検索

目次

[編集] 第 2 章 微分法

[編集] 13.微分 導函数

或る区間において,変数 x の函数 y=f(x) が与えられているとする.独立変数の二つの値 xx_1 に対応する函数の値を yy_1 として,

x_1-x=\Delta x, \; y_1-y=\Delta y

と略記する.然らば

\frac{\Delta y}{\Delta x} = \frac{y_1-y}{x_1-x}

xx_1 との間の区間における函数 y の平均の変動率である. 今 x を固定して,|\Delta x| を限りなく小さくするとき

\lim_{\Delta x\to 0} \frac{\Delta y}{\Delta x}

なる極限値が存在するならば,それは函数 y=f(x)x における変動率ともいうべきものであろう.この極限値を記号

\frac{dy}{dx}

で表わす. \Delta x\Delta y などは伝統的の記号であるが,もしも \Delta x の代りに h と書けば

\frac{dy}{dx}=\lim_{h\to 0} \frac{f(x+h)-f(x)}{h}.

上記の極限値が存在するとき,函数 y=f(x) は点 x において微分可能であるという.

もしも或る区間の各点 x において y=f(x) が微分可能ならば, f(x) はその区間において微分可能であるという.その場合,極限値 \tfrac{dy}{dx}x の函数である.その函数を f(x)導函数といい,それを記号 f'(x) で表わす.すなわち上記条件の下において

\frac{dy}{dx}=f'(x).
記号 \tfrac{dy}{dx}Leibniz からの伝統である.f'(x)Lagrange の用例である.f(x)y で表わす場合には,f(x)y' または \dot y で表わす.\dot yNewton の用例である.CauchyD_x y または D_x f(x) なる記号を用いた.独立変数を特記するに及ばないときには,添字を略して D と書く.
\frac{dy}{dx}=f'(x)=y'=\dot y=D_x y=Dy.

これらの記号は一長一短である.現今は拘泥しないで,場合に応じて便宜流用する.

導函数(derived function,略して derivative)とは‘微分法によって f(x) から導き出される函数’ということの略称である.導函数 f'(x) は区間に関する称呼であるが,一点 x における \tfrac{dy}{dx} すなわち \textstyle \lim\tfrac{\Delta y}{\Delta x}Newton のいわゆる‘流動率’(fluxion)である.ドイツ系統では,Leibniz の伝統に従って,この極限値 \tfrac{dy}{dx} を微分商(Differentialquotient)といっているが,英米系統では,それを改称して微分係数(differential coefficient)という.フランス系では,微分商も導函数も共に dériveé という.
接線の勾配

函数 y=f(x) のグラフにおいては,\Delta y/\Delta x は 点 (x,y) と点 (x+\Delta x, y+\Delta y) とを結ぶ弦の勾配で,\tfrac{dy}{dx} は点 (x,y) における接線の勾配である.

\Delta x\Delta y はグラフの上での点の座標の変動であるが,もしもグラフの代りに接線を取って,接線上における点 (X,Y) の座標の変動を dxdy で表わして,dx=X-x(それは\Delta xと同一),また,dy=Y-y(それは\Delta yとは違う)とするならば

(1)
dy=f'(x) dx

は点 (x,y) における接線の方程式にほかならない.そのように dxdy を単独に定義すれば,(1) の意味は明確である.しかし我々は点 (x,y) の近傍においてのみ (1) を用いるつもりであるから, dx を変数 x微分differential),dy をそれに対応する函数 y の微分という.

上文で接線というような耳慣れた言葉を用いて,\tfrac{dy}{dx} は接線の勾配などといったけれども,実際は,それは接線を定義したのにすぎない.すなわち \tfrac{dy}{dx} が存在するときに,点 (x,y)において \tfrac{dy}{dx} を勾配とする直線を y=f(x) の接線というのである.よって今一度 \tfrac{\Delta y}{\Delta x} から出直してみよう.

\lim\tfrac{\Delta y}{\Delta x}=f'(x) が存在するならば,\tfrac{\Delta y}{\Delta x}=f'(x)+\varepsilon,すなわち \Delta x \ne 0 のとき

(2)
\Delta y=f'(x) \Delta x +\varepsilon \Delta x

と置くとき,\varepsilonx\Delta x に関係するが,x を固定すれば,\Delta x \to 0 のとき \varepsilon \to 0. 今逆に \Delta x \ne 0 のとき

(3)
\Delta y=A\cdot\Delta x +\varepsilon\cdot\Delta x

で,Ax のみに関係して,\Delta x には関係しない係数,また \varepsilonx にも \Delta x にも関係するが,\Delta x \to 0 のとき \varepsilon\to 0 と仮定してみよう.もしも (3) が成り立つならば,\Delta x\to 0 のとき \tfrac{\Delta y}{\Delta x} = A + \varepsilon\to A,すなわち A=\lim \tfrac{\Delta y}{\Delta x},従って点 x において f'(x) が存在して,A=f'(x).故に (3) が成立するのは,f'(x) が存在するときに限り,その場合 (3)(2) と同じものである.よって f'(x) が存在するという仮定の下において (2) を考察する. さて (2) の右辺の第一項 f'(x)\Delta x\Delta x に関して一次式である(我々は今 x の値を固定している,従って変数は \Delta x である)が,第二項では \Delta x\to 0 のとき \Delta x の係数 \varepsilon が限りなく小さくなるのだから,その \varepsilon\Delta x との積なる \varepsilon\cdot\Delta x\Delta x よりも高度に徴小になる.すなわち \Delta x\to 0 に際して,(2) の右辺の第一項なる f'(x) \cdot \Delta x\Delta y の主要部である.そこで \Delta y の主要部なる f'(x)\cdot\Delta xx における函数 y=f(x) の微分と名づけて,それを dy で表わすことにする.すなわちこの定義によれば

(4)
dy=f'(x)\Delta x.

今同様の意味において,x それ自身を x の函数とみれば x'=1 だから

dx=\Delta x.

故に上記定義の下において,\Delta xx の函数なる x の微分である.これを (4) に代入すれば,

(5)
dy=f'(x) dx.

これを

(6)
\frac{dy}{dx}=f'(x)

と書くならば,記号 \tfrac{dy}{dx} において dx および dy が各〻独立の意味を有するから,\tfrac{dy}{dx} は商としての意味を有する.すなわち‘微分商’というものである.

このように,現代的の精密論法によって,Leibniz の漠然たる‘微分商’が合理化される.また (5) によれば,f'(x) は微分 dy における dx の係数であるから,それを‘徴分係数’というのも,もっともではある.

x が独立変数であるときには,上記の dx=\Delta x ということは,あまりに細工が過ぎるようであるが,後に至って独立変数を変換するときに \Delta x の代りに dx と書くことの意味が了解されるであろう.
[注意] 
上記 (2) によって,\varepsilonx\Delta x との函数 \varepsilon=\varepsilon (x,\Delta x) として,条件 \Delta x\ne 0 のもとで定義されたが,\Delta x\to 0 のとき \varepsilon\to 0 なのだから,\varepsilon の定義を \Delta x=0 まで延長して,\Delta x=0 のとき \varepsilon=\varepsilon (x,0)=0 とすれば,x を固定したとき \Delta x の函数として,\varepsilon\Delta x=0 において連続となる.(3) においても,\Delta x=0 のとき \varepsilon=0 という仮定を追加して,\varepsilon\Delta x=0 で連続性を保つようにするのが自然である.後に至って,(2) あるいは (3) の式を,\Delta x=0 のときも含めて考察する必要を生ずるが,そのとき,\Delta x=0 に対する \varepsilon の値は,上記のように定義されるものとする.


[編集] 14.微分の方法

次に掲げるのは,微分の定義から直ちに出て来る周知の定理である.

定理 15.
或る区間において,x の函数 u, v が微分可能ならば,
(1º)
(u \pm v)' = u' \pm v'.
(2º)
\left(uv\right)' = u'v + uv'.
(3º)

  \left(\frac{u}{v}\right)'=\frac{u'v-uv'}{v^2}.
 (ただし v \ne 0 とする)
[証]
(1º)
は明白であろう.
(2º)

  \Delta(uv)=(u+\Delta u)(v+\Delta v)-uv
  = \Delta u\cdot v+u\cdot\Delta v+\Delta u\Delta v,
故に

  \frac{\Delta(uv)}{\Delta x}
 = \frac{\Delta u}{\Delta x}\cdot v
  + u\cdot\frac{\Delta v}{\Delta x}
  +\Delta u\cdot\frac{\Delta v}{\Delta x}.
仮定によって,\Delta x\to 0のとき,

  \frac{\Delta u}{\Delta x}\to\frac{du}{dx},\quad
  \frac{\Delta v}{\Delta x}\to\frac{dv}{dx},\quad
  \Delta u\to 0.
故に

  \frac{d(uv)}{dx}=\frac{du}{dx}v+u\frac{dv}{dx}.
すなわち
(uv)'=u'v+uv'.
(3º)

  \Delta\left(\frac{u}{v}\right)
  =\frac{u+\Delta u}{v+\Delta v}-\frac{u}{v}
  =\frac{v\Delta u-u\Delta v}{v(v+\Delta v)},
故に

  \frac{\Delta(u/v)}{\Delta x}
  =\frac{\frac{\Delta u}{\Delta x}v-u\frac{\Delta v}{\Delta x}}{v(v+\Delta v)}.
仮定によって,\Delta x\to 0 のとき,

  \frac{\Delta u}{\Delta x}\to\frac{du}{dx},\quad
  \frac{\Delta v}{\Delta x}\to\frac{dv}{dx},\quad
  \Delta v\to 0,
故に

  \frac{d}{dx}\left(\frac{u}{v}\right)
  =\frac{\frac{du}{dx}v-u\frac{dv}{dx}}{v^2}.
すなわち

  \left(\frac{u}{v}\right)'=\frac{u'v-uv'}{v^2}.
上記 (1º)(2º) は三つ以上の函数 u,v,\ldots,w に関しても同様である.例えば
(2′)

  (uvw)'=u'(vw)+u(vw)'=u'vw+uv'w+uvw',
あるいは
(2′′)

  \frac{(uvw)'}{uvw}=\frac{u'}u+\frac{v'}v+\frac{w'}w.
もちろん uvw\ne 0 と仮定して,こう書くのである.
定数 cx の函数とみれば,c'=0.よって (2º) から (cu)'=cu'.また xx の函数とみれば x'=1.従って (2′)n 個の因子 x に適用すれば
\frac{d(x^n)}{dx}=nx^{n-1}.
よって (1º)(2º)(3º) を応用して,x の有理函数の微分ができることは周知の通りである.

三角函数の微分も周知である.今 \Delta x=2h と置けば


  \frac{\sin(x+\Delta x)-\sin x}{\Delta x}=\frac{\sin h}h\cos(x+h).
\Delta x\to 0 のとき,h\to 0,従って \tfrac{\sin h}h\to 1,また \cos(x+h)\to\cos(x).故に定理 5 (および 21 頁) によって
D\sin x=\cos x.
同じように
D\cos x=-\sin x.
これらを用いて,商の微分法によって

  D\tan x=\frac{1}{\cos^2x}.\quad
  \left(x\ne n\pi+\frac\pi2,\,n=0,\pm1,\pm2,\ldots\right)
.

x において y=f(x) が微分可能ならば,\Delta x\to 0 のとき \Delta y\to 0 であるから,その点において f(x) は連続である.すなわち

定理 16.
連続性は微分可能性の必要条件である.

しかし,それは十分条件ではない.

[例]
f(x)=x\sin\tfrac{1}{x},f(0)=0 とすれば f(x)0 を含む区間で連続であるが,x=0 において微分可能でない.実際

  \frac{f(h)-f(0)}{h}=\sin\frac{1}{h}
で,h\to 0 のとき,極限は存在しない.
上記の函数では x=0 は特異なる一点であるが,Weierstrass(1872)は或る区間の各点において微分可能でない連続函数の実例を作って,当時の数学界に衝動を与えた.
時としては \Delta x を正または負に限って

  \lim_{\Delta x\to+0}\frac{\Delta y}{\Delta x},\quad
  \lim_{\Delta x\to-0}\frac{\Delta y}{\Delta x}
を考察することがある.極限値が存在する場合,それらを,それぞれ,右へ,あるいは左への微分商といい,前者を D^+y,後者を D^-y で表わす.両者が相等しいときが,すなわち,y が微分可能なのである.
[例]
y=|x| とすれば,x において D^+y=1,D^-y=-1
[注意] 
閉区間 [a,b] において,f(x) が微分可能というときには,x=a では右へ,また x=b では左への微分商が存在することをいう.そのとき f(x)x=a では右へ連続,x=b では左へ連続である.

極限値として \pm\infty をも許容する意味で


  \lim_{h\to 0}\frac{f(a+h)-f(a)}h=\pm\infty
なるとき,それを f'(a)=\pm\infty と略記することもあるが,今我々はそれを微分可能としない.上記 f'(a)=\pm\infty\lim_{h\to 0}f'(a+h)=\pm\infty を意味しないから,このような略記法は慎重に取扱わねばならない.
[例]
y=\mathrm{sign}\,x.§8,[例 5]

規約の文字に執着すれば,x=0 のとき Dy=+\infty


[編集] 15.合成函数の微分

y=f(x) は区間 x_0\leqq x\leqq x_1 における x の函数,また \varphi(t) は区間 t_0\leqq t\leqq t_1 における t の函数とする.もしも \varphi(t)x_0x_1 との間の値のみを取るならば,y=f(x) において x\varphi(t) を代入するとき,y は区間 [t_0,t_1] における t の函数である.今
y=f(\varphi(t))=F(t)
と置く.もしも f(x)\varphi(t) も連続ならば,t\to t_0 のとき \varphi(t)\to\varphi(t_0).従って f(\varphi(t))\to f(\varphi(t_0)),すなわち F(t)\to F(t_0).故に yt に関して連続である.
定理 17.
もしも f(x)\varphi(t) も微分可能ならば,F(t)=f(\varphi(t)) も微分可能で,
F'(t)=f'(x)\cdot \varphi'(t),
すなわち

  \frac{dy}{dt}=\frac{dy}{dx}\cdot\frac{dx}{dt}.

これが函数の函数(合成函数)の微分法である.

[証]
t の変動 \Delta t に対応する x の変動を \Delta x,それに対応する y の変動を \Delta y とすれば,
(1)

 \frac{\Delta y}{\Delta t}=\frac{\Delta y}{\Delta x}\cdot\frac{\Delta x}{\Delta t}.
\Delta t\to 0 のとき
\frac{\Delta x}{\Delta t}\to\frac{dx}{dt}.
またそのとき \Delta x\to 0,従って
\frac{\Delta y}{\Delta x}\to\frac{dy}{dx}.
故に

  \frac{\Delta y}{\Delta t}\to\frac{dy}{dx}\cdot\frac{dx}{dt}.
すなわち
F'(t)=f'(x)\cdot\varphi'(t).

上記の大ざっぱな証明法が,我々に反省の機会を与える.

x が独立変数ならば,\Delta x は任意でかつ \Delta x\ne 0 であるが,上記の場合のように,xt の函数であるときは,\Delta t の値によっては \Delta x=0 でありうる.そのような場合には,(1) のように書くことは不合理である.このような粗雑な証明を補修するよりも,むしろ初めから仕直すのが早い.すなわち次のようにするのである.独立変数 t の変動 \Delta t に対応する x および y の変動を \Delta x,\Delta y と書くことは上記の通りとして

  \Delta y=f'(x)\Delta x+\varepsilon\Delta x,\quad
  \Delta x=\varphi'(x)\Delta t+\varepsilon'\Delta t.
と置けば,\Delta t\to 0 のとき,\varepsilon'\to 0,またそのとき \Delta x\to 0.ただしこの場合,\Delta t\ne 0 でも\Delta x=0 でありうるが,37 頁[注意]のように,\Delta x=0 のとき \varepsilon=0 と定義するのだから,\Delta t\to 0 のとき \varepsilon\to 0.よって
\begin{align} \Delta y
  &= (f'(x)+\varepsilon)(\varphi'(t)+\varepsilon')\Delta t\\
  &= f'(x)\varphi'(t)\Delta t+[
      \varepsilon\varphi'(t)+\varepsilon'f'(x)+\varepsilon\varepsilon'
     ]\Delta t
\end{align}
において,右辺の第二の括弧 [\quad] の中を \varepsilon'' と書けば,

  \Delta y=f'(x)\varphi'(t)\Delta t+\varepsilon''\Delta t,\quad
  \varepsilon''= \varepsilon\varphi'(t)+\varepsilon'f'(x)+\varepsilon\varepsilon'
で,\Delta t\to 0 のとき \varepsilon''\to 0,故に
dy=f'(x)\varphi'(t)dt.
すなわち結果においては
dy=f'(x)dx
へ機械的に dx=\varphi'(t)dt を持ち込むのと同様である.これが微分記号の便利なところである(37 頁参照). 同様に,yx の函数,xt の函数,また tu の函数で,それらが微分可能ならば

  \frac{dy}{du}=\frac{dy}{dx}\frac{dx}{dt}\frac{dt}{du}
 等.
[附記] 
微小数または無限小infinitesimal
独立変数の或る一定の変動に伴って0 に収束する変数を微小数または無限小という.例えば:
x\to 0 のとき \sin x,
x\to 1-0 のとき \sqrt{1-x^2},
x\to +\infty のとき e^{-x},
x\to a,y\to b のとき \sqrt{(x-a)^2+(y-b)^2},

等々はいわゆる微小数である.

\alpha\beta も微小数で,しかも \tfrac{\beta}{\alpha}\to 0 ならば,\beta\alpha よりも高位の微小数 という.すなわち \beta=\varepsilon\alpha と置けば,\varepsilon\to 0 である.\alpha を標準にすれば,\alpha よりも高度の微小数を一般的に記号 o\alpha で表わす.この記号は,\varepsilon\alpha において,\varepsilon に関して精確なる値を知る必要がなくて,ただ \varepsilon\to 0 なることのみが用いられる場合に便利である.今その用例の二,三を示そう.

[例 1]
\beta=o\alpha,\gamma=o\alpha ならば \beta+\gamma=o\alpha あるいは o\alpha+o\alpha=o\alpha.ここで三箇所の o\alpha は相等しいのではなく,\alpha よりも高度の微小数を無差別に同じ記号 o\alpha で表わして,\tfrac{\beta}{\alpha}\to 0,\tfrac{\gamma}{\alpha}\to 0 なるときは \tfrac{\beta+\gamma}{\alpha}\to 0 であることを簡明に略記するのである.
[例 2]
u が有界ならば uo\alpha=o\alpha,o(u\alpha+o\alpha)=o\alpha. なぜなら: u\varepsilon\alpha において \varepsilon\to 0 ならば,u\varepsilon\to 0; また \varepsilon(u\alpha+\varepsilon'\alpha)=(\varepsilon u+\varepsilon\varepsilon')\alpha において \varepsilon\to 0,\varepsilon'\to 0 ならば,\varepsilon u+\varepsilon\varepsilon'\to 0 だから.
[例 3]
前頁に掲げた計算において
\Delta y=f'(x)\Delta x+o(\Delta x),
\Delta x=\varphi'(t)\Delta t+o(\Delta t),
故に
o(\Delta x)=o(\Delta t)
従って
\Delta y=f'(x)\varphi'(t)\Delta t+f'(x)o(\Delta t)+o(\Delta t)
例 2例 1
=f'(x)\varphi'(t)\Delta t+o(\Delta t).

独立変数の或る変動に伴って \alpha,\beta が無限小になり,しかも \omega=\beta/\alpha有界ならば,\alpha を標準として \beta=O\alpha と書く.\omega\to 0 のときには \beta=o\alpha だから,o\alpha はもちろん O\alpha であるが,逆は真でない.

特に \omega\to a,a\ne 0 ならば \beta=O\alpha,\alpha=O\beta.このとき \alpha,\beta同位の微小数という.\beta\alpha^n と同位の微小数なるとき \beta\alpha に関して n 位の微小数という.

[注意] 
記号 o\alpha,O\alpha において,\alpha が微小数なることは必要でない.例えば x\to\infty のとき \log x=o(\sqrt[n]{x}),これは \tfrac{\log x}{\sqrt[n]{x}}\to 0 を示すのである.また \varepsilon が微小数ならば \varepsilon=o(1)

要するに o\alpha においては記号 o\varepsilon,\varepsilon' 等の因子で置き換えて,それを \varepsilon\alpha,\varepsilon'\alpha などと書くとき,\varepsilon\to 0 また \varepsilon'\to 0 ならばよろしい.また O\alpha においては O\omega で置き換えるとき,\omega が有界ならばよろしい.もちろんすべて独立変数の或る一定の変動に関していうのである.

文字 o,Oorder(程度)を示唆するのである.o は‘より小なる程度’,O は‘同程度以下’.


[編集] 16.逆函数の微分法

区間 a\leqq x\leqq b において連続なる函数 y=f(x) が与えられているとする.この区間における y の最小および最大の値を p, q とすれば(定理 13),y は区間 p\leqq y\leqq q における任意の値を取る(定理 12).しかし y=f(x) が単調(狭義)である場合においてのみ,y の一つの値に対応する x の値が一意に確定する.

f(x)が単調でない
もしも f(x) が単調でないとするならば,x_1< x_2< x_3 に対応して y_1< y_2< y_3 または y_1> y_2> y_3 にならないことがある.もしも例えば y_1< y_2, y_2> y_3 ならば,y_2>\eta>\mathop{\mathrm{Max}}(y_1, y_3) なる \eta に対応して,区間 (x_1, x_2) および (x_2, x_3) において \eta=f(x) なる x の値が少くとも一つずつある.

単調の場合には,区間 p\leqq x\leqq q における y の各〻の値に y=f(x) なるような x の一つの値が対応するから,xy の函数である.よって x=\varphi(y) として,\varphif逆函数という.そうすれば,f\varphi の逆函数で,f\varphi とは互に逆なる函数である.

定理 18.
或る区間において x の函数 y が連続で単調ならば,y の変動区間において xy の逆函数として確定される.逆函数も連続でかつ単調である.もしも yx の函数として微分可能ならば,xy の函数として微分可能で,
\frac{dy}{dx} \cdot \frac{dx}{dy} = 1.
接線がx軸となす角\theta, y軸となく角\varphi, 然るに dy/dx=\tan\theta, dx/dy=\tan\varphi.
\scriptstyle\frac{dy}{dx}=\tan\theta, \frac{dx}{dy}=\tan\varphi
[証]
逆函数が確定することはすでに述べた.そこで y=f(x),x=\varphi(y) と書いて,x=\xiy=\eta が対応するとする.\varphi(y) が単調であることは明白であろう.よって今 \{y_n\}\eta に収束する任意の単調数列とすれば,それに対応する \{x_n\} も単調でかつ有界だから,或る極限値 \lambda に収束する.然らば,f(x) の連続性から,f(\lambda)=\xi.故に \lambda=\varphi(\eta)=\xi.すなわち y_n\to \eta のとき x_n\to \xi,すなわち \varphi(y_n)\to\varphi(\eta).故に逆函数 \varphi(y) は連続である.
さて
\frac{\Delta x}{\Delta y}=1\bigg/\frac{\Delta y}{\Delta x}.
故に \Delta y\to 0,従って \Delta x\to 0 のとき 
  \lim\tfrac{\Delta x}{\Delta y}=1/\lim\tfrac{\Delta y}{\Delta x}
,すなわち \tfrac{dx}{dy}=1/\tfrac{dy}{dx},ただし \tfrac{dy}{dx}=0 になるところは除くべきである.そのところでは \tfrac{\Delta x}{\Delta y}\to\pm\infty.それを \tfrac{dx}{dy}=\pm\infty と書くのは格別である.
dy/dx=0なるところは除くべきである
逆三角函数を逆函数の例に取ってみよう.
(1º)
\arcsin x. y = \sin x は区間 -\tfrac\pi2\leqq x\leqq\tfrac\pi2 または一般に

  (2n-1)\frac\pi2\leqq x\leqq (2n+1)\frac\pi2,\quad(n=0,\pm1,\pm2,\ldots)
において単調で,区間 -1\leqq y\leqq 1 に属する値を取る.故に函数 y=\sin x の逆函数,すなわち x=\mathrm{arc\,sin}\,x が区間 -1\leqq y\leqq 1 において可能であるが,そのためには x を上記の区間の中の一つに限定しなければならない.

x に関して一つの区間を指定するとき,それを逆函数 \mathrm{arc\,sin}\,x の一つのという.これら \mathrm{arc\,sin} の無数の枝の中で [-\tfrac\pi2,\tfrac\pi2] に対応するものを,引用の便宜上主値といい,それを特記するために,大文字を用いて \mathrm{Arc\,sin}\,x と書くことにする.

x, y は変数の記号に過ぎないから,逆函数においても独立変数を x,従属変数を y と書くことにすれば

 y=\mathrm{Arc\,sin}\,x.\qquad(-1\leqq x\leqq 1)
それは

  x=\sin y,\qquad\left(-\frac\pi2\leqq y\leqq \frac\pi2\right)
を意味する.
y=sin x y=Arc sin x
\scriptstyle y=\sin x \scriptstyle y=\mathrm{Arc\,sin}\,x
さて y = \sin x から

  \frac{d\sin x}{dx}=\cos x,\quad
  \frac{d\,\mathrm{arc\,sin}\,x}{dx}=\frac{1}{\cos x}=\pm\frac{1}{\sqrt{1-y^2}}.
主値に関しては -\tfrac\pi2\leqq x\leqq\tfrac\pi2 だから \cos x\geqq 0 故に \pm{}+{} である.すなわち変数 x,y を取り換えて書けば

  D\,\mathrm{Arc\,sin}\,x=\frac{1}{\sqrt{1-x^2}}.
(2º)
\arctan x. y = \tan x は区間 -\tfrac\pi2< x<\frac\pi2 において -\infty から +\infty まで単調に増大する.よって \tan の逆函数 \mathrm{arc\,tan} の主値が次のように定義される.すなわち独立変数を x と書いて,区間 -\infty< x<\infty において

  y=\mathrm{Arc\,tan}\,x,\qquad -\frac\pi2<y<\frac\pi2.
例えば
\begin{align}
  &\mathrm{Arc\,tan}\,0=0,\quad \mathrm{Arc\,tan}(\pm1)=\pm\frac\pi4,\\
  &\mathrm{Arc\,\tan}(\pm\infty)
   =\lim_{x\to\pm\infty}\mathrm{Arc\,tan}\,x=\pm\frac\pi2.
\end{align}
y = \tan x
y = Arc tan x
\scriptstyle y=\tan x \scriptstyle y=\mathrm{Arc\,tan}\,x
また y=\tan x,\tfrac{dy}{dx}=\tfrac{1}{\cos^2 x}=1+y^2 から,記号を変えて
D\,\mathrm{Arc\,tan}\,x=\frac{1}{1+x^2}.
[注意] 
上記と同様に \mathrm{arc\,cos},\,\mathop{\mathrm{arc\,cot}} 等に関しても主値を定義することは,もちろん,できるが,そのような規約に頼らないで,全てを \mathop{\mathrm{Arc\,sin}} または \mathop{\mathrm{Arc\,tan}} から導く方が紛れがなくて安全であろう. y = \mathrm{arc\,sin}\,x または y = \mathrm{arc\,tan}\,x において y の値を区間 [-\tfrac{\pi}{2}, +\tfrac{\pi}{2}] に限定して,それを主値と呼ぶことは便宜上の規約で,実質上の必要によるのではないから,もしもその規約に拘泥すれば,往々不自然なる結果を招くことがある.
[例 1]
y = \mathrm{arc\,sin}\sqrt{1 - x^{2}}\sqrt{1-x^2}=\sin y を意味する.従って x^2=\cos^2 y,x=\pm\cos y.故に xy との関係は次の図の曲線で示される.もしも \mathrm{arc\,sin} を主値とすればグラフは ABC で,点 B(0,\tfrac\pi2) が角立つ.しかし y を主値と限らないならば,グラフは A'BC または ABC' のように滑らかな曲線(\mathrm{arc\,cos}\,x または \mathrm{arc\,cos}(-x) の枝)である. y を主値として微分すれば(§17 の最後参照)

  \frac{dy}{dx}=\frac{1}{\sqrt{1-(1-x^2)}}\frac{-x}{\sqrt{1-x^2}}
  =\frac{1}{|x|}\frac{-x}{\sqrt{1-x^2}}=\mp\frac{1}{\sqrt{1-x^2}}
  \quad (x\gtrless 0)
で,x=0 においては D^+y=-1,D^-y=+1.同じように,y=\mathrm{arc\,sin}\,2\pi\sqrt{1-x^2} を考察してみるとよい.
[例 2]
y=\mathrm{arc\,tan}\,\tfrac{1}{x}.

しいて主値を取れば x=0 は不連続点になる.しかし点線で示したような滑らかな分枝もある.それらは \mathrm{arc\,cot}\,x の枝である.

主値を取れば arc tan 1/x は x = 0 で不連続,しかし滑らかな枝もある.

[編集] 17.指数函数および対数函数

指数函数および対数函数のグラフ

a >1 とすれば,指数函数 y = a^x は区間 -\infty< x< +\infty において連続かつ単調増大で,0< y< \infty.ゆえに逆函数 \log_{a}x は区間 0< x< \infty において連続で,単調に -\infty から +\infty まで増大する.

a^x の微分法は周知であるが,これは基本的だから一応説明しておこう.

a^x が微分可能ならば,

  \frac{d(a^x)}{dx} = \lim_{h\to 0}\frac{a^{x+h}-a^x}{h} 
  = a^x\lim_{h \to 0}\frac{a^h-1}{h}
だから,問題は
\lim_{h\to 0} \frac{a^h - 1}{h},
すなわち x = 0 における D x^a を求めることに帰する.

まず h >0 とする.然らば a^h >1.故に a^h=1+\frac{1}{t} と置けば,t >0.指数函数の連続性(§10)によって h\to 0 のとき,a^h \to 1,従って t\to\infty

さて h =\log_{a}(1+\tfrac{1}{t}) だから

   \frac{a^h - 1}{h}
  =\frac{\frac{1}{t}}{\log_{a}(1 + \frac{1}{t})}
  =\frac{1}{\log_{a}(1 + \frac{1}{t})^{t}}.
h\to 0 のとき t\to\infty,従って (1 + \tfrac{1}{t})^{t} \to e,(§9).\log_{a}x は連続函数だから,h \to 0 のとき \log_{a}(1 + \tfrac{1}{t})^{t} \to \log_{a}e.故に
\lim_{h\to 0}\frac{a^h-1}{h}=\frac{1}{\log_{a}e}=\log_{e}a.
以上 h >0 とした.h< 0 ならば,h の代わりに -h と書けば,

  \frac{a^{-h}-1}{-h}=\frac{a^h-1}{h}\cdot\frac{1}{a^h}.\quad(h >0)
h\to 0 のとき,a^h\to 1 だから,
\frac{a^{-h}-1}{-h}\to\log_{e}a.
故に
(1)
\frac{d(a^x)}{dx} = a^x\log_{e}a.
0 < a < 1 のときには a^{x} は単調減少であるが,同様にして (1) を得る.特に a = e とすれば,\log_{e}e = 1 だから,
(2)
\frac{d(e^x)}{dx} = e^{x}.

逆函数に移れば(定理 18


\begin{align}
\frac{d \log_{a}x}{dx} &= \frac{1}{x \log_{e}a}, & &(a > 0, x > 0)\\
\frac{d \log_{e}x}{dx} &= \frac{1}{x}.           & &(x > 0)
\end{align}
(3)
(4)
(1)(2) と,または (3)(4) とを比較すれば,対数の底として e を採用することの便利なる所以が了解される.解析学では,\loge を底とするものと了解する.e を底とする対数を自然対数natural logarithm)といい,それを特記するために,\mathop{\mathrm{log\,nat}} または略して \ln などの記号を用いるが,通常は単に \log と書く.すなわち,
\log x = \log_{e}x = \mathop{\mathrm{log\,nat\,}} x = \ln x.
要約すれば

\begin{align}
& D e^{x} = e^{x}. && D a^{x} = a^{x} \log a, \quad (a > 0).\\
& D \log x = \frac{1}{x}. \quad (x > 0) && D \log_{a}x = \frac{1}{x \log a}, \quad (a > 0,~x > 0).
\end{align}
[注意] 
\log xx >0 に対してのみ定義されているから,上記のように x >0 のとき D \log x = \frac{1}{x}.然るに x < 0 に対しては,D\log(-x) = \frac{-1}{-x} = \frac{1}{x} であるから,x が負の場合も込めて,D\log x = \frac{1}{x}~(x \neq 0)
対数微分法
 u,v,w 等は微分可能な x の函数とする.然らば,u,v,w0 でない点 x において,\log |uvw| も微分可能で(上記[注意]参照)

  D\log|uvw|=D(\log|u|+\log|v|+\log|w|=\frac{u'}u+\frac{v'}v+\frac{w'}w.
然るにまた
D\log|uvw|=\frac{(uvw)'}{uvw}.
故に
\frac{(uvw)'}{uvw}=\frac{u'}u+\frac{v'}v+\frac{w'}w.
  \quad (u\neq 0, v\neq 0, w\neq 0).
同様に
\left(\frac{u}v\right)' \bigg/\frac{u}v=\frac{u'}u-\frac{v'}v.
これらはもちろん定理 15 からも導かれる.また
\log a^{x} = x \log a \quad (a > 0)
から
\frac{D a^{x}}{a^{x}}{x^{a}} = \frac{a}{x}
故に
D x^{a} = a x^{a - 1}.
このように (1) が対数微分法によって簡明に導かれる.
巾函数 x^a~(x > 0).
任意の指数 a に関して
\log x^{a} = a \log x,
従って
\frac{D x^{a}}{x^{a}} = \frac{a}{x},
D x^{a} = a x^{a - 1}.
これが一般の巾函数の微分法の公式である.

[編集] 18.導函数の性質

定理 19.
Rolle の定理]. f(x) は区間 [a,b] で連続, (a,b) で微分可能とする.もしも f(a)=f(b) ならば,区間 (a,b) のある点において f'(x)0 になる.すなわち a<\xi<b,f'(\xi)=0 なる \xi がある.
[証]
まず f(a)=f(b)=0 とする.その場合, f(x) が常に 0 ならば,定理は明白である.もしも f(x) が正なる値を取るならば,[a,b] において連続なる f(x) の最大値は正である.その最大値を f(\xi) とする(定理 13).然らば f(\xi)>0 だから a<\xi<b

さて x=\xi において \Delta f\leqq 0 .故に

\Delta x>0  とすれば  \frac{\Delta f}{\Delta x}\leqq 0,  従って  f'(\xi)\leqq 0,
\Delta x<0  とすれば  \frac{\Delta f}{\Delta x}\geqq 0,  従って  f'(\xi)\geqq 0,
故に f'(\xi)=0

もしも f(x) が負の値のみを取るならば,最小値を考察すればよい.

f(a)=f(b)=k\ne 0 ならば, f(x)-k を考察すればよい.
(証終)
[注意] 
応用上,多くの場合 f(x) が連続で,かつ微分可能なる区間内の点 a,b に関して Rolle の定理が適用されるが,上記のように連続性は閉区間 [a,b] で,また微分可能性は開区間 (a,b) だけで仮定しても定理が成り立つのである.なお一般に連続性に関しては,f(x) は開区間 (a,b) で連続で,\textstyle\lim_{x\to a+0}f(x)=\lim_{x\to b-0}f(x) だけを仮定してもよい.そのとき x=a に関して(x=b でも同様),f(x) の定義を \textstyle f(a)=\lim_{x\to a+0}f(x) によって x=a まで拡張し,あるいは x=a において変更すれば,f(x)[a,b] において連続になるから,f(x) をその意味に取れば定理 19 は成り立つ.以下このような特別の場合に関して,くどくどしく説明しないこともあろう.
定理 20.
[平均値の定理]. f(x)[a,b] において連続, (a,b) において微分可能とする.然らば
\frac{f(b)-f(a)}{b-a}=f'(\xi),\qquad a<\xi<b,
なる \xi が存在する(Lagrange).
[証]
F(x)=f(x)-Ax と置いて F(a)=F(b) になるように,定数 A を定めることができる.すなわち
f(a)-Aa=f(b)-Ab  から  A=\frac{f(b)-f(a)}{b-a}.
然らば Rolleの定理によって F'(\xi)=0,a<\xi<b.さて F'(x)=f'(x)-A.故に
f'(\xi)=\frac{f(b)-f(a)}{b-a}.
定理掲出の公式の左辺は区間 [a,b] に関する f(x) の平均増加率で,それが区間内の一点における増加率 f'(\xi) と等しいのである. 上記の公式をフランス系では‘有限増加の公式’ともいう.上記公式の左辺は \tfrac{\Delta y}{\Delta x} であるが, \Delta x\to 0 とはしないのだから.

定理 20 を次のように拡張することができる.

定理 21.
区間 [a,b] において f(x),g(x) は連続で, (a,b) において微分可能とする,然らば (a,b) 内の或る点 \xi において
\frac{f(a)-f(b)}{g(a)-g(b)}=\frac{f'(\xi)}{g'(\xi)},\qquad a<\xi<b.
ただし,(1º) g(a)\ne g(b)(2º) f'(x),g'(x) は区間内で同時に 0 にならないと仮定する(Cauchy).
[注意] 
この仮定を強くして,(a,b) において g'(x)\ne 0 としてもよい.そのとき Rolle の定理によって g(a)\ne g(b) であるから.
[証]
今度は F(x)=\mu f(x)-\lambda g(x) と置いて, \lambda : \mu を適当に定めて F(a)=F(b) ならしめる.すなわち
\mu f(a)-\lambda g(a)=\mu f(b)-\lambda g(b)
から
\mu\{f(b)-f(a)\}=\lambda\{g(b)-g(a)\}.
よって
\lambda=f(b)-f(a),\quad \mu=g(b)-g(a)
として
F(x)=\{g(b)-g(a)\}f(x)-\{f(b)-f(a)\}g(x)
とする.然らば F'(\xi)=0 から(定理 19
\{g(b)-g(a)\}f'(\xi)=\{f(b)-f(a)\}g'(\xi).
ここで g'(\xi)\ne 0 .なぜならば:もしも g7(\xi)=0 とすれば,仮定 (1º) によって g(b)-g(a)\ne 0 だから, f'(\xi)=0 になるが,それは仮定 (2º) に反する. よって両辺を \{g(b)-g(a)\}g'(\xi) で割って
\frac{f(b)-f(a)}{g(b)-g(a)}=\frac{f'(\xi)}{g'(\xi)}.
(証終)
上記定理に興味ある幾何学的の説明を与えることができる.わかりやすくいうために,独立変数を t と書いて,曲線
x=g(t),\quad y=f(t),\qquad a \leqq t \leqq b
を考察する. t=a,t=b に対応する点を A,B とすれば定理掲出の公式の左辺は弦 AB の勾配で,右辺は t=\xi に対応する点 P における接線の勾配である.すなわち曲線 A,B 上の中間の或る点 P における接線が,弦 AB に並行になるのである.
KaisekiGairon-2-18-fig1.png

f'(x)g'(x) が同時に 0 にならないという仮定は,曲線が各点において確定の接線を有することを意味する. g(b)-g(a)\ne 0 と仮定するのは,それを左辺の分母に置くからである.実質的には f(b)-f(a) または g(b)-g(a)0 にならなければ(A \ne B ならば)よい.

定理 22.
或る区間において常に
f'(x)>0  ならば, f(x)  は単調に増大する,
f'(x)<0  ならば, f(x)  は単調に減少する,
f'(x)=0  ならば, f(x)  は定数である.
[注意] 
増大,減少はともに狭義でいう.すなわち a<b なるとき f(a)<f(b) または f(a)>f(b) で, f(a) \leqq f(b) または f(a) \geqq f(b) の意味ではない.
[証]
平均値の定理による.第一の場合には,区間内の任意の二つの点 a,b とその中間の一点 \xi とに関して
\frac{f(b)-f(a)}{b-a}=f(\xi)>0.
故に a<b なるときは f(a)<f(b)

その他も同様.

[注意] 
一点 x=a において f'(a)>0[あるいは <0]ならば,f(x)その点において増大[あるいは減少]しつつあるという.微分商の定義によって,その場合,|x-a| が十分少なるとき,x \lessgtr a に従って f(x) \lessgtr f(a)[あるいは f(x) \gtrless f(a)].それは f(x) を一定の f(a) に比較していうのであるから,区間に関して単調増大[あるいは減少]とは違う.

定理 22では f'(x) を連続とは仮定していない.もしも f'(x)x=a において連続ならば, f'(a)>0 なるときには,a を含む十分小なる或る区間内で f'(x)>0 ,従って定理 22 によって,その区間内では f(x) は単調増大である.f'(a)<0 の場合は単調減少である.

f'(a)=0 なるときは,f'x) が連続でも,f(x) の増大または減少に関して一般的になんらの断言もなしえない.

定理 22 の第一,第二の場合に,逆は真でない.すなわち f(x) が狭義で単調なるとき,区間内の或る点において f'(x)=0 になることがある(43 頁の上の図)もしも単調を広義に取れば: f'(x) \geqq 0 ならば, f(x) は単調増大(不減少)で,逆も真である. f'(x) \leqq 0 なるときも同様.
[附記] 
導函数の連続性について
区間 [a,b] においてf(x) が微分可能ならば,f(x) は連続であるが,導函数 f'(x) は必らずしも連続でない.すなわち微分法は連続性を保存しない.
[例]
f(x)=x^2\sin\frac{1}{x},\quad f(0)=0. x\ne 0 ならば
f'(x)=2x\sin\frac1x-\cos\frac1x.
ここで \tfrac{1}{x} を微分するとき x\ne 0 を仮定したから,これは x=0 のときは通用しない.x=0 のときは,規則通りに計算して

  f'(0)=\lim_{h\to 0}\frac{h^2\sin\frac1h-0}h
  =lim_{h\to 0}h\sin\frac1h=0.
すなわち \textstyle\lim_{x\to 0}f'(x)=f'(0) でないから,f'(x)x=0 において不連続である.

導函数は必らずしも連続でないから,x\to a のとき f'(x)\to f'(a) とはいかない.\textstyle\lim_{x\to a}f'(x) は存在すらも保証されない.ここに注意すべきは,その裏が成り立つことである: すなわち

定理 23.
f(x) が連続なる区間内の一点 a は別として,a の近傍では f(x) が微分可能で \textstyle\lim_{x\to a}f'(x)=l が存在するならば,f'(a)=l.すなわち a においても f(x) は微分可能で,f'(x)a において連続である.
[証]
平均値の定理によって

  \frac{f(x)-f(a)}{x-a}=f'(\xi),\quad a\lessgtr\xi\lessgtr x.
x\to a のとき,\xi\to a.故に仮定によって f'(\xi)\to l.すなわち
<\lim_{x\to a}\frac{f(x)-f(a)}{x-a}=l, すなわち f'(a)=l.
[注意] 
a が区間の左端(または右端)ならば f'(a)=l は右(または左)への微分商である.

導函数に関しては,(それが連続でなくても)中間値の定理が成り立つことが注意に値する.

定理 24.
f(x)[a,b] において微分可能なるとき,\muf'(a)f'(b) との中間にある任意の値とすれば,f'(\xi)=\mu,a<\xi<b なる \xi が存在する.
[証]
F(x)=f(x)-\mu x と置いて

   F'(a)=f'(a)-\mu<0,\quad F'(b)=f'(b)-\mu>0
と仮定して,F'(\xi)=0, a<\xi<b なる \xi の存在を示せばよい.この仮定によれば,[a,b] において連続なる F(x) は,その最小値を x=a または x=b において取りえない(49 頁,[注意]).故に a<\xi<b なる \xi に対応して F(\xi) が最小値を取る.然らば F'(\xi)=0 でなければならない.それは定理 19 の証明で述べた通りである.
(証終)
[注意] 
定理 2324 によって任意の函数が或る函数の導函数になりえないことがわかる.

[編集] 19.高階微分法

y=f(x) の導函数を f'(x) とするとき,f'(x) の導函数を f(x) の第二階の導函数といい,それを f''(x) と書く.第 n 階の導函数 f^{(n)}(x) もこれに準ずる.f^{(n)}(x)y^{(n)} または y^{(n)}_x あるいはD_x^{(n)}y などとも書く.一点 x における f''(x)

の値.すなわち

  \frac{d}{dx}\left(\frac{dy}{dx}\right)
 を \frac{d^2y}{dx^2} と書く.
同様に
\frac{d^ny}{dx^n} = f^{(n)}(x).
上記の記号において,dx^2 は巾 (dx)^2 であるが,d^2yd(dy) の意味で,それを y の第二階の微分という. §13で述べたように,微分記号を用いて
dy = y'_xdx
と書くとき,両辺の微分を取れば,d(dy), d(dx)d^2y, d^2x と略記して
(1)
d^2y=y''_x(dx)^2+y'_xd^2x.

これは積の微分法である.さて x が独立変数ならば,dx=\Delta xx に関係なく自由に取れるのだから,d^2x=d(\Delta x)=0

として
d^2y=y''_xdx^2.
これは \textstyle \frac{d^2y}{dx^2}=f''(x) を意味する.しかし,もしも x=\phi(t)t の函数,従って y=f(x)t の函数であるならば,d^2x=x_t''dt^2 で,(1)
d^2y=y_x'' x_t'^2 dt^2+y_x' x_t'' dt^2
になる.それは

  \frac{d^2}{dt^2}f(\phi(t))=f''(\phi(t))\phi'^2+f'(\phi(t))\phi''(t)
を意味するが,(1) では補助変数 t を表面に出さないで,直接に xy との間の関係が示されている.そこに微分記号の特色がある. u,vx の函数なるとき,
\frac{d^n}{dx^n}(u\pm v)=\frac{d^nu}{dx^n}\pm\frac{d^nv}{dx^n}
また積 uv に関してはいわゆる Leibniz の法則が成り立つ.すなわち
\frac{d^n(uv)}{dx^n} 
  = u^{(n)}v+\binom{n}{1}u^{(n-1)}v' + \cdots
  + \binom{n}{k}u^{(n-k)}v^{(k)} +\cdots+uv^{(n)},
\tbinom{n}{k} は二項係数である.これは帰納法によって容易に証明される.右辺の式の組立は (u+v)^n の展開と同型である.

合成函数または逆函数またはすでに商 u/v の高階導函数は簡単な公式であらわされない.

[編集] 20.凸函数

高階導函数は逐次の導函数として定義されたから,原函数 f(x) との関係が間接である.ただ第二階の導函数 f''(x) は,直接にf(x) に関連する或る簡明な性質を有する.

或る区間において函数 y=f(x) が有界であるとして,例のとおり y_1=f(x_1),y_2=f(x_2) などと略記する.今 y=f(x) のグラフの上で,任意の二点 A=(x_1,y_1),B=(x_2,y_2) の間において,グラフが弦 AB の下側にあるとき,f(x)を(下に向かって)凸函数という.下側とは y 軸の負の向きを下方とみなしていう.

反対の場合には,上に向かって凸という.ただし,ことわりなしに単に凸というときには,下に向かって凸を意味することと約束する.

上記凸函数の定義は解析的に(式で)いえば,次の通りである:
(1)
x_1<x<x_2 なるとき \begin{vmatrix}
  1 & 1 & 1 \\ x_1 & x & x_2 \\ y_1 & y & y_2
\end{vmatrix}\geqq 0.
下に凸の函数

グラフの上の点を一般に P=(x,y) とすれば,凸函数の場合,三角形 APB の周上で APB が正の向きであるから,面積(\geqq 0)の 2 倍が (1) の行列式(符号をも入れて)で与えられるのである.幾何学的の意味を離れていえば,(1) を凸函数の定義とみればよい.

(1) から簡単な計算によって,同じく x_1<x<x_2 なる条件の下において
(1′)
\frac{y-y_1}{x-x_1}\leqq\frac{y_2-y}{x_2-x}
を得る.または x-x_1>0,x_2-x>0 を考慮して中間分数を挿入すれば
(1′′)

  \frac{y-y_1}{x-x_1}\leqq\frac{y_2-y_1}{x_2-x_1}\leqq\frac{y_2-y}{x_2-x}
すなわち符号をも考慮していえば,AP の勾配が PB の勾配よりも小で(大でない),AB の勾配はその中間にあるのである.

故に区間 [x_1,x] の外では,グラフは弦 AP の上側にある[* 1]

定理 25.
f''(x) が存在する場合には,
(1º)
区間内で常に f''(x)\geqq 0 ならば,f(x) は凸函数である.
(2º)
f(x) が凸函数ならば,区間内で常に f''(x)\geqq 0 である.
[証]
(1º)
(1′) の左辺は f'(\xi_1) に等しい.ただし,x_1<\xi_1<x.また右辺は f'(\xi_2) に等しい.ただし x<\xi_2<x_2.すなわち \xi_1<\xi_2. さて f''(x)\geqq 0 ならば,f'(x) は単調増大(不減少)であるから,f'(\xi_1)\leqq f'(\xi_2).故に (1′) が成り立つ.すなわち f(x) は凸函数である.
(2º)
f(x) が凸函数ならば,(1′′) が成り立つ.さて x\to x_1 のとき (1′′) の左辺の極限は f'(x_1) である.故に
 f'(x_1)\leqq\frac{y_2-y_1}{x_2-x_1}.
x\to x_2 のとき (1′′) の右辺の極限は f'(x_2) である.故に
\frac{y_2-y_1}{x_2-x_1}\leqq f'(x_2).
すなわち f'(x_1)\leqq f'(x_2).故に f'(x) は区間内で単調増大(不減少)従って f''(x)\geqq 0
(証終)
凸函数は定義区間の内部の各点で連続で,右へおよび左への微分商を有する.それらは単調に増大し,前者は後者よりも大である(小でない).――実際
x_1<x<x_2
とすれば (1′) から

  \frac{y-y_1}{x-x_1}\leqq\frac{y_2-y}{x_2-x}.
x,x_1 を固定すれば \tfrac{y_2-y}{x_2-x} は,x_2 が減少しつつ x に近づくとき単調に減少し,しかも下方に有界である.故に
\lim_{x_2\to x}\frac{y_2-y}{x_2-x}=D^+y
は存在して
\frac{y-y_1}{x-x_1}\leqq D^+y.
同様に \textstyle D^-y=\lim_{x_1\to x}\frac{y-y_1}{x-x_1} も存在するから,この不等式から
D^-y\leqq D^+y.

D^+y,D^-y が存在するから,y は連続である.D^+y,D^-y が単調に増大することも同様にして証明される.


  1. 上記は広義の凸函数である.上文,下側は‘上側でない’ことを意味する.もしも (1) において \geqq> に換えて,等号を拒絶すれば,狭義の凸函数になる.

[編集] 21.偏微分

二つ以上の変数の函数において,ただ一つの変数のみを変動させて,その変数に関して微分することを偏微分という.例えば z=f(x,y) とするとき

  \frac{\partial z}{\partial x}
 =\lim_{\Delta x\to 0}\frac{f(x+\Delta x,y)-f(x,y)}{\Delta x},\quad
  \frac{\partial z}{\partial y}
 =\lim_{\Delta y\to 0}\frac{f(x,y+\Delta y)-f(x,y)}{\Delta y}.
或る区域内の各点において \tfrac{\partial z}{\partial x},\tfrac{\partial z}{\partial y} が存在するとき,それらは x,y の函数である.それを

  \frac{\partial z}{\partial x}=f_x(x,y)=D_xf(x,y),\quad
  \frac{\partial z}{\partial y}=f_y(x,y)=D_yf(x,y)
などと書く.高階微分に関しても同様に
\frac{\partial}{\partial x}\left({\partial z}{\partial x}\right)
  =\frac{\partial^2 z}{\partial x^2}=f_{xx}(x,y),
\frac{\partial}{\partial y}\left(\frac{\partial z}{\partial x}\right)
  =\frac{\partial^2 z}{\partial x\partial y}
  =f_{xy}(x,y), \frac{\partial}{\partial x}\left(\frac{\partial z}{\partial y}\right)
  =\frac{\partial^2 z}{\partial y\partial x}
  =f_{yx}(x,y),
\frac{\partial}{\partial y}\left({\partial z}{\partial y}\right)
  =\frac{\partial^2 z}{\partial y^2}=f_{yy}(x,y)
等々

三つ以上の変数に関しても同様である.

[例 1] 
\sqrt{x^2+y^2}=r と置いて
f(x,y)=\log r=\frac12\log(x^2+y^2)
とする.然らば
\begin{align}
  &f_x = \frac{x}{x^2+y^2} = \frac{x}{r^2},\quad f_y = \frac{y}{r^2},\\
  &f_{xx} = \frac 1{x^2+y^2}-\frac{2x^2}{(x^2+y^2)^2} = \frac 1{r^2}-\frac{2x^2}{r^4},\\
  &f_{xy} = -\frac{2xy}{(x^2+y^2)^2} = -\frac{2xy}{r^4} = f_{yx},\\
  &f_{yy} = \frac{1}{r^2}-\frac{2y^2}{r^4}.
\end{align}
よって \tfrac{\partial^2 f}{\partial x^2} + \tfrac{\partial^2 f}{\partial y^2} を記号 \Delta f で表わすならば,
\Delta f
  =\frac{\partial^2 f}{\partial x^2} + \frac{\partial^2 f}{\partial y^2}
  =\frac{2}{r^2}-\frac{2(x^2+y^2)}{r^4}=0.
[例 2] 
\sqrt{x^2+y^2+z^2}=r,f(x,y,z)=\frac{1}r=(x^2+y^2+z^2)^{-\frac12} とする.
\begin{align}
  & f_x=-\frac{x}{(x^2+y^2+z^2)^{\frac{3}{2}}}=-\frac{x}{r^3},\quad
    f_y=-\frac{y}{r^3},\quad f_z=-\frac{z}{r^3},\\
  & f_{xx}=-\frac{1}{r^3}-x\left\{-3\frac{1}{r^4}\cdot\frac{\partial r}{\partial x}\right\}
          =-\frac{1}{r^3}-\frac{3x}{r^4}\cdot\frac{x}{r}
          =-\frac{1}{r^3}-\frac{3x^2}{r^5},\\
  & f_{yy}=-\frac{1}{r^3}-\frac{3y^2}{r^5},\\
  & f_{zz}=-\frac{1}{r^3}-\frac{3z^2}{r^5}
\end{align}
\Delta f 
  = \frac{\partial^2 f}{\partial x^2}
   +\frac{\partial^2 f}{\partial y^2}
   +\frac{\partial^2 f}{\partial z^2}
  = -\frac{3}{r^3}+\frac{3(x^2+y^2+z^2)}{r^5}
  = -\frac{3}{r^3}+\frac{3r^2}{r^5}=0,

  f_{xy}=-x\left(-3\frac{1}{r^4}\cdot\frac{\partial r}{\partial y}\right)
  =3\frac{xy}{r^5}=f_{yx},
 等々.

偏微分商の定義は全く機械的で,計算上の手段であるにすぎないが,それらを適当に利用すれば,応用上有効である.

[編集] 22.微分可能性 全微分

函数 z=f(x,y) を一点 P=(x,y) の近傍において考察する.例の通り \Delta z=f(x+\Delta x,y+\Delta y)-f(x,y) と置く.さて
(1)
\Delta z=A\Delta x+B\Delta y+\varepsilon\rho,
ただし,A,B\Delta x,\Delta y には関係しない係数,すなわち点 (x,y) において一定の値を有するもので,\rho は定点 (x,y) と動転 (x+\Delta x,y+\Delta y) との距離(\rho=\sqrt{(\Delta x)^2+(\Delta y)^2}),また \varepsilon\Delta x,\Delta y に関係するが,\rho\to 0 のとき,\varepsilon\to 0 とする.すなわち 41 頁に述べた記号を用いるならば \varepsilon\rho=o\rho.そのとき函数 z は点 (x,y) において微分可能であるという. (1) が成り立つならば,\Delta y=0 すなわち \rho=|\Delta x| とするとき

  \frac{\Delta z}{\Delta x}=A\pm\varepsilon,
すなわちそのとき,\Delta x\to 0 と共に \varepsilon\to 0 だから,(x,y) において \tfrac{\partial z}{\partial x} が存在して,それが A に等しい.同様に \tfrac{\partial z}{\partial y} が存在して,それが B に等しい.かつまた点 (x+\Delta x,y+\Delta y) が一定の方向から点 (x,y) に収束するとき,すなわち \alpha が一定で,\Delta x=\rho\cos\alpha,\Delta y=\rho\sin\alpha とするとき,

  \frac{\Delta z}{\rho}=A\cos\alpha+B\sin\alpha+\varepsilon,
(2)

  \lim_{\rho\to 0}\frac{\Delta z}{\rho}=A\cos\alpha+B\sin\alpha
  =\frac{\partial z}{\partial x}\cos\alpha+\frac{\partial z}{\partial y}\sin\alpha.
この場合,\textstyle\lim_{\rho\to 0}\frac{\Delta z}{\rho}\Delta x=\rho\cos\alpha,\Delta y=\rho\sin\alpha なる方向への偏微分商というものである.(1) は成り立つときは各方向への偏微分商が存在して,しかもそれが (2) によって与えられる. z が微分可能なるとき,\Delta z の主要部なる \Delta x,\Delta y に関する一次式 \tfrac{\partial z}{\partial x}\Delta x+\tfrac{\partial z}{\partial y}\Delta yz全微分といい,それを dz で表わす.特に z=x,また z=y のとき dx=\Delta x,dy=\Delta y§13,参照).故に全微分は
(3)

  dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy.
z が微分可能なるときは dz=\frac{\partial z}{\partial x}\Delta x+\frac{\partial z}{\partial y}\Delta y(x,y) において曲面 z=f(x,y) に接する平面を表わす.この平面上の流通座標を X,Y,Z とすれば,dx,dy,dz はそれぞれ X-x,Y-y,Z-z に等しく,接平面の方程式は

  Z-z=\frac{\partial z}{\partial x}(X-x)+\frac{\partial z}{\partial y}(Y-y)
である.これが実は接平面の定義である.ただし我々は応用上点 (x,y) の近傍においてのみ (3) を用いるのである.

z=f(x,y) が或る領域の各点において微分可能であるとき,その領域において微分可能という.その場合 f(x,y) はもちろんその領域において連続である.

定理 26.
或る領域において \tfrac{\partial z}{\partial x},\tfrac{\partial z}{\partial y} が存在してかつ連続ならば,z はその領域において微分可能である.
[証]
\Delta x,\Delta y の代りに h,k と書けば
\begin{align}
  \Delta z&=f(x+h,y+k)-f(x,y)\\
  &=\{f(x+h,y+k)-f(x,y+k)\}+\{f(x,y+k)-f(x,y)\}.
\end{align}
x に関して平均値の定理を適用すれば

  f(x+h,y+k)-f(x,y+k)=hf_x(x+\theta h,y+k),\quad 0<\theta<1.
仮定によって f_x は連続だから,

  f_x(x+\theta h,y+k)=f_x(x,y)+\varepsilon
と置けば h\to 0,k\to 0 のとき \varepsilon\to 0. 次に y に関する偏微分が可能だから,

  f(x,y+k)-f(x,y)=kf_y(x,y)+\varepsilon'k
と置けば k\to 0 のとき \varepsilon'\to 0.故に

  \Delta z=hf_x(x,y)+kf_y(x,y)+h\varepsilon+k\varepsilon'.
|h|\leqq\rho,|k|\leqq\rho,\,(\rho=\sqrt{h^2+k^2}),従って |h\varepsilon+k\varepsilon'|\leqq(|\varepsilon|+|\varepsilon'|)\rho だから

  \Delta z=hf_x(x,y)+kf_y(x,y)+o\rho,
すなわち z は微分可能である.
[注意] 
定理 26 の仮定は過大である.上記証明では f_x だけの連続性を用いた.故に領域内で z_x,z_y が存在して[* 1],一点 (x,y) において,どちらかが連続ならば,その点において z は微分可能である.

  1. z_x,z_y\tfrac{\partial z}{\partial x},\tfrac{\partial z}{\partial y} の略記.

[編集] 23.微分の順序

f(x,y) をまず x に関して微分して,導函数 f_x(x,y) を得,次に f_xy に関して微分して第二階の導函数の一つである f_{xy} を得る.故に f_{xy}f_{yx} とは観念上別々の物である.然るに或る条件の下において,f_{xy}f_{yx} とが同一の函数になる.今そのうちで最も手近かなものを取るならば:

定理 27.
或る領域において f_{xy},f_{yx} が連続ならばその領域で f_{xy}=f_{yx}
[証]
領域内の任意の一点 (a,b) の近傍を考察する.簡単のために
(1)

  \Delta=f(a+h,b+k)-f(a+h,b)-f(a,b+k)+f(a,b)
と置く.すなわち図の記号を用いて
点 (a,b) の近傍

  \Delta=f(P_3)-f(P_1)-f(P_2)+f(P).
また
(2)

  \varphi(x)=f(x,b+k)-f(x,b)
と置く.然らば \varphi(a)=f(P_2)-f(P),\varphi(a+h)=f(P_3)-f(P_1),
(3)

  \Delta=\varphi(a+h)-\varphi(a).
仮定によって (a,b) の近傍[* 1]f_x が存在するから,(2) から
(4)

  \varphi'(x)=f_x(x,b+k)-f_x(x,b).
そこで x=ax=a+h との間の区間に関して,平均値の定理\varphi(x) 似適用すれば,

  \varphi(a+h)-\varphi(a)=h\varphi'(a+\theta h).\quad(0<\theta<1)
(3)(4) によって詳しく書けば
(5)

  \Delta=h\{f_x(a+\theta h,b+k)-f_x(a+\theta h,b)\}.
さて仮定によって,(a,b) の近傍で f_{xy} が存在するから,(5) の右辺に y=by=b+k との間の区間に関して,平均値の定理を適用すれば

  \Delta=hkf_{xy}(a+\theta h,b+\theta'k).\quad(0<\theta'<1)
仮定によって f_{xy} は点 (a,b) において連続である.故に
(6)

  \lim_{(h,k)\to(0,0)}\frac{\Delta}{hk}=f_{xy}(a,b).
x,hy,k とを交換して考察しても同様に
(7)

  \lim_{(h,k)\to(0,0)}\frac{\Delta}{hk}=f_{yx}(a,b)
を得る.(6)(7) を比較すれば,点 (a,b) において,すなわち領域内の各点において,
f_{xy}=f_{yx}.
[注意] 
上記の証明を再考してみよう.(6) を得るまでには,定理の仮定の一部分,すなわち領域において f_x,f_{xy} が存在することと,f_{xy} が点 (a,b) において連続であることだけを用いた.今その上に,領域内で f_y が存在することを仮定するならば,(1) から

  \frac{\Delta}{hk}=\frac{1}{h}\left\{
    \frac{f(a+h,b+k)-f(a+h,b)}{k}-\frac{f(a,b+k)-f(a,b)}{k}
  \right\},
従って k\to 0 のとき

  \frac{\Delta}{hk}\to\frac{1}{h}\{f_y(a+h,b)-f_y(a,b)\}.
然るに (6) によって,k\to 0,h\to 0 のとき,\tfrac{\Delta}{hk} は一定の極限値 f_{xy}(a,b) に収束する.故に h\to 0 のとき

  \lim\frac{1}{h}\{f_y(a+h,b)-f_y(a,b)\}=f_{xy}(a,b).
左辺の極限値は定義によって f_{yx}(a,b) であるから,
f_{yx}(a,b)=f_{xy}(a,b).

よって定理 27 の仮定を緩和して,次のようにいうことができる.

或る領域において,f_x,f_y,f_xy が存在して,領域内の一点において f_{xy} が連続ならば,その点において f_{yx} も存在し,かつ f_{xy}=f_{yx}Schwarz の定理).もちろん xy とを交換してもよい.

故に f_x,f_y が存在する場合,例えば f_{xy} を求めたときに,それが連続ならば,f_{yx} を求めるには及ばない.

定理 27 でも,またはそれを精密にした Schwarz の定理でも,定理の仮定は f_{xy}=f{yx} が成り立つための十分なる条件であるにすぎない.十分なる条件ならば,次のようにもいわれる.

或る領域において f_x,f_y が(存在して,それらが)領域内の一点において微分可能ならば,その点において f_{xy}=f_{yx}Young の定理).
この場合にも上記証明中の (5) までは通用する.(5) において h=k として f_x の微分可能性の仮定を用いて(§22
\begin{alignat}{2}
  &f_x(a+\theta h,b+h)=f_x(a,b)+\theta hf_{xx}(a,b)+hf_{xy}(a,b)&&+oh,\\
  &f_x(a+\theta h,b)=f_x(a,b)+\theta hf_{xx}(a,b)               &&+oh.
\end{alignat}
これを (5) に代入して,\Delta=h^2f_{xy}(a,b)+oh^2,故に

  \lim_{h\to 0}\frac{\Delta}{h^2}=f_{xy}(a,b).
仮定が x,y に関して対称的であるから,f_{xy}(a,b)=f_{yx}(a,b) を得る.
Young の定理では f_x,f_y の微分可能性,従って f_{xx},f_{xy},f_{yx},f_{yy} の存在を仮定する.しかしそれらの連続性を仮定しない.Schwarz の定理では f_x,f_y,f_{xy} の存在の上に f_{xy} の連続性を仮定するが,f_{yx}(および f_{xx},f_{yy})に関しては存在すらも仮定しない.場合に応じて便宜兼用すべきである.応用上は一般的に定理 27 で用が足りるであろう.
もちろん無条件で f_{xy}=f_{yx} とはいわれない.それを認識することは重要だから,今その一例を挙げておく.
\begin{cases}
  f(x,y)=xy\frac{x^2-y^2}{x^2+y^2},&(x,y)\ne(0,0)\\
  f(0,0)=0
\end{cases}
とする. (x,y)\ne(0,0) として計算すれば

  f_x(x,y)=\frac{3x^2y-y^3}{x^2+y^2}-\frac{2x^2y(x^2-y^2)}{(x^2+y^2)^2}.
x,y を交換して符号を変えれば f_y を得る.また

  f_{xy}(x,y)=\frac{x^2-y^2}{x^2+y^2}+\frac{8x^2y^2(x^2-y^2)}{(x^2+y^2)^3}.

(x,y)\ne(0,0) ならば,これは連続だから,f_{yx} に等しい.さて,\textstyle f_{xy}(0,y)=-1,(y\ne 0),\lim_{y\to 0}f_{xy}(0,y)=-1.然るに f_x(0,y)=-y,y\ne 0 で,f_x(0,0)=0 だから f_x(0,y)y=0 で連続.故に f_{xy}(0,0)=-1定理 23).同様に f_{yx}(x,0)=1 から f_{yx}(0,0)=1

第三階以上でも,導函数が連続ならば,それに達した微分の順序を変更してもよい.例えば f_{xxy}=(f_x)_{xy}=(f_x)_{yx}=f_{xyx} のように相接する二つの添字を交換してもよいから,それを繰返えして

  f_{xyz}=f_{xzy}=f_{zxy}=f_{zyx}=f_{yzx}=f_{yxz},

  f_{xxyy}=f_{xyxy}=f_{xyyx}=f_{yxxy}=f_{yxyx}=f_{yyxx},
 等々.
よって二つの変数の場合には第二階の導函数は

  f_{x^2}=\frac{\partial^2f}{\partial x^2},\quad
  f_{xy}=\frac{\partial^2f}{\partial x\partial y},\quad
  f_{y^2}=\frac{\partial^2f}{\partial y^2}
の三つで,第 n 階のは

  f_{x^ry^s}=\frac{\partial^nf}{\partial x^r\partial y^s}\qquad
  (r+s=n,\, s=0,1,2,\ldots,n)
n+1 個である.三次元以上もこれに準ずる.
  1. 近傍といっても,矩形 PP_1P_2P_3 を全く含めていう.h,k は任意に小さく取れるから,近傍といってよろしい.

[編集] 24.高階の全微分

u=f(x,y) の第一階の全微分

  du=\frac{\partial u}{\partial x}dx+\frac{\partial u}{\partial y}dy
において,もしも \tfrac{\partial u}{\partial x},\tfrac{\partial u}{\partial y} が微分可能ならば,x,y に関する du の全微分として d^2u を得る.すなわち x,y を独立変数(h=dx,k=dy は前の通り)とすれば
\begin{align}
  d^2u=d(du)&=\frac{\partial}{\partial x}\left(
    \frac{\partial u}{\partial x}h+\frac{\partial u}{\partial y}k
  \right)h+\frac{\partial}{\partial y}\left(
    \frac{\partial u}{\partial x}h+\frac{\partial u}{\partial y}k
  \right)k\\
  &= \frac{\partial^2 u}{\partial x^2}h^2
    +\frac{\partial^2 u}{\partial x\partial y}hk
    +\frac{\partial^2 u}{\partial y^2}k^2\\
  &= \frac{\partial^2 u}{\partial x^2}dx^2
    +\frac{\partial^2 u}{\partial x\partial y}dxdy
    +\frac{\partial^2 u}{\partial y^2}dx^2.
\end{align}
同様に
d^3u=
  \frac{\partial^3 u}{\partial x^3}dx^3
 +3\frac{\partial^3u}{\partial x^2\partial y}dx^2dy
 +3\frac{\partial^3u}{\partial x\partial y^2}dxdy^2
 +\frac{\partial^3 u}{\partial y^3}dy^3.
一般に
d^n u=
  \frac{\partial^n u}{\partial x^n}dx^n+\cdots
 +\binom{n}{k}\frac{\partial^n u}{\partial x^k\partial y^{n-k}}dx^k dy^{n-k}
 +\cdots+\frac{\partial^n u}{\partial y^n}dy^n.
これを

 d^n u=\left(
  \frac{\partial}{\partial x}dx+\frac{\partial}{\partial y}dy
 \right)^n u
と書けばわかりよい. 変数が三つ以上ならば同じようにして
\begin{align}
 d^2 u=\frac{\partial^2 u}{\partial x^2}dx^2
  &+\frac{\partial^2 u}{\partial y^2}dy^2
   +\frac{\partial^2 u}{\partial z^2}dz^2\\
  &+2\frac{\partial^2 u}{\partial x\partial y}dxdy
   +2\frac{\partial^2 u}{\partial x\partial z}dxdz
   +2\frac{\partial^2 u}{\partial y\partial z}dydz+\cdots,
\end{align}
一般に
 
 d^n u=\left(
   \frac{\partial}{\partial x}dx
  +\frac{\partial}{\partial y}dy
  +\frac{\partial}{\partial z}dx+\cdots
 \right)^n u.
合成函数
ux,y の函数で,x,yt の函数ならば,ut の函数である. もしも ux,y に関して,また x,yt に関して連続[または微分可能]ならば,ut に関して連続[または微分可能]である(§15 参照).
微分可能の場合に \tfrac{du}{dt} を求めてみよう.
(1)

  \Delta u=u_x\Delta x+u_y\Delta y+o(\sqrt{\Delta x^2+\Delta y^2}).
ここで \Delta x,\Delta yt の変動 \Delta t に対応するものとすれば
(2)

  \Delta x=x'\Delta t+o(\Delta t),\quad \Delta y=y'\Delta t+o(\Delta t).
記号 o41 頁で述べた通り. (2)(1) へ持ち込めば

  \Delta u=(u_x x'+u_y y')\Delta t+o(\Delta t).
従って \textstyle \lim_{\Delta t\to 0}\frac{\Delta u}{\Delta t} が存在して,その値は

  \frac{du}{dt}=u_xx'+u_yy'.\quad\left(x'=\frac{dx}{dt},y'=\frac{dy}{dt}\right)
第二階以上の微分可能性を仮定すれば,これから
\begin{align}
  \frac{d^2u}{dt^2}&=\frac{du_x}{dt}x'+u_x x''+\frac{du_y}{dt}y'+u_y y''\\
 &=(u_{xx}x'+u_{xy}y')x'+(u_{xy}x'+u_{yy}y')y'+u_x x''+u_y y''\\
 &=u_{xx}u'^2+2u_{xy}x'y'+u_{yy}y'^2+u_x x''+u_y y''.
\end{align}
初めの三項は d^2 u の式と同じ組み立てであるが,それに x'',y'' を含む終わりの二項が加わるのである. x および y が二つの変数 \xi,\eta の函数ならば,u もまた \xi,\eta の函数である.その場合 u_\xi,u_\eta を求めるには上記の結果において x',y' にそれぞれ x_\xi,y_\xi または x_\eta,y_\eta を代用すればよい.すなわち

  u_\xi=u_x x_\xi+u_y y_\xi,\quad u_\eta=u_x x_\eta+u_y y_\eta.
同様に
\begin{align}
  &u_{\xi\xi}= u_{xx}x_\xi^2+2u_{xy}x_\xi y_\xi+u_{yy}y_\xi^2+u_x x_{\xi\xi}+u_y y_{\xi\xi},\\
  &u_{\xi\eta}= u_{xx}x_\xi y_\eta+u_{xy}(x_\xi y_\eta+x_\eta y_\xi)+u_{yy}y_\xi y_\eta +u_x x_{\xi\eta}+u_y y_{\xi\eta},\\
  &u_{\eta\eta}= u_{xx}x_\eta^2+2u_{xy}x_\eta y_\eta+u_{yy}y_\eta^2+u_x x_{\eta\eta}+u_y y_{\eta\eta}.
\end{align}
[例] u=u(x,y) において,x,y に関する偏微分商を極座標に変換すること.
\begin{align}
  &x=r\cos\theta, & &y=\sin\theta,\\
  &r=\sqrt{x^2+y^2}, & &\theta=\mathrm{arc\,tan\,}\frac yx.
\end{align}
ur,\theta の函数で,その r,\thetax,y の函数であるとみて,計算するのである.
\begin{align}
  &r_x=\frac{x}{r}=\cos\theta, & &r_y=\frac{y}{r}=\sin\theta.\\
  &\theta_x=-\frac{y}{r^2}=-\frac{\sin\theta}{r}, &
  &\theta_y=\frac{x}{r^2}=\frac{\cos\theta}{r}.
\end{align}
\begin{align}
  &u_x=u_r u_x+u_\theta \theta_x=u_r\cos\theta-\frac{u_\theta}{r}\sin\theta,\\
  &u_y=u_r r_y+u_\theta \theta_y=u_r\sin\theta+\frac{u_\theta}{r}\cos\theta,
\end{align}
\begin{align}
  &u_{xx}=u_{rr}\cos^2\theta+\frac{u_{\theta\theta}}{r^2}\sin^2\theta
     -2\frac{u_{r\theta}}{r}\cos\theta\sin\theta
     +\frac{u_r}{r}\sin^2\theta+2\frac{u_\theta}{r^2}\cos\theta\sin\theta,\\
  &u_{yy}=u_{rr}\sin^2\theta+\frac{u_{\theta\theta}}{r^2}\cos^2\theta
     +2\frac{u_{r\theta}}{r}\cos\theta\sin\theta
     +\frac{u_r}{r}\cos^2\theta+2\frac{u_\theta}{r^2}\cos\theta\sin\theta.
\end{align}
これから

  \frac{\partial^2u}{\partial x^2}+\frac{\partial^2u}{\partial y^2}
 = \frac{\partial^2u}{\partial r^2}
  +\frac{1}{r^2}\frac{\partial^2u}{\partial\theta^2}
  +\frac{1}{r}\frac{\partial u}{\partial r}
を得る.

[編集] 25.Taylor の公式

定理 28.
或る区間において,f(x) は第 n 階まで微分可能とする.然らばその区間において,a は定点,x は任意の点とするとき
(1)

f(x)=f(a)+(x-a)\frac{f'(a)}{1!}
 + (x-a)^2\frac{f''(a)}{2!}
 + \cdots
 + (x-a)^{n-1}\frac{f^{(n-1)}(a)}{(n-1)!}
 + (x-a)^n\frac{f^{(n)}(\xi)}{n!}.
ただし
\xi = a+\theta(x-a),\quad 0<\theta<1
すなわち \xiax との中間の或る値である.

これを Taylor の公式という.

上記公式の右辺で,最後の項だけは,他の項と違って,a の代わりに ax の中間値 \xi に対する導函数 f^{(n)} の値が書いてある.この最後の項を剰余項という.それを R_n と書けば
(2)

 R_n = (x-a)^n\frac{f^{(n)}(\xi)}{n!}.
問題の核心はこれの証明である.
[証]
(3)
F(x) = f(x)
  -\left\{
     f(a)
     + (x-a)\frac{f'(a)}{1!} + \cdots
     + (x-a)^{n-1}\frac{f^{(n-1)}(a)}{(n-1)!}
  \right\}
と置く.F(x) がすなわち R_n である.さて仮定によって,F(x) は第 n 階まで微分可能であるが,計算してわかるように
(4)

\begin{align}
 F(a)=F'(a)=&\cdots=F^{(n-1)}(a)=0 \\
 F^{(n)}(x)&=f^{(n)}(x).
\end{align}
さて定理 21F(x)G(x)=(x-a)^n とに応用する.然らば F(a)=0, G(a)=0 だから

 \frac{F(x)-F(a)}{G(x)-G(a)} = \frac{F(x)}{(x-a)^n} = \frac{F'(x_1)}{n(x_1-a)^{n-1}},
x_1ax との中間値である.同様に,F'(a)=0, G'(a)=0 から

 \frac{F'(x_1)}{n(x_1-a)^{n-1}} = \frac{F''(x_2)}{n(n-1)(x_2-a)^{n-2}},
x_2ax_1 の,従って ax との中間値である. これは右辺に F^{(n)} がでてくるところまで続けられるから,結局 (4) によって

 \frac{F(x)}{(x-a)^n} = \frac{F^{(n)}(\xi)}{n!} = \frac{f^{(n)}(\xi)}{n!},
を得る.ここで \xiax との中間値である.すなわち
(5)
F(x)=(x-a)^n\frac{f^{(n)}(\xi)}{n!}
左辺の F(x)(3) によって詳しく書けば (1) を得る.
(証終)
Taylor の公式 (1) で,n=1 とすれば
f(x)=f(a)+(x-a)f'(\xi).
これは平均値の定理である.すなわち,定理 28平均値の定理の拡張である.

上記証明において f^{(n)}(x)(5) でのみ用いたから,f^{(n)}(x)a を一端とする開区間で存在するとしても十分である.

もしも反対に,第 n 階に関しては x=a においてのみ f^{(n)}(a) の存在を仮定するならば,それからさかのぼって a の近傍で n-1 階までの導函数は存在することになるが,その場合,次の定理が成り立つ.

定理 29.
x=a を含む或る区間において f(x) が第 n-1 階まで微分可能で,点 x=a において f^{(n)}(a) が存在するならば
(6)

 f(x) = f(a)+(x-a)\frac{f'(a)}{1!}
  + (x-a)^2\frac{f''(a)}{2!}
  + \cdots
  + (x-a)^n\frac{f^{(n)}(a)}{n!}
  + o(x-a)^n.
[証]
F(x)(3) の通りとすれば,平均値の定理によって,前のように

 \frac{F(x)}{(x-a)^n} = \frac{F^{(n-1)}(\xi)}{n!(\xi-a)},\ \ a \lessgtr \xi \lessgtr x,
までは得られる.今度は F^{(n)}(a)=f^{(n)}(a) が存在するのだが,前の通り F^{(n-1)}(a)=0 だから,x \to a 従って \xi\to a のとき

 \lim_{x \to a}\frac{F^{(n-1)}(\xi)}{\xi-a}
  = \lim_{\xi \to a}\frac{F^{(n-1)}(\xi)-F^{(n-1)}(a)}{\xi-a}
  = F^{(n)}(a)
  = f^{(n)}(a).
すなわち

 \lim_{x \to a}\frac{F(x)}{(x-a)^n}
  =\frac{f^{(n)}(a)}{n!},
すなわち

 F(x)=(x-a)^n\frac{f^{(n)}(a)}{n!}+o(x-a)^n,
それが証明すべき事であった.

定理 28 においては,f^{(n)}(x) が区間内で存在することを仮定したが,もしもその上に f^{(n)}(x)x=a において連続であることを仮定するならば,R_n(2) のように書かれるから,定理 29 が得られる.しかし f^{(n)}(a) の存在だけを仮定して,定理 29 は既に成り立つのである.

定理 29n=1 とすれば

 f(x) = f(a)+(x-a)f'(a)+o(x-a).
f'(a) が存在すれば,これは成り立つ(f'(a) の定義!).定理 29 はそれの拡張である.しかし高階導函数は導函数の導函数として間接に定義された. f'(a) の例に倣って

 f(x) = f(a)+A_1(x-a)+A_2\frac{(x-a)^2}{2}+\cdots+A_n\frac{(x-a)^n}{n!}+o(x-a)^n
における係数 A_i として逐次の f^{(i)}(a) が定義されたのではない.一般函数の場合,そうは行きかねる.そこに導函数の複雑性がある. 定理 28 または定理 29 を区間 a \leqq x < b に適用する場合には f^{(i)}(a) は右への微分商の意味で存在すればよい.区間  b <x \leqq a の場合には左への微分商でよい.そのつもりで証明を読み返えしてみればわかるであろう.
[附記] 
定差
y=f(x) において,x に一定の増加 \Delta x (ただし  \Delta x \gtrless 0) を与えるとき,それに対応する y の増加

 \Delta y = \Delta f(x) = f(x+\Delta x)-f(x)
y定差difference)または差分という.\Delta yx の函数とみて,増加 \Delta x に対するそれの定差を y の第二階の定差といい,それを \Delta^2 y と書く.すなわち
\begin{align}
  \Delta^2 y 
    &= \Delta f( x + \Delta x ) - \Delta f( x ) \\
    &= \{f(x+2\Delta x)-f(x+\Delta x)\}-\{f(x+\Delta x)-f(x)\} \\
    &= f(x+2\Delta x)-2f(x+\Delta x)+f(x).
\end{align}
同様にして,第 n 階の定差は
(7)
 \begin{align}
  \Delta^n y 
    &= \Delta^{n-1}f(x+\Delta x)-\Delta^{n-1}f(x) \\
    &= f(x+n\Delta x)-\binom{n}{1}f(x+(n-1)\Delta x)
      + \binom{n}{2}f(x+(n-2)\Delta x)+\cdots+(-1)^nf(x).
\end{align}
例えば,g(x)=ax^n+\cdotsn 次の多項式として,\Delta x=h と書けば

  \Delta g(x) = nahx^{n-1} + \cdots,\ \ \Delta^2g(x) = n(n-1)ah^2x^{n-2} + \cdots,
(8)

  \Delta^n g(x) = n!ah^n.\ \ \Delta^{n+1}g(x)=0.
さて定理 29 の仮定の下において,十分小なる \Delta x に関して

  f(x+k\Delta x) = \sum^n_{\nu=0}(k\Delta x)^\nu\frac{f^{(\nu)}(x)}{\nu!}+o(\Delta x)^n.
これを (7) へ持ち込めば
(9)
\begin{align}
  \Delta^n y 
  &= \sum^n_{k,\nu=0}(-1)^{n-k}\binom{n}{k}
     k^\nu\Delta x^\nu\frac{f^{(\nu)}(x)}{\nu!}
     +o(\Delta x)^n \\
  &= \sum^n_{\nu=0}\Delta x^\nu\frac{f^{(\nu)}(x)}{\nu!}
     \left(\sum^n_{k=0}(-1)^{n-k}\binom nk k^\nu\right)
     +o(\Delta x)^n.
\end{align}
さて

  \sum^n_{k=0}(-1)^k\binom nk k^\nu = \begin{cases}
   0,\ \ (\nu=0,1,\cdots,n-1)\\
   (-1)^n n!\ \ (\nu=n)
  \end{cases}
これは y=x^n とすれば,(9) から得られる.そのとき (8) によって \Delta^n y = n!\Delta x^n であるから.
故に
\Delta^n y = (\Delta x)^nf^{(n)}o(\Delta x)^n,
従って

  \lim_{\Delta x\to0}\frac{\Delta^n y}{\Delta x^n} = f^{(n)}(x).
これは \textstyle \frac{\Delta y}{\Delta x} \to f'(x) の拡張であるが,ここでも定理 29 と同様に f^{(n)}(x) の存在を仮定して証明したのだから,\textstyle \frac{\Delta^n y}{\Delta x^n} が存在するとき,それが f^{(n)}(x) であるというのではない.換言すれば f^{(n)}(x) が高階の定差によって直接に定義されたのではない.
二次元以上における Taylor の公式
Taylor の公式は二次元以上にも拡張される.今二次元としていう.或る領域において f(x,y)n 回まで微分可能であるとき A=(x,y) を領域内の一点とし,また |h|, |k| を十分小さく取って,点 B=(x+h,y+k) もまた線分 AB も全く領域内にあらしめるならば
F(t) = f(x+ht, y+kt)
は区間 0 \leqq t \leqq 1(線分 AB 上)における t の函数で,その区間において定理 28 の仮定が成り立つ,すなわち

  F'(t) = \left( h\frac{\partial}{\partial x} + k \frac{\partial}{\partial y} \right) f(x+ht, y+kt), \cdots ,

  F^{(n)}(t) = \left( h\frac{\partial}{\partial x} + k \frac{\partial}{\partial y} \right)^n f(x+ht, y+kt).
故に

  F(t) = F(0) + tF'(0) + \cdots + \frac{t^{n-1}}{(n-1)!}F^{(n-1)}(0) + \frac{t^n}{n!}F^{(n)}(\theta t), \ \ 0<\theta<1.
そこで t=1 とすれば
\begin{align} f(x+h,y+k) =
  & f(x,y) + df(x,y) + \frac{1}{2} d^2f(x,y) + \cdots \\
  & +\frac{1}{(n-1)!}d^{n-1}f(x,y)
    +\frac{1}{n!} d^n f(x+\theta h, y+\theta k).
\end{align}
略記法 d^\nu f§24 の通りである.すなわち
\begin{align}
  df(x,y) &= hf_x(x,y) + kf_y(x,y) \\
 d^2(x,y) &= h^2 f_{xx}(x,y) + 2hkf_{xy}(x,y) + k^2f_{yy}(x,y), \cdots .
\end{align}
ただし最後の項(剰余項)においては,変数 xy のところへ x+\theta hy+\theta k を入れるのである. 特に n=1 とすれば

  f(x+h,y+k) - f(x,y) = h f_x(x+\theta h, y+\theta k) + k f_y(x+\theta h, y+\theta k)
(x+\theta h, y+\theta k) は線分 AB 上の或る点である.これが二次元における平均値の定理である. もしも定理 29 のように,第 n 階の微分に関しては点 A=(x,y) においてのみ,その可能性を仮定するならば

  f(x+h,y+k) = f(x,y) + df(x,y) + \frac{d^2f(x,y)}{2!} + \cdots + \frac{d^n(x,y)}{n!} + o\rho^n,

  \rho = \sqrt{h^2+k^2}.
これを証明するには

  F(t) = f \left(x+\frac{h}{\rho}t, y+\frac{k}{\rho}t\right)
と置いて

  F(t) = F(0) + tF'(0) + \cdots + \frac{t^n F^{(n)}(0)}{n!} + ot^n
において t=\rho とすればよい.ここで ot^n/t^n は線分 AB の方向に無関係に(一様に)0 に収束する.それは定理 29 の証明を参照して容易に証明される.
Taylor 級数
定理 28 において,f(x) の各階の微分が可能で,区間内のすべての x に関して
\lim_{n \to \infty}R_n = 0,
すなわち

  f(x) = \lim_{n \to \infty} \sum^n_{\nu=0}(x-a)^\nu\frac{f^{(\nu)}(a)}{\nu!}
であるとき,右辺を無限級数の形に書けば,区間内で
(10)

f(x)=f(a)+(x-a)\frac{f'(a)}{1!}
 + (x-a)^2\frac{f''(a)}{2!}
 + \cdots
 + (x-a)^n\frac{f^{(n)}(a)}{n!}
 + \cdots .
これを f(x)Taylor 級数という.特に a=0 であるときは Maclaurin の級数という.

Taylor 級数は解析学において最も重要である.実用上の函数は Taylor 級数に展開されるが,その展開を定理 28 のみによって直接の計算で求める事は技術上得策でない.それは後に譲って(第 5 章),ここでは最も簡単な一,二の例を挙げておく.

[例 1]
f(x)n 次の多項式ならば f^{(n+1)}(x)=0 だから,(10) は有限級数である.それは f(x)(x-a) の多項式で表すものにほかならない.
[例 2]
f(x)=e^x この場合にはすべての n に関して f^{(n)}(x)=e^x.故に a=0 とすれば f^{(n)}(0)=1
R_n = \frac{x^n}{n!}e^{\theta x},\ \ 0<\theta<1.
故に
|R_n| < \frac{|x|^n}{n!}e^{|x|}.
x を固定すれば \textstyle \lim\frac{|x|^n}{n!}=0[例 3]).故に -\infty < x < \infty において

  e^x = 1 + \frac{x}{1!} + \frac{x^2}{2!} + \cdots + \frac{x^n}{n!} + \cdots .
特に x=1 のとき,剰余項を入れて書けば
(11)

  e = 1 + \frac{1}{1!} + \frac{1}{2!} + \cdots + \frac{1}{n!} + R_{n+1},
R_{n+1} = \frac{e^\theta}{(n+1)!} < \frac{3}{(n+1)!}.
\begin{align}
  1+\frac{1}{1!}+\frac{1}{2!}&=2.5\\[5pt]
  \frac{1}{3!}&=0.1666666\\[3pt]\frac{1}{4!}&=0.0416666\\[3pt]
  \frac{1}{5!}&=0.0083333\\[3pt]\frac{1}{6!}&=0.0013888\\[3pt]
  \frac{1}{7!}&=0.0001984\\[3pt]\frac{1}{8!}&=0.0000248\\[3pt]
  \frac{1}{9!}&=0.0000027\\[3pt]\frac{1}{10!}&=0.0000002\\[3pt]\hline
   e &\fallingdotseq 2.7182814
\end{align}
e の計算
e\textstyle\lim(1+\frac 1n)^n として定義されたけれども,この数列は収束緩慢だから計算に適しない.今 (11) を用いて\textstyle\frac1{n!} を小数第七位まで計算して行けば,n=10 までは右のようになる.それらを加えて e の近似値を得るが,n \geqq 3 なる 8 項において各 \textstyle \frac1{10^7} 未満の誤差があり,また剰余項

  R_{11} < \frac{3}{11!} = \frac{1}{10!}\frac{3}{11} < \frac{1}{10^7}
だから,誤差は \textstyle \frac1{10^6} 以下である.実際は e=2.718281828\cdots
e が無理数である事の証明
仮りに e を有理数として,\textstyle e=\frac mn としてみる.m, n は整数である.然らば n!e は整数.従って (11) によって
n!R_{n+1} = \frac{e^\theta}{n+1} > 0\quad (0<\theta<1)
は整数でなければならない.従って
1 \leqq \frac{e^\theta}{n+1} < \frac{3}{n+1},
すなわち n+1<3, n<2, n=1.然らば e=m で,e は整数でなければならない.2<e<3 だから,これは不合理である.
[例]
 \begin{align}
   \sin x &= x - \frac{x^3}{3!} + \frac{x^5}{5!} -+ \cdots, \\
   \cos x &= x - \frac{x^2}{2!} + \frac{x^4}{4!} -+ \cdots, 
\end{align}
x は任意である.ここでも |R_n| \to 0

[編集] 26.極大極小

函数 f(x) が点 x=x_0 において取る値 f(x_0)x_0 の近傍で,x_0 以外の点 x における f(x) の値よりも大[あるいは小]なるとき,f(x_0極大値[あるいは極小値],x_0f(x)極大点[あるいは極小点]といい,極大値,極小値を総称して極値という.また x_0極値点という.

すなわち x_0f(x) の極小点であるとは
0 < |x-x_0| < \delta なるとき f(x)-f(x_0) > 0
なる \delta が存在することである.もしも不等号 >\geqq に換えるならば,f(x_0) を弱い意味の極小という.極大も同様である.
極大極小と最大または最小
この定義によれば f(x) の極値と,全区域における f(x) の最大または最小値とは,別々の概念であるから,極大値がかえって極小値よりも小でありうる.極大極小は或る一点の近傍のみに関していうのである.すなわち局所的(im Kleinenlocal)の最大最小である.
定理 30.
x_0 を函数 f(x) の定義域の内点とする.
(1º)
f(x)x_0 において微分可能なるとき,もしも,x=x_0 において f(x) が極値をとるならば,f'(x_0)=0f'(x_0) が存在するとき,これが極値の必要条件である.
(2º)
f(x) は,x_0 で連続で,x_0 の近傍で x_0 以外では,微分可能とする.もしも f'(x) がその点 x=x_0 で符号を変ずるならば,f(x_0) は極値である.詳しくいえば,x が増大しつつ点 x_0 を通過するとき,f'(x) の符号が + から - に変わるならば,f(x_0) は極大値,また反対に - から + に変わるならば f(x_0) は極小値である.
(3º)
f(x)x_0 の近傍で微分可能で,f''(x_0) が存在するとき,f'(x_0)=0, f''(x_0)>0 ならば f(x_0) は極小値で,f'(x_0)=0, f''(x_0)<0 ならば f(x_0) は極大値である.
[証]
(1º)
定理 19 の証明中に述べたようにして,x_0f(x) が直値をとる今の場合,f'(x_0) の存在だけから f'(x_0)=0 を得る.
(2º)
x<x_0 なるとき f'(x)>0 ならば,f(x) は単調に増大し,x>x_0 なるとき f'(x)<0 ならば,f(x) は単調に減少する(定理22).仮定によって,f(x)x_0 で連続だから f(x_0) は極大値である. 反対の場合には f(x_0) は極小値である.
(3º)
f''(x_0) \gtrless 0 に従って,f'(x) は点 x_0 において増大または減少する(49頁,[注意]).従って,f'(x)=0 ならば x=x_0f'(x) は符号を変ずるから.
[注意] 
f''(x_0)=0 なるときには,一般的には,なんらの断言もできない。この場合,もしも f'''(x_0) \neq 0 ならば,
f(x) - f(x_0) = \frac{1}{6}(x-x_0)^3f'''(x_0)+o(x-x_0)^3. (定理29
然らば |x-x_0| が十分小なる間は,右辺の符号はその第一項が決定するから,f(x)-f(x_0)x=x_0 において符号を変ずる.故に f(x_0) は極値でない.この場合,f(x_0)停留値x_0停留点という.停留(stationary)というのは,f(x)-f(x_0)|x-x_0| に関して高位(三位)の微小数で,x_0 において f(x) の変動が緩慢であることを示唆するのである.

またもし f^{(3)}(x_0)=0 で,f^{(4)}(x_0) \neq 0 ならば f^{(4)}(x_0) \gtrless 0 に従って,f(x_0) は極大または極小である.

一般に f'(x_0)=0, f''(x_0)=0,\ldots, f^{(k-1)}(x_0)=0f^{(k)}(x_0) \ neq 0 ならば,k が奇数のとき x_0 は極値点でないが,k が偶数のときには極値点である.
[例]
一つの平面の両側に二点 A, B が与えられているとする.動点 P がこの平面の両側で,それぞれ一定の速さ c_1, c_2 をもって運動するとき,PA から B まで最短の時間で行くべき経路を求めること.
[解]
AからBへの最短経路
問題の要求によれば,平面の両側で P は直線上を進行することを要し,かつ A, B を含みその平面に垂直なる平面上において運動することを要することは明白だから,その垂直面上で考察すればよい.すなわち問題は次のように簡約される.

平面上の直角座標に関して x 軸の上側と下側とに点 A=(0,h_1), B=(a,-h_2) が与えられているとする (a>0).今 P=(x,0)x 軸上の点とするとき,\textstyle \frac{AP}{c_1}+\frac{BP}{c_2} を最小ならしめる点 P の位置を決めること.

さて図において O の左方,または M の右方にある点は問題外であること明白である.故に問題は区間 0\leqq x\leqq a において
f(x) = \frac{\sqrt{h_1^2+x^2}}{c_1} + \frac{\sqrt{h_2^2+(a-x)^2}}{c_2}
の最小値を求めることに帰する. 上記区間内で,f(x) は微分可能である.実際,計算を実行すれば

  f'(x) = \frac{1}{c_1}\cdot\frac{x}{\sqrt{h_1^2+x^2}} - \frac{1}{c_2}\cdot\frac{a-x}{\sqrt{h_2^2+(a-x)^2}}
を得る.

そこで,まず条件 f'(x)=0 を考察する(図を参照).

f'(x) の式の第一項は
(1)

  \frac{1}{c_1}\frac{x}{\sqrt{h_1^2+x^2}} = \frac{\sin\alpha}{c_1}.
これは [0,a] において x が増大するに従って単調に増大する.また第二項の
(2)

  \frac{1}{c_2}\frac{a-x}{\sqrt{h_2^2+(a-x)^2}} = \frac{\sin\beta}{c_2}
は,x が増大するに従って減少する.

故に (1)(2) との差である f'(x) は区間 [0,a] において単調に増大する.そうして x=0 であるとき f'(x)<0, x=a であるとき f'(x)>0.故に f'(x) は区間 (0,a) においてただ一回0になり,そのとき f(x) は極小値を取る.

f'(x) が 0 になるところを x=x_0 とすれば,(0,x_0) では f'(x)<0 だから f*(x) は減少し,x_0,a では f'(x)>0 だから f(x) は増大する.故に f(x_0) は最小値である.点 x_0 においては

  \frac{\sin\alpha}{\sin\beta} = \frac{c_1}{c_2}.
 [光の屈折率]
多変数の函数の極値も同様に定義される.今二次元についていえば,P_0=(x_0,y_0) の近傍で,P_0 以外の各点 P=(x,y) において
f(P)<f(P_0) [あるいは f(P)>f(P_0)
であるとき f(P_0) を極大[あるいは極小]値という. この定義によれば,f(x_0,y_0) が極値を取るときには,x または y のみを変動させても f(x,y_0) または f(x_0,y) はそれぞれ x=x_0 または y=y_0 において極値を取るから
f_x(x_0,y_0)=0,\quad f_y(x_0,y_0)=0.
これは極値の必要条件である. この条件の下において,
(3)
f(x,y)-f(x_0,y_0)
  = \frac12\{a(x-x_0)^2+2b(x-x_0)(y-y_0)+c(y-y_0)^2\}+o\rho^2,
ただし,

  a=f_{xx}(x_0,y_0),\quad b=f_{xy}(x_0,y_0),\quad c=f_{yy}(x_0,y_0),
  \quad \rho=\sqrt{(x-x_0)^2+(y-y_0)^2}.
\rho が十分小さい間は,(3) の右辺の符号を決定するものは二次式
aX^2+2bXY+cY^2\quad(X=x-x_0,Y=y-y_0)
である.そこで三つの場合が生ずる.
(1º)
ac-b^2>0.
二次式は定符号で,a が(従って c も)正なるか負なるかに従って,常に正または常に負である.前の場合には f(P_0) は極小,後の場合には極大である.
(2º)
ac-b^2<0.
二次式は不定符号,従って P_0 の近傍で f(P)>f(P_0) にも f(P)<f(P_0) にもなるから,f(P_0) は極値でない.
(3º)
ac-b^2=0.
二次式は完全平方である.この場合には第三階以上の微分を考慮しなくては,何も断言できないが,一般論ははなはだ煩雑である.今簡単のために座標を変換して (x_0,y_0)=(0,0) とし,またこの場合完全平方である上記の二次式を y^2 として(すなわち a=0,b=0,c=1),二,三の例を掲げる.
[例 1]
z=y^2(0,0) において z は最小値 0 を取るけれども,(x,0) において z=0 だから,これは弱い意味での極小である.
[例 2]
z=y^2+x^4(0,0) において極小.
[例 3]
z=y^2-x^3(0,0) は極値点でない.(x,y) が次の図(左)で影をつけたところにあるとき z<0,その外部では z>0
[例 4]
z=(y-x^2)(y-2x^2).同上,図(右). この場合には (x,y)(0,0) からの任意の半直線上を動いても,z は増大する.それでも (0,0) は極小値を与えない.
z=y^2-x^3 z=(y-x^2)(y-2x^2)
変数三個以上の場合も同様で,f(x_1,x_2,\ldots,x_n) に関して点 A=(a_1,a_2,\ldots,a_n) が極値を与えるためには,その点において
f_{x_1}=0,f_{x_2}=0,\ldots,f_{x_n}=0
であることが必要である.そのとき A における f_{x_ix_j}(A)=a_{ij} と置けば

  f(a_1+\xi_1,\ldots,a_n+\xi_n)-f(a_1,\ldots,a_n)
  =\frac12 Q(\xi_1,\xi_2,\ldots,\xi_n) + o\rho^2,
ただし

  Q(\xi_1,\xi_2,\ldots,\xi_n)=\sum_{i,j=1}^n a_{ij}\xi_i\xi_j
また
\rho=\sqrt{\sum_{i=1}^n \xi_i^2}.
もしも a_{ij} の行列式
D=\begin{vmatrix}
  a_{11} & a_{12} & \cdots & a_{1n} \\
  a_{21} & a_{22} & \cdots & a_{2n} \\
  \cdots & \cdots & \cdots & \cdots \\
  a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}\ne 0\quad(a_{ij}=a_{ji})
ならば,A が極値点であるか,ないかに関して,一定の断言ができる. 二次形式 Q が定符号ならば,その符号が正のとき極小,負のとき極大である.その判別法は D の首座行列式
D_k=\begin{vmatrix}
  a_{11} & a_{12} & \cdots & a_{1k} \\
  a_{21} & a_{22} & \cdots & a_{2k} \\
  \cdots & \cdots & \cdots & \cdots \\
  a_{k1} & a_{k2} & \cdots & a_{kk}
\end{vmatrix}\quad(k=1,2,\ldots,n)
の符号による[* 1].すなわち D_k がすべて正ならば極小で,また D_k の符号が (-1)^k ならば極大である.

二次形式 Q が不定符号ならば,f(A) は極値でない.D\ne 0 で,D_k の符号が上記の条件に適合しないときがそれである.

D=0 ならば,第二階の微分だけではなんとも断言ができない.

最大最小の問題は昔から数学者の興味をそそったものだが,その一つの原因は個々の問題に特別の工夫を要したところにあったのであろう.その点,今も昔も同様だけれども,微分法以後は,少くとも極大極小の必要条件は機械的に得られることになり,また近世に至って Weierstrass定理 13)によって,閉区域における連続函数の最大最小値の存在が確定したのである.

Steiner は最大最小に関する幾何学上の多くの問題を巧妙な方法で解いたが,その方法の核心は,解析的にいえば,微分法による極値の必要条件を幾何学的に求めるところにあった.彼の論証は正確ではなかったけれども,彼は非凡な洞察力によって,結果において正鵠を逸しなかったのである.Steiner が得た結果は,現代的の精密論法によって,大概すべて正当化されている.今この間の消息を説明するために,最も簡単な一例を取る.
[例 1]
周が与えられた三角形の面積の最大値を求めること.
[解]
周を 2p,辺を x,y,z,面積を S として,S の代りにその平方を f(x,y) とすれば
(4)
f(x,y)=p(p-x)(p-y)(p-z),\quad z=2p-x-y
で独立変数を x,y とすれば,それの変動する範囲は領域
(5)
(K)\quad 0<x<p,\quad 0<y<p,\quad p<x+y
である.
KaisekiGairon-2-26-fig5.png
さて三角形の一辺 y を固定すれば,最大面積の場合 x=z でなくてはならないことは幾何学的に明白である.これは f_x=0 を解いたのである.同様に f_y=0 から y=z を得る.すなわち
(6)
x=y=z=\frac23p.

この関係から(Steiner のように),直ちに正三角形が求めるものであると断定することは,もちろん不当である.我々の知りえたものは‘もしも最大値があるならば,それは正三角形によってのみ与えられる’ことだけである.さて f(x,y) は連続であるが,(5) は閉区域でないから,最大の存在は保証されていない.ここが問題の急所である.

今の場合,幸にして Weierstrass の定理によって,無造作にこの関門を通過することができる.今領域 K に境界点をつけ加えて,閉区域

  [K]\quad 0\leqq x\leqq p,\quad 0\leqq y\leqq p,\quad p\leqq x+y
を考察する.それは三角形の極端の場合として二重線分,従って面積 0 なるものをも最大値の競争に参加させることにほかならない.さて閉区域 [K] においては f(x,y) は最大値を有する.然るに [K] の境界では f=0 で,[K] の内点では f>0.故に最大は [K] の内部において起る.然るに [K] の内部すなわち (K) では,(6) 以外の点において最大はありえないのであったから,(6) が最大を与えるのである.
(解終)
もしも点 (6) において f(x,y) の第二階の微分を計算すれば,前節の記号を用いて

  a=c=-\frac23p,\quad b=-\frac13p^2,\quad ac-b^2>0
を得る.故に (6) は極大点である.しかし,極大すなわち最大ではないのだから,これだけでは問題は解決されない.
[例 2]
行列式の最大値[Hadamard の定理].なお一つの例として,n 次の行列式
D=\begin{vmatrix}
  a_1 & b_1 & \cdots & l_1\\
  a_2 & b_2 & \cdots & l_2\\
 \cdots&\cdots&\cdots&\cdots\\
  a_n & b_n & \cdots & l_n
\end{vmatrix}
の絶対値の最大値を
(7)

  a_i^2+b_i^2+\cdots+l_i^2=s_i^2\quad(i=1,2,\ldots,n)
なる条件の下において求めてみよう.(ただし s_i は与えられた正数.)目標は次の関係式である.
|D|\leqq s_1s_2\cdots s_n.
Dn^2 個の変数 a_1,\ldots,l_n の多項式であるが,ここでは条件 (7) のために独立変数は n(n-1) 個である.今 n 次元の球面 (7) の上の点を P_i として
P=(P_1,P_2,\ldots,P_n)
なる組合わせ P の函数として行列式 D を考察すれば,D=D(P)P に関して連続で,P の変動の区域は閉区域で,かつその点はすべて内点である[* 2].よって D の最大値,最小値は存在して,それらは D の極値の中から求められる. さて
D=a_iA_i+b_iB_i+\cdots+l_iL_i.
A_i,B_i,\ldots,L_ia_i,b_i,\ldots,l_i の余因子で,それは D の第 i 行以外の組成分子の多項式である.そこで (7) を考慮に入れて,D の極値の必要条件として

  \frac{\partial D}{\partial a_i}
  =A_i+L_i\frac{\partial l_i}{\partial a_i}
  =A_i-L_i\frac{a_i}{l_i}=0
を得る.b_i,c_i,\ldots に関しても同様だから
\frac{A_i}{a_i}=\frac{B_i}{b_i}=\cdots=\frac{L_i}{l_i}.
さて i\ne k とすれば
a_kA_i+b_kB_i+\cdots+l_kL_i=0,
故に
(8)
a_ia_k+b_ib_k+\cdots+l_il_k=0.
(7)(8) からは a_1,\ldots,l_n の値はきまらないが,D の絶対値は確定する.すなわち (7)(8) を用いて
D^2=\begin{vmatrix}
  s_1^2 & 0 & \cdots & 0\\
  0 & s_2^2 & \cdots & 0\\
  \cdots&\cdots&\cdots&\cdots\\
  0 & 0 & \cdots & s_n^2
\end{vmatrix}=(s_1s_2\cdots s_n)^2,
すなわち
D=\pm s_1s_2\cdots s_n.

故に D の最大値は s_1s_2\cdots s_n[最小値は -s_1s_2\cdots s_n]で,それは弱い意味の極大[極小]である[* 3]


  1. 高木: 代数学講義改訂新版 304 頁参照.
  2. P の空間に関しては,適当に点 P の近傍を定義することを要する(例えば,球面上の円を用いて)・
  3. 幾何学的にいえば,稜の長さ (s_i) が与えられた平行面体の体積は直方体において最大である.(8) は稜 s_i,s_k の直交条件である.

[編集] 27.接線および曲率

本章の終りにおいて曲線の接線および曲率に関して述べる.それは微分法発祥の問題である.ただし記述を簡明にするために,ベクトル法の記号を用いる.一定の大きさと方向とを有する量としてのベクトルの意味は既知とする.直角座標の原点 O から点 P=(x,y,z) に至る線分 OP で表わされるベクトルを \boldsymbol{v}=(x,y,z) と書き、x,y,z\boldsymbol v の座標(または成分)という.また \boldsymbol v の大きさを |\boldsymbol v| と書く.すなわち |\boldsymbol{v}|=\sqrt{x^2+y^2+z^2}

二つのベクトル \boldsymbol u=(x_1,y_1,z_1),\boldsymbol v=(x_2,y_2,z_2) に関して,次のように二種の乗法を定義する.

(1º)
スカラー積

  \boldsymbol{uv}=x_1x_2+y_1y_2+z_1z_2
これは一つの数である.\boldsymbol u,\boldsymbol v が零ベクトルではないとき,それらの方向余弦は,それぞれ

 \frac{x_1}{|\boldsymbol u|},\frac{y_1}{|\boldsymbol u|},\frac{z_1}{|\boldsymbol u|}
 および 
 \frac{x_2}{|\boldsymbol u|},\frac{y_2}{|\boldsymbol u|},\frac{z_2}{|\boldsymbol u|}
だから,\boldsymbol u,\boldsymbol v の間の角を \theta とすれば

 \cos\theta=\frac{x_1x_2+y_1y_2+z_1z_2}{|\boldsymbol u||\boldsymbol v|}
故に

  \boldsymbol{uv}=|\boldsymbol u||\boldsymbol v|\cos\theta.
これがスカラー積の幾何学上の意味である.\boldsymbol u,\boldsymbol v が互に垂直であるとき

  \boldsymbol{uv}=0.
また,

  \boldsymbol{uu}=x_1^2+y_1^2+z_1^2=|\boldsymbol u|^2.
スカラー積に関しては交換律および加法に対する分配律が成り立つ.すなわち

 \boldsymbol{uv}=\boldsymbol{vu},\quad
  (\boldsymbol u_1+\boldsymbol u_2)\boldsymbol v
  =\boldsymbol u_1\boldsymbol v+\boldsymbol u_2\boldsymbol v.
x,y,z が変数 t の函数であるときは,ベクトル

  \mathit{OP}=\boldsymbol u=(x,y,z)
t の函数と考えることができる.そのとき t+\Delta t に対応するベクトルを
\Delta u=ベクトル PP'

  \mathit{OP'}=\boldsymbol u+\Delta\boldsymbol u
 =(x+\Delta x,y+\Delta y,z+\Delta z)
とすれば,\Delta\boldsymbol u は,すなわち,ベクトル PP'

  \Delta\boldsymbol u=(\Delta x,\Delta y,\Delta z).
x,y,z が微分可能ならば,\Delta t\to 0 のときベクトル

  \frac{\Delta\boldsymbol u}{\Delta t}=\left(
  \frac{\Delta x}{\Delta t},\frac{\Delta y}{\Delta t},\frac{\Delta z}{\Delta t}
  \right)
の極限値は一定のベクトルである.今その極限値を \textstyle \dot\boldsymbol u=\frac{d\boldsymbol u}{dt} と書けば

 \dot\boldsymbol u=(\dot x,\dot y,\dot z).
この記法によれば,スカラー積の定義によって

  \frac{d}{dt}(\boldsymbol{uv})=
  \dot\boldsymbol u\boldsymbol v+\boldsymbol u\dot\boldsymbol v.
特に \boldsymbol u が常に単位ベクトル(すなわち |\boldsymbol u|=1)で,その方向のみが変化するときには,\boldsymbol{uu}=1 だから \boldsymbol u\dot\boldsymbol u=0 である.そのとき \dot\boldsymbol u\ne 0 ならば,\boldsymbol u\dot\boldsymbol u とは互に垂直である.
(2º)
ベクトル積 \boldsymbol u\times\boldsymbol v
二つのベクトル

  \boldsymbol u=(x_1,y_1,z_1),\quad\boldsymbol v=(x_2,y_2,z_2)
の座標の行列

  \begin{pmatrix}
    x_1& y_1& z_1\\ x_2& y_2& z_2
  \end{pmatrix}
から作られる三つの行列式を座標とするベクトル

  \boldsymbol w=(y_1z_2-y_2z_1,z_1x_2-z_2x_1,x_1y_2-x_2y_1)
\boldsymbol u=(x_1,y_1,z_1),\boldsymbol v=(x_2,y_2,z_2) のベクトル積といい,それを \boldsymbol u\times\boldsymbol v と書く[* 1].それの幾何学的の意味は次の通りである. 今簡単のために \boldsymbol w=(x,y,z) と書けば

  xx_1+yy_1+zz_1=0,\quad xx_2+yy_2+zz_2=0
すなわち

  \boldsymbol{wu}=0,\quad \boldsymbol{wv}=0
で,\boldsymbol w\boldsymbol u および \boldsymbol v に垂直である.また

  \begin{vmatrix}
    x & y & z \\ x_1 & y_1 & z_1 \\ x_2 & y_2 & z_2
  \end{vmatrix} = x^2+y^2+z^2 = |\boldsymbol w|^2
はベクトル \boldsymbol u,\boldsymbol v,\boldsymbol w を三つの稜とする平行六面体の体積で,それが正であるから \boldsymbol u,\boldsymbol v,\boldsymbol w は座標軸と同意(すなわち右ねじ)の三稜系である.この体積が |\boldsymbol w|^2 に等しいから,|\boldsymbol w|\boldsymbol u,\boldsymbol v が作る平行四辺形の面積に等しい.
u,vの張る平行四辺形の面積と外積wの大きさ,wの向きは右ねじ

特に \boldsymbol u,\boldsymbol v の方向が一致するときは \boldsymbol u\times\boldsymbol v=0.

上記の定義によれば,ベクトル積は交換律に従わないで,

  \boldsymbol u\times\boldsymbol v=-\boldsymbol v\times\boldsymbol u.
加法に対する分配律

  (\boldsymbol u_1+\boldsymbol u_2)\times\boldsymbol v
  =\boldsymbol u_1\times\boldsymbol v+\boldsymbol u_2\times\boldsymbol v,

  \boldsymbol v\times(\boldsymbol u_1+\boldsymbol u_2)
  =\boldsymbol v\times\boldsymbol u_1+\boldsymbol v\times\boldsymbol u_2
は容易に験証される.また \boldsymbol u,\boldsymbol vt の函数ならば

  \frac{d}{dt}(\boldsymbol u\times\boldsymbol v)
 =\dot\boldsymbol u\times\boldsymbol v+\boldsymbol u\times\dot\boldsymbol v.
(3º)
なお三つのベクトル

  \boldsymbol u=(x_1,y_1,z_1),\quad
  \boldsymbol v=(x_2,y_2,z_2),\quad
  \boldsymbol w=(x_3,y_3,z_3)
を稜とする平行六面体の体積を,符号をも考慮して (\boldsymbol u,\boldsymbol v,\boldsymbol w) で表わす.すなわち

  (\boldsymbol u,\boldsymbol v,\boldsymbol w) = \begin{vmatrix}
    x_1& y_1& z_1\\ x_2& y_2& z_2\\ x_3& y_3& z_3
  \end{vmatrix}.
二つずつ互に垂直な三つの単位ベクトル \boldsymbol i,\boldsymbol j,\boldsymbol k が右ねじならば,それらは単位三稜系を成すという.この場合

 \begin{align}
  &\boldsymbol i^2=\boldsymbol j^2=\boldsymbol k^2=1,
   & &\boldsymbol i\times\boldsymbol i
     =\boldsymbol j\times\boldsymbol j
     =\boldsymbol k\times\boldsymbol k=0,\\
  &\boldsymbol{ij}=\boldsymbol{ji}=0,
   & &\boldsymbol i\times\boldsymbol j
     =\boldsymbol k = -\boldsymbol j\times\boldsymbol i,\\
  &\boldsymbol{jk}=\boldsymbol{kj}=0,
   & &\boldsymbol j\times\boldsymbol k
     =\boldsymbol i = -\boldsymbol k\times\boldsymbol j,\\
  &\boldsymbol{ki}=\boldsymbol{ik}=0,
   & &\boldsymbol k\times\boldsymbol i
     =\boldsymbol j = -\boldsymbol i\times\boldsymbol k,\\
  &(\boldsymbol i,\boldsymbol j,\boldsymbol k)=1.
 \end{align}
さて曲線 C が媒介変数 t によって表わされているとする.然らば C 上の点 P=(x,y,z) の座標 x,y,z は与えられた t の函数であるが,点 P の代りにベクトル OP\boldsymbol v と書いて,\boldsymbol v=(x,y,z)t の函数として考察する.今曲線 C において t+\delta t に対応する点を P'=(x+\delta x,y+\delta y,z+\delta z),あるいは,ベクトル OP'\boldsymbol v+\delta\boldsymbol v とすれば,前に述べたように,\delta\boldsymbol v はベクトル PP'

  \delta\boldsymbol v=(\delta x,\delta y,\delta z).
x,y,z が第三階まで微分可能とすれば,Taylor の公式(定理29)によって

 \delta x=\dot x\delta t+\ddot x\frac{\delta t^2}{2}+\overset{\dots} x\frac{\delta t^3}{6}+o\delta t^3,
\delta y,\delta z も同様であるが,これらを一括して簡明に書けば
(1)

  \delta\boldsymbol v
  = \dot\boldsymbol v\delta t
    + \ddot\boldsymbol v\frac{\delta t^2}{2}
    + \overset{\dots}\boldsymbol v\frac{\delta t^3}{6}
    + \boldsymbol o\delta t^3.
\dot\boldsymbol v=(\dot x,\dot y,\dot z) はベクトルである.\ddot\boldsymbol v,\overset{\dots}\boldsymbol v も同様で,また \boldsymbol o\delta t\to 0 のとき |\boldsymbol o|\to 0 なるベクトルとみてよい.(1) における三つのベクトル \dot\boldsymbol v,\ddot\boldsymbol v,\overset{\dots}\boldsymbol v は曲線 C の点 P における幾何学上の性質に関して重要な意味を有する. ベクトル \dot\boldsymbol v=(\dot x,\dot y,\dot z) の大きさは

 |\dot\boldsymbol v|=\sqrt{\dot x^2+\dot y^2+\dot z^2},
また点 P における曲線 C の接線の方向余弦は

 \frac{\cos\alpha}{\dot x}=\frac{\cos\beta}{\dot y}=\frac{\cos\gamma}{\dot z}
 =\frac{1}{|\dot\boldsymbol v|}
によって与えられる.ただし \dot\boldsymbol v=0 すなわち \dot x,\dot y,\dot z が同時に 0 になる点(特異点)は除く[* 2]

媒介変数として,t の代りに,曲線 C の一つの定点から起算した弧長 s を取れば,結果が簡明である.

よって,以下 s に関する微分を ' で示して
(2)

 \delta\boldsymbol v
 = \boldsymbol v'\delta s
   +\boldsymbol v''\frac{\delta s^2}{2}
   +\boldsymbol v'''\frac{\delta s^3}{6} + \boldsymbol o\delta s^3
とする. 弧長の理論は後に述べるが,ここでは弧 PP' と弦 PP' との比が距離 PP'\to 0 のとき 1 に収束することだけを用いる.すなわち

  \frac{\delta x^2+\delta y^2+\delta z^2}{\delta s^2}\to 1.
従って

  \frac{dx}{ds}=\cos\alpha,\quad 
  \frac{dy}{ds}=\cos\beta,\quad
  \frac{dz}{ds}=\cos\gamma.
故に

  x'^2+y'^2+z'^2=1, すなわち |\boldsymbol v'|=1.
s を媒介変数とすれば,\boldsymbol v' は接線上において s の増加する向きに取った単位ベクトルである.

|\boldsymbol v'|=1 だから,\boldsymbol v''\ne 0 を仮定すれば,\boldsymbol v''\boldsymbol v' に垂直である(74 頁).P において \boldsymbol v'' に平行な直線を曲線 C主法線principal normal),\boldsymbol v',\boldsymbol v'' を含む平面を接触平面osculating plane)という.

P を通る任意の平面の方程式を標準形で

 l(X-x)+m(Y-y)+n(Z-z)=0\quad (l^2+m^2+n^2=1)
とすれば,\boldsymbol p=(l,m,n) は平面の法線上の単位ベクトルである.曲線上の点 P'=(x+\delta x,y+\delta y,z+\delta z) からこの平面への距離は
l\delta x+m\delta y+n\delta z.
すなわち,スカラー積 \boldsymbol p\cdot\delta\boldsymbol v に等しい.ただし \delta\boldsymbol v=(\delta x,\delta y,\delta z).これは (2) によってファイル:図

 \boldsymbol{pv}'\delta s+\boldsymbol{pv}''\frac{\delta s^2}{2}+\boldsymbol o\delta s^2
に等しく,\boldsymbol p\boldsymbol v,\boldsymbol v'' に垂直(\boldsymbol{pv}'=0,\boldsymbol{pv}''=0),すなわち平面が \boldsymbol v',\boldsymbol v'' を含むときに限って,\delta s^2 よりも高位の微小数である.これが接触平面の意味である.
さて P および P' における接線の間の角を \delta\alpha とすれば,\delta\alpha はベクトル \boldsymbol v'\boldsymbol v'+\delta\boldsymbol v' との間の角で,\boldsymbol v' の長さは常に 1 に等しいのだから,\delta s\to 0 のとき
\frac{\delta\alpha}{|\delta\boldsymbol v'|}\to 1.
然るに

  \frac{\delta\boldsymbol v'}{\delta s}\to\boldsymbol v'',\quad
  \frac{|\delta\boldsymbol v'|}{\delta s}\to|\boldsymbol v''|.
故に

  \frac{\delta\alpha}{\delta s}\to|\boldsymbol v''|,
   すなわち 
  \frac{d\alpha}{ds}=|\boldsymbol v''|.
ここで \tfrac{d\alpha}{ds}C の接線の方向が弧長に伴って変動する率であるから,それを点 P における曲率といい,その逆数 \rho曲率半径という.すなわち
(3)

  \frac{1}{\rho}=\frac{d\alpha}{ds}=|\boldsymbol v''|
  =\sqrt{\left(\frac{d^2x}{ds^2}\right)^2+\left(\frac{d^2y}{ds^2}\right)^2+\left(\frac{d^2z}{ds^2}\right)^2}.
P における接触平面の垂線を陪法線binormal)という.今,接線,主法線,倍法線上に単位三稜系 \boldsymbol i,\boldsymbol j,\boldsymbol k を取れば,上記によって
(4)
\left.\begin{align}
  \boldsymbol i &=\boldsymbol v'\\
  \boldsymbol j &=\rho\boldsymbol v''\\
  \boldsymbol k &=\boldsymbol i\times\boldsymbol j.
 \end{align}\quad\right\}
然らば

  \boldsymbol k'=\boldsymbol i'\times\boldsymbol j+\boldsymbol i\times\boldsymbol j'
であるが,\boldsymbol i'=\boldsymbol v''\boldsymbol j に平行だから \boldsymbol i'\times\boldsymbol j=0,従って

  \boldsymbol k'=\boldsymbol i\times\boldsymbol j'.
故に \boldsymbol k'\boldsymbol i に垂直である.また |\boldsymbol k|=1 から \boldsymbol k'\boldsymbol k に垂直,従って \boldsymbol k'\boldsymbol j に平行である.(ここで \boldsymbol k'\ne 0 を仮定した.)前に述べた |\boldsymbol v''| と同じように,|\boldsymbol k'|s の変動に伴う倍法線の向きの変動率,すなわち接触平面が接線のまわりを回転する角の変動率である.s の増す向きを接線の正の向きと定めたから,この回転は正負を区別することができる.\boldsymbol k'\boldsymbol j に平行で,|\boldsymbol j|=1 だから \boldsymbol k'=\pm|\boldsymbol k'|\boldsymbol j であるが,今

  \boldsymbol k'=-\frac{1}{\tau}\boldsymbol j
と置いて \tfrac{1}{\tau} を曲線 C第二曲率または捩率(あるいはねじれ)といい,その逆数を捩率半径という.
P が曲線 C の上を進むとき,単位三稜系 (\boldsymbol i,\boldsymbol j,\boldsymbol k) は,\tau の正負に従って,右ねじまたは左ねじに回りつつ変動する.
任意のベクトルは \boldsymbol i,\boldsymbol j,\boldsymbol k の結合として a\boldsymbol i+b\boldsymbol j+c\boldsymbol k の形で表わされるが,今 \boldsymbol j' を考察すれば

  \boldsymbol j=\boldsymbol k\times\boldsymbol i,\quad
  \boldsymbol j'=\boldsymbol k'\times\boldsymbol i+\boldsymbol k\times\boldsymbol i'.
\boldsymbol i'=\boldsymbol v''=\tfrac{1}{\rho}\boldsymbol j, \boldsymbol k'=-\tfrac{1}{\tau}\boldsymbol j であったから,\boldsymbol j\times\boldsymbol i=-\boldsymbol k,\boldsymbol k\times\boldsymbol j=-\boldsymbol i を用いて

  \boldsymbol j'=-\frac{1}{\rho}\boldsymbol i+\frac{1}{\tau}\boldsymbol k.
上記 \boldsymbol i',\boldsymbol j',\boldsymbol k' を集めて書けば
(5)
\left\{\begin{array}{lrl}
  \boldsymbol i'= & \dfrac{1}{\rho}\boldsymbol j, & \\[5pt]
  \boldsymbol j'= -\dfrac{1}{\rho}\boldsymbol i& & +\dfrac{1}{\tau}\boldsymbol k,\\[5pt]
  \boldsymbol k'= & -\dfrac{1}{\tau}\boldsymbol j. &
\end{array}\right.
これが Frenet の公式である.\boldsymbol i,\boldsymbol j,\boldsymbol k の成分は接線・主法線・陪法線の方向余弦で,' は弧長 s に関する微分を示すのであった.さて (4) から \boldsymbol v''=\tfrac{1}{\rho}\boldsymbol j.よって (5) を用いて,
\begin{align}\boldsymbol v''' 
 &=-\frac{\rho'}{\rho^2}\boldsymbol j+\frac{1}{\rho}\boldsymbol j'
 &=-\frac{1}{\rho^2}\boldsymbol i
   -\frac{\rho'}{\rho^2}\boldsymbol j
   +\frac{1}{\rho\tau}\boldsymbol k.
\end{align}
よって行列式を作れば(75 頁),
\begin{align}(\boldsymbol v,\boldsymbol v'',\boldsymbol v''')
 &= \left(\boldsymbol i,\frac{1}{\rho}\boldsymbol j,
      -\frac{1}{\rho^2}\boldsymbol i-\frac{\rho'}{\rho^2}\boldsymbol j
      +\frac{1}{\rho\tau}\boldsymbol k
    \right)\\
 &= \left(\boldsymbol i,\frac{1}{\rho}\boldsymbol j,\frac{1}{\rho\tau}\boldsymbol k\right)
 = \frac{1}{\rho^2\tau}(\boldsymbol i,\boldsymbol j,\boldsymbol k)
 = \frac{1}{\rho^2\tau}.
\end{align}
従って
(6)

 \frac{1}{\tau}=\rho^2(\boldsymbol v',\boldsymbol v'',\boldsymbol v''')
 =\frac{\begin{vmatrix}
    x'& y'& z'\\ x''& y''& z''\\ x'''& y'''& z'''
  \end{vmatrix}}{x''^2+y''^2+z''^2}.
これがs を変数としての捩率の式である. 任意の媒介変数 t に関して \rho\tau とを計算しよう.前のように,t に関する微分を \dot{\ } で表わすならば
(7)
\begin{align}
  &\dot\boldsymbol v=\boldsymbol v'\frac{ds}{dt},\\
  &\ddot\boldsymbol v
    = \boldsymbol v''\left(\frac{ds}{dt}\right)^2
     +\boldsymbol v'\frac{d^2s}{dt^2},\\
  &\overset{...}\boldsymbol v
    = \boldsymbol v'''\left(\frac{ds}{dt}\right)^2
     +3\boldsymbol v''\frac{ds}{dt}\frac{d^2s}{dt^2}
     +\boldsymbol v'\frac{d^3s}{dt^3}.
\end{align}
\ddot v の接線および主法線方向への分解
\boldsymbol v'\boldsymbol v'' とは互に垂直であるから,上の第二の式によって \ddot\boldsymbol v は二つの互に垂直なベクトルの和に分解される.一つは \boldsymbol v'\tfrac{d^2s}{dt^2} で,それは C の接線に平行で,その大きさは \tfrac{d^2s}{dt^2}|\boldsymbol v'|=1 だから),また一つは \boldsymbol v''(\tfrac{ds}{dt})^2 で,それは C の主法線に平行で,その大きさは \tfrac{1}{\rho}(\tfrac{ds}{dt})^2\boldsymbol v''|=\tfrac{1}{\rho} だから)である.t を時間とみるとき,加速度 \ddot\boldsymbol v がこのような二つの成分に分解されることは,運動学で周知である.故に

  |\ddot\boldsymbol v|^2=\ddot x^2+\ddot y^2+\ddot z^2
  = \frac{1}{\rho^2}\left(\frac{ds}{dt}\right)^2+\left(\frac{d^2s}{dt^2}\right)^2,
また (\tfrac{ds}{dt})=\dot x^2+\dot y^2+\dot z^2t に関して微分して

  \frac{ds}{dt}\frac{d^2s}{dt^2}=\dot x\ddot x+\dot y\ddot y+\dot z\ddot z.
従って
\begin{align}
  \frac{1}{\rho^2}\left(\frac{ds}{dt}\right)^6
 = |\ddot\boldsymbol v|^2\left(\frac{ds}{dt}\right)^2
  -\left(\frac{ds}{dt}\right)^2\left(\frac{d^2s}{dt^2}\right)^2
 &= (\dot x^2+\dot y^2+\dot z^2)(\ddot x^2+\ddot y^2+\ddot z^2)
  -(\dot x\ddot x+\dot y\ddot y+\dot z\ddot z)\\
 &= \begin{vmatrix} \dot y & \dot z\\ \ddot y & \ddot z \end{vmatrix}^2
   +\begin{vmatrix} \dot z & \dot x\\ \ddot z & \ddot x \end{vmatrix}^2
   +\begin{vmatrix} \dot x & \dot y\\ \ddot x & \ddot y \end{vmatrix}^2,
\end{align}
故に
(8)

  \frac{1}{\rho}=\frac{|\dot\boldsymbol v\times\ddot\boldsymbol v|}{|\dot\boldsymbol v|^3}.
また (7) から

  (\dot\boldsymbol v,\ddot\boldsymbol v,\overset{...}\boldsymbol v)
 =\left(\frac{ds}{dt}\right)^6(\boldsymbol v',\boldsymbol v'',\boldsymbol v''').
故に (6)(8) から
(9)

 \frac{1}{\tau}=\frac{(\dot\boldsymbol v,\ddot\boldsymbol v,\overset{...}\boldsymbol v)}{|\dot\boldsymbol v\times\ddot\boldsymbol v|^2}.
任意の媒介変数 t の函数として,(8)(9) から曲率および捩率が計算される.
[例]
螺旋
\begin{align}
             x &=  a\cos t, &             y &= a\sin t, & z=ht & &(a>0).\\
        \dot x &= -a\sin t, &        \dot y &= a\cos t, & \dot z=h.\\
       \ddot x &= -a\cos t, &       \ddot y &=-a\sin t, & \ddot z=0.\\
 \overset{...}x&=  a\sin t, & \overset{...}y&=-a\cos t, & \overset{...}z=0.
\end{align}
\begin{align}
 & |\dot\boldsymbol v|=\sqrt{\dot x^2+\dot y^2+\dot z^2}=\sqrt{a^2+h^2}\\
 & |\dot\boldsymbol v\times\ddot\boldsymbol v|
   =\sqrt{a^2h^2\sin^2t+a^2h^2\cos^2t+a^4}=a\sqrt{a^2+h^2}\\
 & (\dot\boldsymbol v,\ddot\boldsymbol v,\overset{...}\boldsymbol v)=a^2h
\end{align}

 \frac{1}{\rho}=\frac{a}{a^2+h^2},\quad \frac{1}{\tau}=\frac{h}{a^2+h^2}.
すなわち曲率も捩率も一定である.\tauh とは同符号で,それの正負は右ねじ,左ねじを差別する.

ファイル:図

平面曲線に関しては z=0 として,Talor 展開を二次の項まで取って

 \delta\boldsymbol v
 = \boldsymbol v'\delta s
  +\boldsymbol v''\frac{\delta s^2}{2}
  +\boldsymbol o\delta s^2
を考察する.この場合にも |\boldsymbol v'|=1,従って \thetax 軸の正の向きから,接線の正の向きまでの角とすれば(77 頁と同様に),

 |\boldsymbol v''|=\left|\frac{d\theta}{ds}\right|
は弧長 s に対する接線の方向の変動率で,それを曲率というのであるが,三次元で捩率の符号を差別したのと同様に,二次元では既に接線の方向の変わる向きの符号を差別できるから
(10)
\frac{1}{\rho}=\frac{d\theta}{ds}
を曲率の定義として,\rho曲率半径という.然らば

 \boldsymbol v'=(x',y')=(\cos\theta,\sin\theta)
から,s に関して微分して

 \boldsymbol v''=(x'',y'')
 = \left(-\sim\theta\frac{d\theta}{ds},\cos\theta\frac{d\theta}{ds}\right) 
 = \frac{1}{\rho}(-\sin\theta,\cos\theta)=\frac{1}{\rho}(-y',x').
これから
(11)

  \frac{1}{\rho}=\frac{-x''}{y'}=\frac{y''}{x'}.
一般の媒介変数に関しては,(7) の初めの二つの方程式を用いて

  \begin{vmatrix}\dot x& \dot y\\ \ddot x& \ddot y\end{vmatrix}
 =\begin{vmatrix}x'& y'\\ x''& y''\end{vmatrix}\left(\frac{ds}{dt}\right)^3
 =\begin{vmatrix}x'& y'\\ -\frac{y'}\rho& \frac{x'}{\rho}\end{vmatrix}\left(\frac{ds}{dt}\right)^3
 =\frac{1}{\rho}\left(\frac{ds}{dt}\right)^3.
従って
(12)

  \frac{1}{\rho}=\frac{\dot x\ddot y-\ddot x\dot y}{\dot s^3}.
75 頁 (3º) と同様の記号を用いてこれを

  \frac{1}{\rho}=\frac{(\dot v,\ddot v)}{|\dot v|^3}
と書けば簡明であろう.(ただし \dot s>0,すなわち t の増す向きに弧長を計るとしていう.) 要約すれば,独立変数に無関係に微分記号を用いて
(13)

  \frac{1}{\rho}=\frac{dx\,d^2y-d^2x\,dy}{(dx^2+dy^2)^{\frac{2}{3}}}.
特に曲線が
y=f(x)
の形で与えられているときには,x を独立変数として
(14)
 \frac{1}{\rho}=\frac{
 \frac{d^2y}{dx^2}
 }{
 \left( 1+\left(\frac{dy}{dx}\right)^2 \right)^{\frac{2}{3}}
 }.
P において曲線 C に接し,接線に関して C と同じ側にあって |\rho| に等しい半径を有する円を曲率円といい,その中心 (\xi,\eta)曲率の中心という.然らば
(15)

 \xi=x-\rho\sin\theta,\quad \eta=y+\rho\cos\theta.

(10) によって \tfrac{d\theta}{ds} の符号が \rho の符号であるから,ちょうどこれでよいのである.または (14) によれば,\rho\tfrac{d^2y}{dx^2} と同符号だから,次の図のように曲率の中心は曲線の凹なる側にある. ファイル:図

KaisekiGairon-2-27-fig5.png
KaisekiGairon-2-27-fig6.png
曲線 C の曲率の中心 (\xi,\eta) の軌跡を曲線 E おすれば,(15)C と同一の媒介変数によって E を表わす.特に C の弧長 s を媒介変数とすれば,E
\xi=x-\rho y',\quad \eta=y+\rho x'
で表わされる.s に関してさらに微分すれば,(11) によって
\begin{align}
  \xi'&=x'-\rho'y'-\rho y''=-\rho'y',\\
  \eta&=y'+\rho'x'+\rho x''=\rho'x',
\end{align}
従って
\xi'x'+\eta'y'=0.

すなわち原曲線 C の接線と,それに対応する点における E の接線とは互に垂直である.故に C の法線は曲率の中心において E に接する.すなわち E は原曲線 C の法泉の包絡線(§88)である.

E の弧長を \sigma とすれば

  \left(\frac{d\sigma}{ds}\right)^2
 =\left(\frac{d\xi}{ds}\right)^2+\left(\frac{d\eta}{ds}\right)^2
 =\rho'^2(x'^2+y'^2)=\rho'^2,
すなわち \sigma'=\pm\rho'.故に E における弧長を適当なる向きに計るならば,\rho'\ne 0 なる各範囲内において \sigma'=\rho' で,\sigma_0\rho0 が対応するとすれば,\sigma-\sigma_0=\rho-\rho_0.その条件の下において,E の二点間の弧長は対応する C の二点における曲率半径の差に等しい.
E に糸を捲いて置いて,その端 P を糸のたるまぬように,かたく引張りつつほぐして行けば,PC を描くであろう.よって CE伸開線involute)といい,逆に EC縮閉線evolute)という.C が与えられるとき,その縮閉線 E は一定であるが,与えられた E の伸開線 C は無数にある.
[例 1]
一つの円が他の円の周上または直線上を,すべらないで,ころがるとき,その動円に固着する一点の軌跡は広義においてサイクロイドcycloid)と称する曲線で,それは歯車の理論などに応用される.最も簡単な場合は,定直線上をころがる円の周上の一点が画く直線で,それが通常の(狭義の)サイクロイドである(いわゆる擺線).動円の半径を a,回転の角を t,定直線を x 軸として,t=0 のとき円周上の定点 P が定直線に接する点を座標の原点とするならば,擺線は t を媒介変数として次のように表わされる.
x=a(t-\sin t),\quad y=a(1-\cos t).
故に
dx=a(1-\cos t)dt,\quad dy=a\sin t\,dt,
ds=\sqrt{dx^2+dy^2}=\sqrt{2a^2(1-\cos t)}dt=2a\left|\sin\frac{t}{2}\right|dt.
d^2x=a\sin t\,dt^2,\quad d^2y=a\cos t\,dt^2,

  dxd^2y-dyd^2x
  = a^2\begin{vmatrix}1-\cos t & \sin t\\ \sin t & \cos t\end{vmatrix}dt^3
  = a^2(\cos t-1)dt^3=-2a^2\sin^2\frac{t}{2}dt^3,

  \rho=\frac{ds^3}{dxd^2y-dyd^2x}=-4a\left|\sin\frac{t}{2}\right|,
\xi=x-\rho\frac{dy}{ds}=a(t+\sin t),
\eta=y+\rho\frac{dx}{ds}=a(-1+\cos t).
故に縮閉線は原曲線と合同である.詳しくいえば縮閉線の弧 AB',B'C は原曲線の弧 BC,AB とそれぞれ合同である.t=0,t=\pi に対応して \rho=0,\rho=-4a であるから,弧 AB' の長さは 4a,従って擺線 ABC の全長は 8a である.
[例 2]
楕円の縮閉線.楕円
x=a\cos t,\quad y=b\sin t
に関して計算すれば

  \rho=\frac{(a^2\sin^2t+b^2\cos^2t)^{\frac32}}{ab},

  \xi=\frac{a^2-b^2}{a}\cos^3t,\quad\eta=\frac{a^2-b^2}{b}\sin^3t
を得る.t を追い出せば縮閉線の方程式として
(a\xi)^{\frac23}+(b\eta)^{\frac23}=(a^2-b^2)^{\frac23}
を得る.それは図のような星形asteroid)である.ここで,原曲線において曲率の極大極小なる点に縮閉線の尖点(cusp)(§86,[例 2]参照)が対応することに注意するとよい.

E の内部の点からは楕円の四つの法線,また外部の点からは二つの法線が引かれる.

[例 3]
円の伸開線をついでに求めてみよう.半径を 1 として
\xi=\cos t,\quad\eta=\sin t
ファイル:図 で円を表わすならば,一つの伸開線として

  x=\cos t+t\sin t,\quad y=\sin t-t\cos t
を得る.(前頁の図,参照)

  1. スカラー積を内積,ベクトル積を外積ということもある.
  2. 以下,本節で述べる一般論では,曲線 C は点 P において特異性を有しないと仮定する.

[編集] 練習問題(2)

(1)
[a,\infty) において f(x) が微分可能で \textstyle\lim_{x\to\infty}f(x)=f(a) ならば,\xi>a,f'(\xi)=0 なる \xi がある.(Rolle の定理の拡張)
(2)
\textstyle a>0,\frac{d^n}{dx^n}\frac{1}{(1+x^2)^a}=\frac{P_n(x)}{(1+x^2)^{a+n}} とすれば,P_n(x)n 次の多項式で,それは n 個の相異なる実根を有し,それらの根は P_{n-1}(x) の根によって隔離される.
[解]
問題 (1) の応用.
(3)
[1º]
\textstyle \frac{d^n}{dx^n}e^{-x^2}=(-1)^n H_n(x)e^{-x^2} とすれば H_nn 次の多項式である[Hermite の多項式].H_n(x) の根に関しても,前の問題と同様の関係がある.
[2º]
\textstyle e^x\frac{d^n}{dx^n}x^n e^{-x}=L_n(x)Laguerre の多項式]に関しても同様.
(4)
(a,b) において f(x,y) において f(x) は第 n 階まで微分可能で x\to a+0 のとき f(x)\to l,f'(x)\to l_1,\ldots,f^{(n)}(x)\to l_n とする.もしも f(a)=l とするならば,右への微分商の意味で f'(a)=l_1,\ldots,f^{(n)}(a)=l_n
[解]
定理 23 の応用.
(5)
ある領域において f_x,f_y は連続で,点 (a,b) を除いては f_{xy} は連続とする(すなわち点 (a,b) では不連続かもしれないのである).然らば
\begin{align}
  f_{xy}(a,b)=\lim_{y\to b}f_{xy}(a,y)=\lim_{y\to b}f_{yx}(a,y),\\
  f_{yx}(a,b)=\lim_{x\to a}f_{xy}(x,b)=\lim_{x\to a}f_{yx}(x,b),
\end{align}
ただし,右辺の \lim が存在すると仮定するときに,左辺の \lim が存在して,等式が成り立つのである.
(6)
 f(x,y)=x^2\,\mathrm{Arc\,}\tan\frac{y}{x}-y^2\,\mathrm{Arc\,}\tan\frac{x}{y}
x=y=0 における第二階の偏微分商を求めよ.(もちろん x=0 または y=0 のとき f(x,y) の値は \textstyle\lim_{x\to 0} または \textstyle\lim_{y\to 0} で補充されたものとするのである.)
[解]
前の問題の応用.特に f_{xy}(0,0)=-1,f_{yx}(0,0)=1
(7)
合成函数の微分.F(u) において u=\varphi(x) とすれば

  \frac{1}{n!}\frac{d^n}{dx^n}F(u)
  =\sum_{k=1}^\infty\sum_i\frac{1}{i_1!i_2!\cdots i_n!}F^{(k)}(u)
   \left(\frac{\varphi'}{1!}\right)^{i_1}
   \left(\frac{\varphi''}{2!}\right)^{i_2}\cdots
   \left(\frac{\varphi^{(n)}}{n!}\right)^{i_n}.
内の和は i_1\geqq 0,i_2\geqq 0,\ldots,i_n\geqq 0,i_1+i_2+\cdots+i_n=k,i_1+2i_2+\cdots+ni_n=n なる整数 i のすべての組合わせの上にわたる.ただし 0!=1 とする.(Fáa di Bruno
[解]
F(u)Taylor の公式で展開して,u-u_0=\varphi(x)-\varphi(x_0)\varphiTaylor 展開を代入して後 (x-x_0)^n の項を集める.
(8)
[a,b] において f''(x)>0,f(a)>0,f(b)<0 ならば

  a_1=a-\frac{f(a)}{f'(a)},\quad a_2=a_1-\frac{f(a_1)}{f'(a_2)},\ldots
とするとき,a_1<a_2<\cdots<a_n<\cdots[a,b] における f(x)=0 のただ一つの根に収束する(Newton の近似法).
f(a)<0,f(b)>0 ならば b_1=b-\frac{f(b)}{f'(b)},\ldots
を取る.f''(x)<0 ならば -f(x)f(x) に代用する.
[解]
f'(x) が単調に増大することから,根がただ一つあることがわかる.その根を \xi とする.a_i が単調に増大して,しかも \xi よりも小であることは f(x) が凸函数であることからわかる.今かりに \lim a_n=\lambda とすれば,f'(a_1)<f'(a_2)<\cdots<f'(\lambda)<0 だから,
a_{n+1}=a_n-\frac{f(a_n)}{f'(a_n)} から \lambda=\lambda-\frac{f(\lambda)}{f'(\lambda)}, すなわち f(\lambda)=0.
従って \lambda=\xi である.
[注意] 
Taylor の公式\textstyle
  0=f(\xi)=f(a_n)+f'(a_n)(\xi-a_n)+\frac{f''(\mu)}2(\xi-a_n)^2
から f'(a_n) で割って \textstyle
  \xi-a_{n+1}=\frac{f''(\mu)}{2|f'(a_n)|}(\xi-a_n)^2
  < \frac{f''(\mu)}{2|f'(a_n)|}(b-a_n)^2.これから \xi の近似値として,a_{n+1} の誤差の程度がわかる(a_n<\mu<\xi).
[例]
一例として \cos x=x の解を求めてみるとよい.ここでは

  f(x)=x-\cos x,\quad f'(x)=1-\sin x,\quad f''(x)=\cos x.
解はただ一つで,それは区間 [0,\pi/2] にあるが,f(0)<0,f(\pi/2)>0 だから b,b_1,\ldots を用いる.さて \cos の真数表を繰ってみれば,求める角は 42^\circ20'42^\circ21' との間にあることがわかる.よってラジアンに直して
\begin{align}
  &     a= 0.7388561, &      &b=0.7391469,\\
  &\cos a= 0.7392394, & &\cos b=0.7390435,\\
  &  f(a)=-0.0003833, & &  f(b)=0.0001034,
\end{align}
ab も根 \xi と小数第三位までしか合わないが(\sin b=0.6736577

  b_1=b-\frac{0.0001034}{1.6736577}\fallingdotseq 0.7390651
はすでに小数第七位まで根 \xi と合う.b_1-\xi<\tfrac12(b-a)^2.([注意]参照
(9)
有理式 f(x)=P(x)/Q(x) の相隣る極値点が,共に極大点ならば,その中間の或る点 a において \textstyle\lim_{x\to a}f(x)=-\infty
(10)
f(x,y)=x^4+y^4+6x^2y^2-2y^2 に関して
[1º]
極値を求めよ.
[2º]
f(x,y)<0 なる区域の形を研究せよ.
(11)
三角形 ABC の平面上で,三つの頂点からの距離の和が最小である点を求めること.

三角形の内部の点と三つの頂点との距離の和は最も長い二辺よりも小である.

[解]
(最小の場合)各角が 120^\circ よりも小であるときは,求める点は三角形の内部にあって,その点から各辺を見込む角が 120^\circ に等しい.一つの角が 120^\circ 以上ならば,その角の頂点が求める点である.
[注意] 
微分法によって解き,初等幾何学の解法と比較するとよい.



PD-icon.svg
Flag of Japan.svg
この日本を法管轄とする文書は、著作者(共同著作物にあっては、最終に死亡した著作者)の死亡した日の属する年の翌年から起算して50年を経過したものであるため、日本の著作権法第51条及び57条の規定により著作権の保護期間が満了しています。


個人用ツール
名前空間

変種
操作
案内
印刷/エクスポート
ツールボックス