解析概論/第2章/極大極小

提供:Wikisource
移動: 案内, 検索

[編集] 26.極大極小

函数 f(x) が点 x=x_0 において取る値 f(x_0)x_0 の近傍で,x_0 以外の点 x における f(x) の値よりも大[あるいは小]なるとき,f(x_0極大値[あるいは極小値],x_0f(x)極大点[あるいは極小点]といい,極大値,極小値を総称して極値という.また x_0極値点という.

すなわち x_0f(x) の極小点であるとは

0 < |x-x_0| < \delta なるとき f(x)-f(x_0) > 0

なる \delta が存在することである.もしも不等号 >\geqq に換えるならば,f(x_0) を弱い意味の極小という.極大も同様である.

極大極小と最大または最小

この定義によれば f(x) の極値と,全区域における f(x) の最大または最小値とは,別々の概念であるから,極大値がかえって極小値よりも小でありうる.極大極小は或る一点の近傍のみに関していうのである.すなわち局所的(im Kleinenlocal)の最大最小である.

定理 30.
x_0 を函数 f(x) の定義域の内点とする.
(1º)
f(x)x_0 において微分可能なるとき,もしも,x=x_0 において f(x) が極値をとるならば,f'(x_0)=0f'(x_0) が存在するとき,これが極値の必要条件である.
(2º)
f(x) は,x_0 で連続で,x_0 の近傍で x_0 以外では,微分可能とする.もしも f'(x) がその点 x=x_0 で符号を変ずるならば,f(x_0) は極値である.詳しくいえば,x が増大しつつ点 x_0 を通過するとき,f'(x) の符号が + から - に変わるならば,f(x_0) は極大値,また反対に - から + に変わるならば f(x_0) は極小値である.
(3º)
f(x)x_0 の近傍で微分可能で,f''(x_0) が存在するとき,f'(x_0)=0, f''(x_0)>0 ならば f(x_0) は極小値で,f'(x_0)=0, f''(x_0)<0 ならば f(x_0) は極大値である.
[証]
(1º)
定理 19 の証明中に述べたようにして,x_0f(x) が直値をとる今の場合,f'(x_0) の存在だけから f'(x_0)=0 を得る.
(2º)
x<x_0 なるとき f'(x)>0 ならば,f(x) は単調に増大し,x>x_0 なるとき f'(x)<0 ならば,f(x) は単調に減少する(定理22).仮定によって,f(x)x_0 で連続だから f(x_0) は極大値である. 反対の場合には f(x_0) は極小値である.
(3º)
f''(x_0) \gtrless 0 に従って,f'(x) は点 x_0 において増大または減少する(49頁,[注意]).従って,f'(x)=0 ならば x=x_0f'(x) は符号を変ずるから.
[注意] 
f''(x_0)=0 なるときには,一般的には,なんらの断言もできない。この場合,もしも f'''(x_0) \neq 0 ならば,
f(x) - f(x_0) = \frac{1}{6}(x-x_0)^3f'''(x_0)+o(x-x_0)^3. (定理29
然らば |x-x_0| が十分小なる間は,右辺の符号はその第一項が決定するから,f(x)-f(x_0)x=x_0 において符号を変ずる.故に f(x_0) は極値でない.この場合,f(x_0)停留値x_0停留点という.停留(stationary)というのは,f(x)-f(x_0)|x-x_0| に関して高位(三位)の微小数で,x_0 において f(x) の変動が緩慢であることを示唆するのである.

またもし f^{(3)}(x_0)=0 で,f^{(4)}(x_0) \neq 0 ならば f^{(4)}(x_0) \gtrless 0 に従って,f(x_0) は極大または極小である.

一般に f'(x_0)=0, f''(x_0)=0,\ldots, f^{(k-1)}(x_0)=0f^{(k)}(x_0) \ neq 0 ならば,k が奇数のとき x_0 は極値点でないが,k が偶数のときには極値点である.
[例]
一つの平面の両側に二点 A, B が与えられているとする.動点 P がこの平面の両側で,それぞれ一定の速さ c_1, c_2 をもって運動するとき,PA から B まで最短の時間で行くべき経路を求めること.
[解]
AからBへの最短経路
問題の要求によれば,平面の両側で P は直線上を進行することを要し,かつ A, B を含みその平面に垂直なる平面上において運動することを要することは明白だから,その垂直面上で考察すればよい.すなわち問題は次のように簡約される.

平面上の直角座標に関して x 軸の上側と下側とに点 A=(0,h_1), B=(a,-h_2) が与えられているとする (a>0).今 P=(x,0)x 軸上の点とするとき,\textstyle \frac{AP}{c_1}+\frac{BP}{c_2} を最小ならしめる点 P の位置を決めること.

さて図において O の左方,または M の右方にある点は問題外であること明白である.故に問題は区間 0\leqq x\leqq a において
f(x) = \frac{\sqrt{h_1^2+x^2}}{c_1} + \frac{\sqrt{h_2^2+(a-x)^2}}{c_2}
の最小値を求めることに帰する. 上記区間内で,f(x) は微分可能である.実際,計算を実行すれば

  f'(x) = \frac{1}{c_1}\cdot\frac{x}{\sqrt{h_1^2+x^2}} - \frac{1}{c_2}\cdot\frac{a-x}{\sqrt{h_2^2+(a-x)^2}}
を得る.

そこで,まず条件 f'(x)=0 を考察する(図を参照).

f'(x) の式の第一項は
(1)

  \frac{1}{c_1}\frac{x}{\sqrt{h_1^2+x^2}} = \frac{\sin\alpha}{c_1}.
これは [0,a] において x が増大するに従って単調に増大する.また第二項の
(2)

  \frac{1}{c_2}\frac{a-x}{\sqrt{h_2^2+(a-x)^2}} = \frac{\sin\beta}{c_2}
は,x が増大するに従って減少する.

故に (1)(2) との差である f'(x) は区間 [0,a] において単調に増大する.そうして x=0 であるとき f'(x)<0, x=a であるとき f'(x)>0.故に f'(x) は区間 (0,a) においてただ一回0になり,そのとき f(x) は極小値を取る.

f'(x) が 0 になるところを x=x_0 とすれば,(0,x_0) では f'(x)<0 だから f*(x) は減少し,x_0,a では f'(x)>0 だから f(x) は増大する.故に f(x_0) は最小値である.点 x_0 においては

  \frac{\sin\alpha}{\sin\beta} = \frac{c_1}{c_2}.
 [光の屈折率]
多変数の函数の極値も同様に定義される.今二次元についていえば,P_0=(x_0,y_0) の近傍で,P_0 以外の各点 P=(x,y) において
f(P)<f(P_0) [あるいは f(P)>f(P_0)
であるとき f(P_0) を極大[あるいは極小]値という. この定義によれば,f(x_0,y_0) が極値を取るときには,x または y のみを変動させても f(x,y_0) または f(x_0,y) はそれぞれ x=x_0 または y=y_0 において極値を取るから
f_x(x_0,y_0)=0,\quad f_y(x_0,y_0)=0.
これは極値の必要条件である. この条件の下において,
(3)
f(x,y)-f(x_0,y_0)
  = \frac12\{a(x-x_0)^2+2b(x-x_0)(y-y_0)+c(y-y_0)^2\}+o\rho^2,
ただし,

  a=f_{xx}(x_0,y_0),\quad b=f_{xy}(x_0,y_0),\quad c=f_{yy}(x_0,y_0),
  \quad \rho=\sqrt{(x-x_0)^2+(y-y_0)^2}.
\rho が十分小さい間は,(3) の右辺の符号を決定するものは二次式
aX^2+2bXY+cY^2\quad(X=x-x_0,Y=y-y_0)
である.そこで三つの場合が生ずる.
(1º)
ac-b^2>0.
二次式は定符号で,a が(従って c も)正なるか負なるかに従って,常に正または常に負である.前の場合には f(P_0) は極小,後の場合には極大である.
(2º)
ac-b^2<0.
二次式は不定符号,従って P_0 の近傍で f(P)>f(P_0) にも f(P)<f(P_0) にもなるから,f(P_0) は極値でない.
(3º)
ac-b^2=0.
二次式は完全平方である.この場合には第三階以上の微分を考慮しなくては,何も断言できないが,一般論ははなはだ煩雑である.今簡単のために座標を変換して (x_0,y_0)=(0,0) とし,またこの場合完全平方である上記の二次式を y^2 として(すなわち a=0,b=0,c=1),二,三の例を掲げる.
[例 1]
z=y^2(0,0) において z は最小値 0 を取るけれども,(x,0) において z=0 だから,これは弱い意味での極小である.
[例 2]
z=y^2+x^4(0,0) において極小.
[例 3]
z=y^2-x^3(0,0) は極値点でない.(x,y) が次の図(左)で影をつけたところにあるとき z<0,その外部では z>0
[例 4]
z=(y-x^2)(y-2x^2).同上,図(右). この場合には (x,y)(0,0) からの任意の半直線上を動いても,z は増大する.それでも (0,0) は極小値を与えない.
z=y^2-x^3 z=(y-x^2)(y-2x^2)
変数三個以上の場合も同様で,f(x_1,x_2,\ldots,x_n) に関して点 A=(a_1,a_2,\ldots,a_n) が極値を与えるためには,その点において
f_{x_1}=0,f_{x_2}=0,\ldots,f_{x_n}=0
であることが必要である.そのとき A における f_{x_ix_j}(A)=a_{ij} と置けば

  f(a_1+\xi_1,\ldots,a_n+\xi_n)-f(a_1,\ldots,a_n)
  =\frac12 Q(\xi_1,\xi_2,\ldots,\xi_n) + o\rho^2,
ただし

  Q(\xi_1,\xi_2,\ldots,\xi_n)=\sum_{i,j=1}^n a_{ij}\xi_i\xi_j
また
\rho=\sqrt{\sum_{i=1}^n \xi_i^2}.
もしも a_{ij} の行列式
D=\begin{vmatrix}
  a_{11} & a_{12} & \cdots & a_{1n} \\
  a_{21} & a_{22} & \cdots & a_{2n} \\
  \cdots & \cdots & \cdots & \cdots \\
  a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}\ne 0\quad(a_{ij}=a_{ji})
ならば,A が極値点であるか,ないかに関して,一定の断言ができる. 二次形式 Q が定符号ならば,その符号が正のとき極小,負のとき極大である.その判別法は D の首座行列式
D_k=\begin{vmatrix}
  a_{11} & a_{12} & \cdots & a_{1k} \\
  a_{21} & a_{22} & \cdots & a_{2k} \\
  \cdots & \cdots & \cdots & \cdots \\
  a_{k1} & a_{k2} & \cdots & a_{kk}
\end{vmatrix}\quad(k=1,2,\ldots,n)
の符号による[* 1].すなわち D_k がすべて正ならば極小で,また D_k の符号が (-1)^k ならば極大である.

二次形式 Q が不定符号ならば,f(A) は極値でない.D\ne 0 で,D_k の符号が上記の条件に適合しないときがそれである.

D=0 ならば,第二階の微分だけではなんとも断言ができない.

最大最小の問題は昔から数学者の興味をそそったものだが,その一つの原因は個々の問題に特別の工夫を要したところにあったのであろう.その点,今も昔も同様だけれども,微分法以後は,少くとも極大極小の必要条件は機械的に得られることになり,また近世に至って Weierstrass定理 13)によって,閉区域における連続函数の最大最小値の存在が確定したのである.

Steiner は最大最小に関する幾何学上の多くの問題を巧妙な方法で解いたが,その方法の核心は,解析的にいえば,微分法による極値の必要条件を幾何学的に求めるところにあった.彼の論証は正確ではなかったけれども,彼は非凡な洞察力によって,結果において正鵠を逸しなかったのである.Steiner が得た結果は,現代的の精密論法によって,大概すべて正当化されている.今この間の消息を説明するために,最も簡単な一例を取る.
[例 1]
周が与えられた三角形の面積の最大値を求めること.
[解]
周を 2p,辺を x,y,z,面積を S として,S の代りにその平方を f(x,y) とすれば
(4)
f(x,y)=p(p-x)(p-y)(p-z),\quad z=2p-x-y
で独立変数を x,y とすれば,それの変動する範囲は領域
(5)
(K)\quad 0<x<p,\quad 0<y<p,\quad p<x+y
である.
KaisekiGairon-2-26-fig5.png
さて三角形の一辺 y を固定すれば,最大面積の場合 x=z でなくてはならないことは幾何学的に明白である.これは f_x=0 を解いたのである.同様に f_y=0 から y=z を得る.すなわち
(6)
x=y=z=\frac23p.

この関係から(Steiner のように),直ちに正三角形が求めるものであると断定することは,もちろん不当である.我々の知りえたものは‘もしも最大値があるならば,それは正三角形によってのみ与えられる’ことだけである.さて f(x,y) は連続であるが,(5) は閉区域でないから,最大の存在は保証されていない.ここが問題の急所である.

今の場合,幸にして Weierstrass の定理によって,無造作にこの関門を通過することができる.今領域 K に境界点をつけ加えて,閉区域

  [K]\quad 0\leqq x\leqq p,\quad 0\leqq y\leqq p,\quad p\leqq x+y
を考察する.それは三角形の極端の場合として二重線分,従って面積 0 なるものをも最大値の競争に参加させることにほかならない.さて閉区域 [K] においては f(x,y) は最大値を有する.然るに [K] の境界では f=0 で,[K] の内点では f>0.故に最大は [K] の内部において起る.然るに [K] の内部すなわち (K) では,(6) 以外の点において最大はありえないのであったから,(6) が最大を与えるのである.
(解終)
もしも点 (6) において f(x,y) の第二階の微分を計算すれば,前節の記号を用いて

  a=c=-\frac23p,\quad b=-\frac13p^2,\quad ac-b^2>0
を得る.故に (6) は極大点である.しかし,極大すなわち最大ではないのだから,これだけでは問題は解決されない.
[例 2]
行列式の最大値[Hadamard の定理].なお一つの例として,n 次の行列式
D=\begin{vmatrix}
  a_1 & b_1 & \cdots & l_1\\
  a_2 & b_2 & \cdots & l_2\\
 \cdots&\cdots&\cdots&\cdots\\
  a_n & b_n & \cdots & l_n
\end{vmatrix}
の絶対値の最大値を
(7)

  a_i^2+b_i^2+\cdots+l_i^2=s_i^2\quad(i=1,2,\ldots,n)
なる条件の下において求めてみよう.(ただし s_i は与えられた正数.)目標は次の関係式である.
|D|\leqq s_1s_2\cdots s_n.
Dn^2 個の変数 a_1,\ldots,l_n の多項式であるが,ここでは条件 (7) のために独立変数は n(n-1) 個である.今 n 次元の球面 (7) の上の点を P_i として
P=(P_1,P_2,\ldots,P_n)
なる組合わせ P の函数として行列式 D を考察すれば,D=D(P)P に関して連続で,P の変動の区域は閉区域で,かつその点はすべて内点である[* 2].よって D の最大値,最小値は存在して,それらは D の極値の中から求められる. さて
D=a_iA_i+b_iB_i+\cdots+l_iL_i.
A_i,B_i,\ldots,L_ia_i,b_i,\ldots,l_i の余因子で,それは D の第 i 行以外の組成分子の多項式である.そこで (7) を考慮に入れて,D の極値の必要条件として

  \frac{\partial D}{\partial a_i}
  =A_i+L_i\frac{\partial l_i}{\partial a_i}
  =A_i-L_i\frac{a_i}{l_i}=0
を得る.b_i,c_i,\ldots に関しても同様だから
\frac{A_i}{a_i}=\frac{B_i}{b_i}=\cdots=\frac{L_i}{l_i}.
さて i\ne k とすれば
a_kA_i+b_kB_i+\cdots+l_kL_i=0,
故に
(8)
a_ia_k+b_ib_k+\cdots+l_il_k=0.
(7)(8) からは a_1,\ldots,l_n の値はきまらないが,D の絶対値は確定する.すなわち (7)(8) を用いて
D^2=\begin{vmatrix}
  s_1^2 & 0 & \cdots & 0\\
  0 & s_2^2 & \cdots & 0\\
  \cdots&\cdots&\cdots&\cdots\\
  0 & 0 & \cdots & s_n^2
\end{vmatrix}=(s_1s_2\cdots s_n)^2,
すなわち
D=\pm s_1s_2\cdots s_n.

故に D の最大値は s_1s_2\cdots s_n[最小値は -s_1s_2\cdots s_n]で,それは弱い意味の極大[極小]である[* 3]


  1. 高木: 代数学講義改訂新版 304 頁参照.
  2. P の空間に関しては,適当に点 P の近傍を定義することを要する(例えば,球面上の円を用いて)・
  3. 幾何学的にいえば,稜の長さ (s_i) が与えられた平行面体の体積は直方体において最大である.(8) は稜 s_i,s_k の直交条件である.
個人用ツール
名前空間

変種
操作
案内
印刷/エクスポート
ツールボックス