Euclid空間における微積分1

提供: Mathpedia

本稿においては、Euclid空間における微積分の初歩的なことについて述べる。

1. 微分、偏微分、$C^k$ 級の定義

定義1.1(微分)

Euclid空間 $\mathbb{R}^n$ の開集合 $\Omega$ 上で定義され、$\mathbb{R}^m$ に値を取る関数 $f\colon\Omega\rightarrow \mathbb{R}^m$ が、$a\in \Omega$ において微分可能であるとは、ある $A\in \mathbb{M}_{m\times n}(\mathbb{R})$が存在し、 $$ \Omega\ni x\mapsto \left\{\begin{array}{cl}\frac{f(x)-f(a)-A(x-a)}{\lvert x-a\rvert}&(x\neq a)\\0&(x=a)\end{array}\right\}\in \mathbb{R}^m\text{ が }a\text{ において連続。}\quad\quad(*) $$ が成り立つことを言う。$f$ が $a$ において微分可能であるとき $(*)$ を満たす $A\in \mathbb{M}_{m\times n}(\mathbb{R}) $は一意的に定まる(次の命題1.2)。そこでこの $A$ を $f'(a)\in \mathbb{M}_{m\times n}(\mathbb{R})$ と表し、$f$ の $a$ における微分と言う。$n=1$ の場合、$\Omega\subset \mathbb{R}$ は往々にして区間であるが、半開区間や閉区間であることもある。その場合、端点における微分(片側微分)を同様に定義する。

命題1.2

定義1.1の $(*)$ を満たす $A\in \mathbb{M}_{m\times n}(\mathbb{R})$ は一意的に定まる。

Proof.

$A,A'\in \mathbb{M}_{m\times n}(\mathbb{R})$ が共に定義1.1の $(*)$ を満たすとすると、任意の $\epsilon\in (0,\infty)$ に対し $\delta\in (0,\infty)$ が存在し、 $$ \frac{\lvert f(a+h)-f(a)-Ah\rvert}{\lvert h\rvert}<\frac{\epsilon}{2}\quad(\forall h\in \mathbb{R}^n:0<\lvert h\rvert<\delta), $$ $$ \frac{\lvert f(a+h)-f(a)-Ah\rvert}{\lvert h\rvert}<\frac{\epsilon}{2}\quad(\forall h\in \mathbb{R}^n:0<\lvert h\rvert<\delta) $$ が成り立つ。よって三角不等式より、 $$ \frac{\lvert (A-A')h\rvert}{\lvert h\rvert}<\epsilon\quad(\forall h\in \mathbb{R}^n:0<\lvert h\rvert<\delta) $$ であるので、$(e_1,\ldots,e_n)$ を $\mathbb{R}^n$ の標準基底とすると、 $$ \lvert (A-A')e_j\rvert<\epsilon\quad(j=1,\ldots,n) $$ が成り立つ。これが任意の $\epsilon\in (0,\infty)$ に対して成り立つので、 $$ \lvert (A-A')e_j\rvert=0\quad(j=1,\ldots,n) $$ である。よって $A=A'$ である。

命題1.3(微分の横ベクトル表記)

$\Omega\subset \mathbb{R}^n$ を開集合、$f\colon\Omega\rightarrow \mathbb{R}^m$ を、 $$ f(x)=(f_1(x),\ldots,f_m(x))\quad(\forall x\in \Omega) $$ と表す。$a\in \Omega$ とする。このとき次は互いに同値である。

  • $(1)$ $f$ は $a$ において微分可能である。
  • $(2)$ $f_1,\ldots,f_m\colon\Omega\rightarrow \mathbb{R}$ は $a$ において微分可能である。

そして $(1),(2)$ が成り立つとき、$f$ の $a$ における微分 $f'(a)\in\mathbb{M}_{m\times n}(\mathbb{R})$ は、$f_1,\ldots,f_m$ の $a$ における微分 $f_1'(a),\ldots,f_m'(a)\in \mathbb{R}^n$ に対し、横ベクトル表記で、 $$ f'(a)=\begin{pmatrix}f_1'(a)\\\vdots\\f_m'(a)\end{pmatrix} $$ と表される。

Proof.

$(1)\Rightarrow(2)$ を示す。$(1)$ が成り立つとし、$f'(a)\in \mathbb{M}_{m\times n}(\mathbb{R})$ の横ベクトル表記を考え、 $$ f'(a)=\begin{pmatrix}v_1\\\vdots\\v_m\end{pmatrix} $$ なる $v_1,\ldots,v_m\in \mathbb{R}^n$ を取る。$x\in \Omega\backslash\{a\}$ に対し、 $$ \frac{f(x)-f(a)-f'(a)(x-a)}{\lvert x-a\rvert}=\left(\frac{f_j(x)-f_j(a)-v_j(x-a)}{\lvert x-a\rvert}\right)_{j=1,\ldots,m} $$ であるから、任意の $j\in \{1,\ldots,m\}$ に対し、 $$ \frac{\lvert f_j(x)-f_j(a)-v_j(x-a)\rvert}{\lvert x-a\rvert}\leq \frac{\lvert f(x)-f(a)-f'(a)(x-a)\rvert}{\lvert x-a\rvert}\rightarrow0\quad(x\rightarrow a) $$ である。これより $f_j\colon\Omega\rightarrow\mathbb{R}$ は $a$ において微分可能であり、その微分は $f_j'(a)=v_j$ である。
$(2)\Rightarrow(1)$ を示す。$(2)$ が成り立つとし、横ベクトル表記で、 $$ A:=\begin{pmatrix}f_1'(a)\\\vdots\\f_m'(a)\end{pmatrix}\in \mathbb{M}_{m\times n}(\mathbb{R}) $$ とおく。このとき $x\in \Omega\backslash \{a\}$ に対し、 $$ \frac{f(x)-f(a)-A(x-a)}{\lvert x-a\rvert}=\left(\frac{f_j(x)-f_j(a)-f_j'(a)(x-a)}{\lvert x-a\rvert}\right)_{j=1,\ldots,m} $$ であるから、三角不等式より、 $$ \frac{\lvert f(x)-f(a)-A(x-a)\rvert}{\lvert x-a\rvert}\leq \sum_{j=1}^{m}\frac{\lvert f_j(x)-f_j(a)-f_j'(a)(x-a)\rvert}{\lvert x-a\rvert}\rightarrow0\quad(x\rightarrow a) $$ である。よって $f\colon\Omega\rightarrow\mathbb{R}^m$ は $a$ において微分可能であり、$f'(a)=A$ である。

命題1.4(微分可能な点における連続性)

$\mathbb{R}^n$ の開集合 $\Omega$ 上で定義された関数 $f\colon\Omega\rightarrow\mathbb{R}^m$ が $a\in \Omega$ において微分可能ならば、$f$ は $a$ において連続である。

Proof.

微分可能性より十分小さい $\delta\in (0,\infty)$ を取れば、 $$ \lvert f(x)-f(a)-f'(a)(x-a)\rvert\leq \lvert x-a\rvert\quad(\forall x\in \mathbb{R}^N:\lvert 0<x-a\rvert<\delta) $$ となるから、 $$ \lvert f(x)-f(a)\rvert\leq (\lVert f'(a)\rVert+1)\lvert x-a\rvert\quad(\forall x\in\mathbb{R}^N:\lvert x-a\rvert<\delta) $$ である。よって $f$ は $a$ において連続である。

定義1.5(偏微分、偏導関数、$C^k$ 級)

$\mathbb{R}^n$ の開集合 $\Omega$ 上で定義された関数 $f\colon\Omega\rightarrow\mathbb{R}^m$ が $a\in \Omega$ において第 $j$ 座標に関して偏微分可能であるとは、 $$ x_j\mapsto f(a_1,\ldots,a_{j-1},x_j,a_{j+1},\ldots,a_N)\in \mathbb{R}^m $$ が $a_j$ において微分可能であることを言う。そしてこのときその微分を、 $$ \partial_jf(a),\quad \frac{\partial f}{\partial x_j}(a)\in \mathbb{R}^m $$ などと表し、$f$ の $a$ における第 $j$ 座標に関する偏微分と呼ぶ。各 $x\in\Omega$ に対し $\partial_jf(x)\in \mathbb{R}^m$ が存在するとき、関数 $\partial_jf\colon\Omega\ni x\mapsto \partial_jf(x)\in \mathbb{R}^m$ を $f$ の第 $j$ 座標に関する偏導関数と言う。偏導関数の偏導関数が存在する限り、 $$ \partial_{j_n}\partial_{j_{n-1}}\ldots\partial_{j_1}f\colon=\partial_{j_n}(\partial_{j_{n-1}}\cdots\partial_{j_1}f) $$ と定義する。$\partial_{j_n}\partial_{j_{n-1}}\ldots \partial_{j_1}f:\Omega\rightarrow\mathbb{R}^m$ を $f$ の $n$ 階偏導関数と言う。便宜上、$f$ 自体を $f$ の $0$ 階偏導関数と言う。 $k\in \mathbb{N}$ に対し $f\colon\Omega\rightarrow \mathbb{R}^m$ が $k$ 階までの偏導関数を持ち、それらが全て連続であるとき $f$ は $C^k $級であると言う。任意の $k\in \mathbb{N}$ に対し $f$ が $C^k$ 級であるとき $f$ は $C^\infty$ 級であると言う。

命題1.6

$\mathbb{R}^n$ の開集合 $\Omega$ 上で定義された関数 $f\colon\Omega\rightarrow \mathbb{R}^m$ が $a\in \Omega$ において微分可能ならば任意の $j\in \{1,\ldots,n\}$ に対し $f$ は $a$ において第 $j$ 座標に関して偏微分可能であり、 $f'(a)\in \mathbb{M}_{m\times n}(\mathbb{R})$ と $\partial_1f(a),\ldots,\partial_nf(a)\in\mathbb{R}^m$に対し、行列の縦ベクトル表記で、 $$ f'(a)=(\partial_1f(a),\ldots,\partial_nf(a)) $$ が成り立つ。

Proof.

$(e_1,\ldots,e_n)$ を $\mathbb{R}^n$ の標準基底とする。任意の $j\in \{1,\ldots,n\}$ を取る。$f$ が $a$ において微分可能であることから任意の $\epsilon\in (0,\infty)$ に対し $\delta\in (0,\infty)$ が存在し、 $$ \frac{\lvert f(a+h)-f(a)-f'(a)h\rvert}{\lvert h\rvert}<\epsilon\quad(\forall h\in \mathbb{R}^n:0<\lvert h\rvert<\delta) $$ となる。よって任意の $j\in \{1,\ldots,n\}$ に対し、 $$ \left\lvert\frac{f(a+he_j)-f(a)-hf'(a)e_j}{h}\right\rvert=\frac{\lvert f(a+he_j)-f(a)-hf'(a)e_j\rvert}{\lvert he_j\rvert}<\epsilon\quad(\forall h\in \mathbb{R}:0<\lvert h\rvert<\delta) $$ となるので、$f$ は $a$ において第 $j$ 座標に関して偏微分可能であり、$\partial_jf(a)=f'(a)e_j$ である。ゆえに、 $$ f'(a)=(f'(a)e_1,\ldots,f'(a)e_n)=(\partial_1f(a),\ldots,\partial_nf(a)) $$ である。

2. チェインルール

命題2.1(チェインルール)

$U\subset \mathbb{R}^n$, $V\subset \mathbb{R}^m$ を開集合とし、$f\colon U\rightarrow V$, $g\colon V\rightarrow \mathbb{R}^{\ell}$ がそれぞれ $a\in U$ と$f(a)\in V$ において微分可能であるとする。このとき合成関数 $g\circ f\colon U\rightarrow\mathbb{R}^{\ell}$は $a$ において微分可能であり、 $$ (g\circ f)'(a)=g'(f(a))f'(a) $$ が成り立つ。

Proof.

$b\colon=f(a)\in V$ とおく。 $$ F(x)\colon=\frac{f(x)-f(a)-f'(a)(x-a)}{\lvert x-a\rvert}\quad(x\neq a),\quad F(a)=0, $$ $$ G(y)\colon=\frac{g(y)-g(b)-g'(b)(y-b)}{\lvert y-b\rvert}\quad(y\neq b),\quad G(b)=0 $$ として関数 $F\colon U\rightarrow \mathbb{R}^m$、$G\colon V\rightarrow\mathbb{R}^{\ell}$ を定義すると、$f, F$ は $a$ において連続であり、$G$ は $b$ において連続である。よって、 $$ \begin{aligned} &\frac{\lvert g(f(x))-g(f(a))-g'(b)f'(a)(x-a)\rvert}{\lvert x-a\rvert}\\ &\leq\frac{\lvert g(f(x))-g(f(a))-g'(b)(f(x)-f(a))\rvert}{\lvert x-a\rvert}+\lVert g'(b)\rVert\frac{\lvert f(x)-f(a)-f'(a)(x-a)\rvert}{\lvert x-a\rvert}\\ &\leq \frac{\lvert f(x)-f(a)\rvert}{\lvert x-a\rvert}\lvert G(f(x))\rvert+\lVert g'(b)\rVert \lvert F(x)\rvert\\ &\leq \lvert F(x)+\lVert f'(a)\rVert\rvert\lvert G(f(x))\rvert+\lVert g'(b)\rVert \lvert F(x)\rvert \rightarrow0\quad(x\rightarrow a) \end{aligned} $$ [1]であるから、$g\circ f\colon U\rightarrow \mathbb{R}^{\ell}$ は $a$ において微分可能であり、$(g\circ f)'(a)=g'(b)f'(a)$ である。

3. 平均値の定理

命題3.1(平均値の定理)

有界閉区間 $[a,b]\subset \mathbb{R}$ 上で定義された連続関数 $f,g\colon[a,b]\rightarrow \mathbb{R}$ が $(a,b)$ において微分可能であるとする。このときある $c\in (a,b)$ に対し、 $$ f'(c)(g(b)-g(a))=g'(c)(f(b)-f(a)) $$ が成り立つ。

Proof.

連続関数 $h\colon [a,b]\rightarrow\mathbb{R}$ を、 $$ h(x)\colon=f(x)(g(b)-g(a))-g(x)(f(b)-f(a))\quad(\forall x\in [a,b]) $$ として定義すると $h$ は $(a,b)$ 上で微分可能であり、 $$ h'(x)=f'(x)(g(b)-g(a))-g'(x)(f(x)-f(x))\quad(\forall x\in (a,b)),\quad h(a)=h(b) $$ である。$[a,b]$ はコンパクトであり $h$ は連続であるから $h([a,b])$ は最大値と最小値を持つ。$h(a)=h(b)$ であるから $h$ は $(a,b)$ 上で最大値か最小値に達する。そこで $c\in (a,b)$ において最大値に達するとする。$h$ は $c$ において微分可能であるから、任意の $\epsilon\in (0,\infty)$ に対し $\delta\in (0,\infty)$ が存在し、 $$ \left\lvert\frac{h(c\pm \delta)-h(c)}{\pm \delta}-h'(c)\right\rvert<\epsilon $$ となる。$h(c\pm \delta)-h(c)\leq 0$ であるから、 $$-\epsilon\leq \frac{h(c-\delta)-h(c)}{-\delta}-\epsilon<h'(c)<\frac{h(c+\delta)-h(c)}{\delta}+\epsilon\leq\epsilon $$ である。よって任意の $\epsilon\in (0,\infty)$ に対し $\lvert h'(c)\rvert<\epsilon$ であるから $h'(c)=0$ である。$h$ が $c\in (a,b)$ において最小値に達するとしても同様に $h'(c)=0$ を得る。よって求める結果を得る。

系3.2(平均値の定理通常版)

有界閉区間 $[a,b]\subset \mathbb{R}$ 上で定義された連続関数 $f\colon[a,b]\rightarrow \mathbb{R}$ が $(a,b)$ において微分可能であるとする。このときある $c\in (a,b)$ に対し、 $$ f(b)-f(a)=f'(c)(b-a) $$ が成り立つ。

Proof.

$g(x)=x$ として定理3.1を適用すればよい。

4. Taylorの定理、$2$ 階階導関数と凸性

定義4.1($1$ 変数関数の $n$ 階導関数)

$I\subset \mathbb{R}$ を区間とする。$f\colon I\rightarrow \mathbb{R}$ の $n$ 階導関数を $f^{(n)}$ と表す。$f^{(1)}=f'$、$f^{(0)}=f$である。

定理4.2(Taylorの定理)

$I\subset \mathbb{R}$ を区間とし、$f\colon I\rightarrow \mathbb{R}$ が $n$ 階までの導関数を持つとする($n\in \mathbb{N}$)。このとき任意の $a, b\in I$ に対し $a$ と $b$ の間の $c$ が存在し、 $$ f(b)=\sum_{k=0}^{n-1}\frac{f^{(k)}(a)}{k!}(b-a)^k+\frac{f^{(n)}(c)}{n!}(b-a)^n $$ が成り立つ。

Proof.

$a\in I$ を固定する。 $$ F(x)\colon=f(x)-\sum_{k=0}^{n-1}\frac{f^{(k)}(a)}{k!}(x-a)^k\quad(\forall x\in I) $$ とおくと、$F$ は $n$ 階までの導関数を持ち、 $$ F^{(k)}(a)=0\quad(k=1,\ldots,n-1),\quad F^{(n)}(x)=f^{(n)}(x)\quad(\forall x\in I) $$ である。$G(x)\colon=(x-a)^n$ として $G\colon I\rightarrow \mathbb{R}$ を定義すると、 $$ G^{(k)}(x)=\frac{n!}{(n-k)!}(x-a)^{n-k}\quad(\forall x\in I,k=0,1,\ldots,n) $$ であるから、任意の $k\in \{0,1,\ldots,n-1\}$ に対し、 $$ G^{(k)}(a)=0,\quad G^{(k)}(x)\neq0\quad(x\neq a) $$ であり、$G^{(n)}(x)=n!\text{ }(\forall x\in I)$ である。よって任意の $b\in I\backslash \{a\}$ に対し平均値の定理(定理3.1)より $a,b$ の間の $c_1,\ldots,c_n$ が存在し、 $$ \frac{F(b)}{G(b)}=\frac{F^{(1)}(c_1)}{G^{(1)}(c_1)}=\frac{F^{(2)}(c_2)}{G^{(2)}(c_2)}=\ldots=\frac{F^{(n)}(c_n)}{G^{(n)}(c_n)}=\frac{f^{(n)}(c_n)}{n!} $$ が成り立つ。ゆえに、 $$ F(b)=\frac{f^{(n)}(c_n)}{n!}(b-a)^n $$ であるから求める結果を得た。

定義4.3(関数の凸性)

$I\subset \mathbb{R}$ を区間とする。関数 $f\colon I\rightarrow \mathbb{R}$ が下に凸であるとは、 $$ f((1-t)a+tb)\leq (1-t)f(a)+tf(b)\quad(\forall a,b\in I,\forall t\in [0,1]) $$ が成り立つことを言う。また $f\colon I\rightarrow\mathbb{R}$ が上に凸であるとは、 $$ (1-t)f(a)+tf(b)\leq f((1-t)a+tb)\quad(\forall a,b\in I,\forall t\in [0,1]) $$ が成り立つことを言う。

命題4.4($2$ 階導関数と関数の凸性)

$I\subset \mathbb{R}$ を区間とし、$f\colon I\rightarrow\mathbb{R}$ が $2$ 階まで導関数を持つとする。もし $f^{' '}(x)\geq0$ $(\forall x\in I)$ が成り立つならば $f$ は下に凸である。

Proof.

任意の $a,b\in I$ と $t\in [0,1]$ を取り、$x=(1-t)a+tb\in I$ とおく。$f' '\geq0$ であることとTaylorの定理より、 $$ f(a)\geq f(x)+f'(x)(a-x),\quad f(b)\geq f(x)+f'(x)(b-x) $$ であるから、 $$ tf(a)+(1-t)f(b)\geq f(x)+f'(x)(ta+(1-t)b-x)=f(x) $$ である。よって $f$ は下に凸である。

5. $C^2$ 級関数の偏微分の可換性

命題5.1( $C^2$ 級関数の偏微分の可換性)

$\mathbb{R}^n$ の開集合 $\Omega$ 上で定義された関数 $f\colon\Omega\rightarrow \mathbb{R}^m$ が $C^2$ 級であるとする。このとき任意の $i,j\in \{1,\ldots,n\}$ に対し、 $$ \partial_i\partial_jf(x)=\partial_j\partial_if(x)\quad(\forall x\in \Omega) $$ が成り立つ。

Proof.

$n=2, m=1$ として示せば十分である。任意の $(x,y)\in\Omega$ を取り、 $$ (x-\delta,x+\delta)\times (y-\delta,y+\delta)\subset \Omega $$ なる $\delta\in (0,\infty)$ を取る。$h,k\in (-\delta,\delta)\backslash \{0\}$に対し、 $$ F(h,k):=(f(x+h,y+k)-f(x,y+k))-(f(x+h,y)-f(x,y)) $$ とおく。平均値の定理(系3.2)より $\theta_1,\theta_2\in (0,1)$ が存在し、 $$ F(h,k)=k(\partial_2 f(x+h,y+\theta_2k)-\partial_2f(x,y+\theta_2k)) =hk\partial_1\partial_2f(x+\theta_1h,y+\theta_2k) $$ となる。また、 $$ F(h,k)=(f(x+h,y+k)-f(x+h,y))-(f(x,y+k)-f(x,y)) $$ であるから、平均値の定理より $\omega_1,\omega_2\in (0,1)$ が存在し、 $$ F(h,k)=h(\partial_1f(x+\omega_1h,y+k)-\partial_1f(x+\omega_1h,y)) =hk\partial_2\partial_1f(x+\omega_1h,y+\omega_2k) $$ となる。よって、 $$ \partial_1\partial_2f(x+\theta_1h,y+\theta_2k)=\frac{F(h,k)}{hk}=\partial_2\partial_1f(x+\omega_1h,y+\omega_2k)\quad\quad(*) $$ である。 $\partial_1\partial_2f$、$\partial_2\partial_1f$ は連続であるから、任意の $\epsilon\in (0,\infty)$ に対し $\delta$ を十分小さくとっておけば、 $$ \lvert \partial_1\partial_2f(x+\theta_1h,y+\theta_2k)-\partial_1\partial_2f(x,y)\rvert<\frac{\epsilon}{2}, $$ $$ \lvert \partial_2\partial_1f(x+\omega_1h,y+\omega_2k)-\partial_2\partial_1f(x,y)\rvert<\frac{\epsilon}{2} $$ となるので、 $(*)$ と合わせれば、 $$ \lvert \partial_1\partial_2f(x,y)-\partial_2\partial_1f(x,y)\rvert<\epsilon $$ となる。よって $\epsilon$ の任意性より $\partial_1\partial_2f(x,y)=\partial_2\partial_1f(x,y)$ が成り立つ。

系5.2

$\mathbb{R}^n$ の開集合 $\Omega$ 上で定義された関数 $f\colon\Omega\rightarrow \mathbb{R}^m$ が $C^k$ 級であるとする。このとき $f$ の $k$ 階までの偏導関数は偏微分の順序によらない。

Proof.

命題5.1と帰納法による。

6. $C^1$ 級関数の微分可能性

命題6.1($C^1$ 級関数の微分可能性)

$\Omega\subset \mathbb{R}^n$ を開集合、$f\colon\Omega\rightarrow \mathbb{R}^m$ を $C^1$ 級とする。このとき $f$ は $\Omega$ の各点で微分可能である。

Proof.

$m=1$ として示せば十分である。任意の $x\in \Omega$ と $\{y\in\mathbb{R}^n\colon\lvert y-x\rvert<\delta\}\subset \Omega$ なる $\delta\in (0,\infty)$ を取り、 $0<\lvert h\rvert<\delta$ なる $h\in\mathbb{R}^n$を取る。平均値の定理(系3.2)より $\theta_1,\ldots,\theta_n\in (0,1)$ が存在し、 $$ h^{(k)}=(h_1,\ldots,h_{k-1}, \theta_kh_k,0,\ldots,0)\quad(k=1,\ldots,n) $$ に対し、 $$ f(x+h)-f(x)=\sum_{k=1}^{n}h_k\partial_kf(x+h^{(k)}) $$ となる。よって、 $$ v\colon=(\partial_1f(x),\ldots,\partial_nf(x)),\quad v(h)\colon=(\partial_1f(x+h^{(1)}),\ldots,\partial_nf(x+h^{(n)})) $$ とおくと、 $$ \frac{\lvert f(x+h)-f(x)-v\cdot h\rvert}{\lvert h\rvert}=\frac{\lvert(v(h)-v)\cdot h\rvert}{\lvert h\rvert}\leq \lvert v(h)-v\rvert $$ であり、$f$ は $C^1$ 級であるから右辺は $h\rightarrow0$ で $0$ に収束する。ゆえに $f$ は $x$ において微分可能である。

7. 逆関数定理

定理7.1(逆関数定理)

$\Omega\subset \mathbb{R}^n$ を開集合、$f\colon\Omega\rightarrow\mathbb{R}^n$ を $C^k$ 級($k\geq1$)とし、ある $a\in\Omega$ に対し ${\rm det}(f'(a))\neq0$ が成り立つとする。このとき $a$ の開近傍 $V\subset \Omega$ と $f(a)$ の開近傍 $W\subset \mathbb{R}^n$ が存在し、 $$ V\ni x\mapsto f(x)\in W $$ は全単射であり、この逆写像 $g\colon W\rightarrow V$ は $C^k$ 級である。そして、 $$ g'(y)=f'(g(y))^{-1}\quad(\forall y\in W) $$ が成り立つ。

Proof.

$f$ の代わりに $f'(a)^{-1}f\colon\Omega\ni x\mapsto f'(a)^{-1}f(x)\in \mathbb{R}^n$ を考えることで最初から $f'(a)=1$ として示せば十分である。$a$ を中心とする十分小さい閉直方体(有界閉区間の直積) $K$ を考えれば、 $$ \frac{\lvert f(x)-f(a)-(x-a)\rvert}{\lvert x-a\rvert}<1\quad(\forall x\in K\backslash\{a\}) $$ となるから、 $$ f(x)\neq f(a)\quad(\forall x\in K\backslash \{a\})\quad\quad(*) $$ が成り立つ。さらに $f$ が $C^1$ 級であることから $K$ を十分小さく取っておけば、 $$ {\rm det}(f'(x))\neq0\quad(\forall x\in K),\quad\quad(**) $$ $$ \lvert \partial_jf_i(x)-\delta_{i,j}\rvert\leq\frac{1}{2n^2}\quad(\forall x\in K, \forall i,j\in \{1,\ldots,n\})\quad\quad(***) $$ が成り立つ。$F\colon\Omega\ni x\mapsto f(x)-x\in \mathbb{R}^n$ を考えると $(***)$ より、 $$ \lvert \partial_jF_i(x)\rvert\leq\frac{1}{2n^2}\quad(\forall x\in K, \forall i,j\in \{1,\ldots,n\}) $$ であるから、平均値の定理より、 $$ \lvert F(x')-F(x)\rvert\leq \sum_{i=1}^{n}\lvert F_i(x')-F_i(x)\rvert\leq \frac{1}{2}\lvert x'-x\rvert\quad(\forall x,x'\in K) $$ となる。よって、 $$ \frac{1}{2}\lvert x'-x\rvert\leq \lvert f(x')-f(x)\rvert\quad(\forall x,x'\in K)\quad\quad(****) $$ が成り立つ。$(*)$ より $f(a)\notin f(\partial K)$ であり、$f(\partial K)$ はコンパクトであるから $\delta\in (0,\infty)$ が存在し、 $$ B(f(a),\delta)\cap f(\partial K)=\emptyset\quad\quad(*****) $$ となる。 $$ W:=\left(f(a),\text{ }\frac{\delta}{2}\right) $$ とおく。今、任意の $y\in W$ を取り、$y=f(x_0)$ なる $x_0\in K^{\circ}$ が存在することを示す。そこで、 $$ h(x):=\lvert f(x)-y\rvert^2\quad(\forall x\in K) $$ とおき、$h:K\rightarrow \mathbb{R}$ が最小値を取る点を $x_0\in K$ とおく。このとき $x_0\in K^{\circ}$ である。実際、$x_0\in \partial K$ であるとすると $(*****)$ より、 $$ \lvert f(x_0)-y\rvert\geq \lvert f(x_0)-f(a)\rvert-\lvert f(a)-y\rvert>\frac{\delta}{2}>\lvert f(a)-y\rvert $$ であるから $h(x_0)$ が $h$ の最小値であることに矛盾する。よって $x_0\in K^{\circ}$ である。$h(x_0)$ は最小値なので $h$ の $x_0\in K^{\circ}$ における微分を考えれば、 $$ 0=h'(x_0)=2(f(x_0)-y)f'(x_0) $$ となり、$(**)$ より ${\rm det}(f'(x_0))\neq0$ であるので $y=f(x_0)$ である。 これより $V:=f^{-1}(W)\cap K^{\circ}$ とおけば、 $$ V\ni x\mapsto f(x)\in W\quad\quad(******) $$ は全射であり、$(****)$より $(******)$ は単射でもある。$(******)$ の逆写像を $g:W\rightarrow V$ とおけば $(****)$ より、 $$ \lvert g(y')-g(y)\rvert\leq 2\lvert y'-y\rvert\quad(\forall y,y'\in W)\quad\quad(*******) $$ であるから $g$ は連続である。任意の $y_0\in W$、$y\in W$ $(y\neq y_0)$ を取り、$x_0=g(y_0)$、$x=g(y)$ とおけば、$(*******)$ より、 $$ \begin{aligned} \frac{\lvert g(y)-g(y_0)-f'(x_0)^{-1}(y-y_0)\rvert}{\lvert y-y_0\rvert} &\leq \frac{\lvert x-x_0 \rvert}{\lvert f(x)-f(x_0)\rvert} \frac{\lvert f'(x_0)^{-1}(f(x)-f(x_0)-f'(x_0)(x-x_0))\rvert}{\lvert x-x_0\rvert}\\ &\leq 2\lVert f'(x_0)^{-1}\rVert \frac{\lvert f(x)-f(x_0)-f'(x_0)(x-x_0)\rvert}{\lvert x-x_0\rvert} \rightarrow0\quad(y\rightarrow y_0) \end{aligned} $$ であるから、$g$ は各点で微分可能であり、 $$ g'(y)=f'(g(y))^{-1}\quad(\forall y\in W) $$ が成り立つ。$f'(g(y))$ の余因子行列 ${\rm Cof}(f'(g(y)))$ に対し、 $$ g'(y)=\frac{1}{{\rm det}(f'(g(y)))}{\rm Cof}(f'(g(y)))\quad(\forall y\in W) $$ であるから $f$ が $C^k$ 級であることと $k$ に関する帰納法より $g$ は $C^k$ 級であることが分かる。

定義7.2($C^k$ 級同相写像)

$U,V\subset \mathbb{R}^n$ を開集合とする。全単射 $f\colon U\rightarrow V$ が $C^k$ 級同相写像であるとは、$f$ と $f^{-1}:V\rightarrow U$ が共に $C^k$ 級であることを言う。

系7.3(逆関数定理の系)

$\Omega\subset \mathbb{R}^n$を開集合、$f\colon\Omega\rightarrow \mathbb{R}^n$ を $C^k$ 級写像とする。もし $f$ が単射で任意の $x\in \Omega$ に対し ${\rm det}(f'(x))\neq0$ が成り立つならば $f(\Omega)$ は $\mathbb{R}^n$ の開集合であり、$\Omega \ni x\mapsto f(x)\in f(\Omega)$ は $C^k$ 級同相写像である。

Proof.

任意の $a\in \Omega$ に対し逆関数定理(定理7.1)より $a$ の開近傍 $U_a\subset \Omega$ が存在し $f(U_a)$ は $\mathbb{R}^n$ の開集合で $U_a\ni x\mapsto f(x)\in f(U_a)$ は $C^k$ 級同相写像である。 $$ f(\Omega)=\bigcup_{a\in \Omega}f(U_a) $$ であるから $f(\Omega)$ は $\mathbb{R}^n$ の開集合である。$\Omega\ni x\mapsto f(x)\in f(\Omega)$ の逆写像を $g:f(\Omega)\rightarrow \Omega$ とおくと、任意の $a\in \Omega$ に対し $g$ の $f(U_a)$ 上への制限 $f(U_a)\ni f(x)\mapsto x\in U_a$ は $C^k$ 級であるから $g$ は $C^k$ 級である。

関連項目

脚注

  1. ただし $\lVert f'(a)\rVert$ や $\lVert g'(b)\rVert$ は作用素ノルムである。作用素ノルムについては位相線形空間1:ノルムと内積を参照。