方向导数与圆

问题提出

上节课我们学习了偏导数——对于函数 f(x,y)=x2+y2r2f(x, y) = x^2 + y^2 - r^2,我们计算了 fx=2x\dfrac{\partial f}{\partial x} = 2xfy=2y\dfrac{\partial f}{\partial y} = 2y,并用梯度 f=(2x,2y)\nabla f = (2x, 2y) 求出了圆的切线方程。

但我留下了一个问题:

偏导数 fx\dfrac{\partial f}{\partial x} 告诉我们 ff 沿 xx 轴方向的变化率,fy\dfrac{\partial f}{\partial y} 告诉我们 ff 沿 yy 轴方向的变化率。但如果我想知道 ff 沿任意方向的变化率呢?

今天走进教室后,我在黑板上画了一个圆,然后从圆上一点出发画了好几条不同方向的箭头:

              y

         ●    |    ●
        / ↗   | ↗  \
       /  ↗   |↗    \
  ----/--●----+----●-\---→ x
       \      |      /
        \     |     /
         ●    |    ●
              |

请看——从圆上这个点出发,函数 f(x,y)=x2+y2r2f(x, y) = x^2 + y^2 - r^2 沿不同方向变化的速率是不同的。沿法线方向(指向圆外),ff 增加得最快;沿切线方向,ff 几乎不变。那沿任意一个”斜方向”呢?

我提出今天的三个核心问题:

  1. 什么是方向导数?它和偏导数有什么关系?
  2. 方向导数在圆上有什么几何意义?
  3. 梯度和方向导数之间有什么联系?

观察与猜想

第一步:从偏导数到方向导数

让我们先回顾偏导数的含义。

对于 f(x,y)=x2+y2r2f(x, y) = x^2 + y^2 - r^2

  • fx=2x\dfrac{\partial f}{\partial x} = 2x:在点 (x,y)(x, y) 处,沿 xx 轴正方向走一小步,ff 的值变化 2xΔx2x \cdot \Delta x
  • fy=2y\dfrac{\partial f}{\partial y} = 2y:在点 (x,y)(x, y) 处,沿 yy 轴正方向走一小步,ff 的值变化 2yΔy2y \cdot \Delta y

伽玛问:

这里的”沿 xx 轴正方向”其实就是沿方向 (1,0)(1, 0)。那如果沿方向 (1,1)(1, 1) 呢?或者沿方向 (3,4)(3, 4) 呢?

正是这个问题!偏导数只考虑了两个特殊方向——(1,0)(1, 0)(0,1)(0, 1)。但平面上有无穷多个方向,我们需要一个更一般的概念。

第二步:方向导数的直观理解

想象你站在山坡上的某一点。偏导数告诉你:如果你只向东走,坡度是多少;如果你只向北走,坡度是多少。但如果你向东北方向走呢?坡度是多少?这就是方向导数要回答的问题。

我在黑板上画了一个示意:

        北 (0,1)

         |
西 ←-----+----→ 东 (1,0)
         |

        南 (0,-1)

东北方向:(1,1)/√2(单位向量)

关键的想法是:任何一个方向都可以用一个单位向量 u=(u1,u2)\mathbf{u} = (u_1, u_2) 来表示(满足 u12+u22=1u_1^2 + u_2^2 = 1),然后我们问——沿着这个方向走,ff 的变化率是多少?

第三步:猜想方向导数与梯度的关系

我在黑板上写下梯度:

f=(fx,fy)\nabla f = \left(\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}\right)

偏导数 fx\dfrac{\partial f}{\partial x}ff 沿 (1,0)(1, 0) 方向的变化率,fy\dfrac{\partial f}{\partial y}ff 沿 (0,1)(0, 1) 方向的变化率。如果方向是任意的 u=(u1,u2)\mathbf{u} = (u_1, u_2),变化率应该怎么算?

阿普猜测:

会不会是某种”加权组合”?比如 u1fx+u2fyu_1 \cdot \dfrac{\partial f}{\partial x} + u_2 \cdot \dfrac{\partial f}{\partial y}

非常好!你猜到了方向导数的公式。但让我们严格地推导它。

严格证明

方向导数的定义

我解释道:

方向导数的含义是:从点 (x0,y0)(x_0, y_0) 出发,沿方向 u\mathbf{u} 走一小步 hhff 的变化量与步长之比在 h0h \to 0 时的极限。它衡量的是 ff 沿方向 u\mathbf{u}瞬时变化率

方向导数的计算公式

证明

利用可微性的定义:

f(x0+hu1,y0+hu2)f(x0,y0)=fxhu1+fyhu2+o(h)f(x_0 + hu_1, y_0 + hu_2) - f(x_0, y_0) = \frac{\partial f}{\partial x} hu_1 + \frac{\partial f}{\partial y} hu_2 + o(h)

两边除以 hh

f(x0+hu1,y0+hu2)f(x0,y0)h=fxu1+fyu2+o(h)h\frac{f(x_0 + hu_1, y_0 + hu_2) - f(x_0, y_0)}{h} = \frac{\partial f}{\partial x} u_1 + \frac{\partial f}{\partial y} u_2 + \frac{o(h)}{h}

h0h \to 0,余项 o(h)h0\dfrac{o(h)}{h} \to 0,得到:

Duf=fxu1+fyu2=fuD_{\mathbf{u}} f = \frac{\partial f}{\partial x} u_1 + \frac{\partial f}{\partial y} u_2 = \nabla f \cdot \mathbf{u}

证毕。

在圆上的应用

现在让我们把这个公式应用到圆上。

f(x,y)=x2+y2r2f(x, y) = x^2 + y^2 - r^2,其梯度为 f=(2x,2y)\nabla f = (2x, 2y)

在圆上一点 (x0,y0)(x_0, y_0)(满足 x02+y02=r2x_0^2 + y_0^2 = r^2),沿方向 u=(u1,u2)\mathbf{u} = (u_1, u_2) 的方向导数为:

Duf(x0,y0)=2x0u1+2y0u2D_{\mathbf{u}} f(x_0, y_0) = 2x_0 u_1 + 2y_0 u_2

沿法线方向(指向圆外)

圆在 (x0,y0)(x_0, y_0) 处的外法线方向为 n=(x0,y0)r\mathbf{n} = \dfrac{(x_0, y_0)}{r}(归一化后的梯度方向)。

Dnf=2x0x0r+2y0y0r=2(x02+y02)r=2r2r=2rD_{\mathbf{n}} f = 2x_0 \cdot \frac{x_0}{r} + 2y_0 \cdot \frac{y_0}{r} = \frac{2(x_0^2 + y_0^2)}{r} = \frac{2r^2}{r} = 2r

沿法线方向,ff2r2r 的速率增加——这是 ff 增加最快的方向。

沿切线方向

圆在 (x0,y0)(x_0, y_0) 处的切线方向为 t=(y0,x0)r\mathbf{t} = \dfrac{(-y_0, x_0)}{r}(与法线垂直)。

Dtf=2x0y0r+2y0x0r=2x0y0+2y0x0r=0D_{\mathbf{t}} f = 2x_0 \cdot \frac{-y_0}{r} + 2y_0 \cdot \frac{x_0}{r} = \frac{-2x_0 y_0 + 2y_0 x_0}{r} = 0

沿切线方向,ff 的变化率为零!这在几何上完全合理——沿圆的切线走,你始终在圆上,ff 的值始终为 00,所以变化率为零。

方向导数的极值:梯度的几何意义

从公式 Duf=fuD_{\mathbf{u}} f = \nabla f \cdot \mathbf{u} 出发,利用点积的性质:

Duf=fucosθ=fcosθD_{\mathbf{u}} f = |\nabla f| \cdot |\mathbf{u}| \cdot \cos\theta = |\nabla f| \cos\theta

其中 θ\theta 是梯度方向与 u\mathbf{u} 方向之间的夹角。

由此可得:

  • θ=0\theta = 0u\mathbf{u} 与梯度同向)时,Duf=fD_{\mathbf{u}} f = |\nabla f|,方向导数最大
  • θ=π\theta = \piu\mathbf{u} 与梯度反向)时,Duf=fD_{\mathbf{u}} f = -|\nabla f|,方向导数最小
  • θ=π/2\theta = \pi/2u\mathbf{u} 与梯度垂直)时,Duf=0D_{\mathbf{u}} f = 0

例题:计算方向导数

例题 1:设 f(x,y)=x2+y21f(x, y) = x^2 + y^2 - 1,在点 (12,12)\left(\dfrac{1}{\sqrt{2}}, \dfrac{1}{\sqrt{2}}\right) 处,计算沿方向 u=(12,32)\mathbf{u} = \left(\dfrac{1}{2}, \dfrac{\sqrt{3}}{2}\right) 的方向导数。

f=(2x,2y)=(2,2)\nabla f = (2x, 2y) = \left(\sqrt{2}, \sqrt{2}\right)

Duf=fu=212+232=22(1+3)1.932D_{\mathbf{u}} f = \nabla f \cdot \mathbf{u} = \sqrt{2} \cdot \frac{1}{2} + \sqrt{2} \cdot \frac{\sqrt{3}}{2} = \frac{\sqrt{2}}{2}(1 + \sqrt{3}) \approx 1.932

例题 2:对于同样的函数和点,方向导数最大值是多少?沿哪个方向取得?

方向导数的最大值等于梯度的模:

f=(2)2+(2)2=4=2|\nabla f| = \sqrt{(\sqrt{2})^2 + (\sqrt{2})^2} = \sqrt{4} = 2

沿梯度方向 ff=(12,12)\dfrac{\nabla f}{|\nabla f|} = \left(\dfrac{1}{\sqrt{2}}, \dfrac{1}{\sqrt{2}}\right) 取得最大值。

结论与应用

核心结论

应用:用方向导数理解温度分布

让我们看一个物理应用。

假设一块圆形金属板的温度分布为 T(x,y)=x2+y2T(x, y) = x^2 + y^2(中心温度低,边缘温度高)。在点 (x0,y0)(x_0, y_0) 处:

  • 梯度 T=(2x0,2y0)\nabla T = (2x_0, 2y_0) 指向温度增加最快的方向——即指向圆外
  • 沿法线方向,温度上升最快(热量向外扩散)
  • 沿切线方向,温度不变(同一条等温线上温度相同)

这和圆上的方向导数分析完全对应!温度的等值线是同心圆,梯度垂直于等温线——这就是为什么热量总是沿垂直于等温线的方向流动。

呼噜星人的收获

下课铃响了。学生们围过来分享感受。

阿普说:

方向导数让我真正理解了梯度的含义。偏导数只是沿两个方向的变化率,但方向导数告诉我们任意方向的变化率,而梯度是这些变化率中最大的那个。

贝塔补充道:

我最喜欢的是圆上切线方向导数为零的结论。f(x,y)=x2+y2r2f(x, y) = x^2 + y^2 - r^2 在圆上恒为零,所以沿切线走 ff 不变——这完全符合直觉,但用公式推导出来更有说服力。

伽玛说:

温度分布的例子让我看到了方向导数的实用价值。梯度指向温度增加最快的方向——这和物理中的热传导方向完全一致。

咕噜最后总结:

今天最深刻的一课是:偏导数是”坐标系的语言”,方向导数是”几何的语言”。偏导数依赖于 xx 轴和 yy 轴的选择,但方向导数告诉我们:不管你用什么坐标系,函数在每一点都有一个”最陡的方向”——那就是梯度方向。这个方向是几何内禀的,不依赖坐标。

我笑着在黑板上写下最后一句话:

方向导数是偏导数的”推广”——从两个方向到无穷多个方向。而梯度,是所有方向导数中最强的那个,它指向函数增长的”最陡坡”。在圆上,这个最陡坡永远指向圆外。