分析力学基本原理介绍7.7:最小作用量原理

现在我们讨论另一个与哈密顿体系有关的变分原理。它涉及另一种变分——-变分。用于推导拉格朗日方程的哈密顿原理所用的是-变分。对于-变分,我们会固定路径两个端点,即,

相比之下,-变分在使用条件上会宽松一些。通常情况下,对于-变分,错误路径两个端点的时间间隔跟正确路径相比会有所不同,而且端点所对应的坐标也可能改变。

对于-变分,我们仍然可以使用与-变分相同的参化方程:

它代表一个路径曲线家族。

作用量的-变分被定义为:

其中代表剩下无数条错误路径;代表正确路径。

作用量的-变分主要由两部分造成:

1)积分边界的变分(路径端点的变分)

2)被积函数的变分(偏离正确路径)

定义中的第一项近似到一阶小量就等于被积函数乘以边界的变分;第二项则与之前的-变分类似:

让我们先考虑第二项。变化的路径仍可以使用跟之前相同的参化方程,不同的是,现在路径端点处的-变分并不等于零,所以我们要保留由分部积分法得到的端点项:

\begin{align*}\mathbf{\delta} \int_{t_1}^{t_2}\mathscr{L}\;dt &= \sum_i\int_{t_1}^{t_2}\frac{\partial\mathscr{L}}{\partial q_i}\delta q_i + \frac{\partial\mathscr{L}}{\partial \dot{q_i}}\delta\dot{q_i}\\&= \sum_i \int_{t_1}^{t_2}\frac{\partial \mathscr{L}}{\partial q_i}\delta q_idt + \sum_i\int_{t_1}^{t_2}\frac{\partial \mathscr{L}}{\partial \dot{q_i}}\delta\dot{q_i}dt\\&= \sum_i\int_{t_1}^{t_2}\frac{\partial \mathscr{L}}{\partial q_i}\delta q_idt + \sum_i \left.\frac{\partial\mathscr{L}}{\partial\dot{q_i}}\delta q_i\right|_{t_1}^{t_2} - \sum_i\int_{t_1}^{t_2}\frac{d}{dt}\left(\frac{\partial\mathscr{L}}{\partial \dot{q_i}}\right)\delta q_idt\\&= \sum_i\int_{t_1}^{t_2}\left[\frac{\partial \mathscr{L}}{\partial q_i} - \frac{d}{dt}\left(\frac{\partial\mathscr{L}}{\partial \dot{q_i}}\right)\right]\delta q_idt + \sum_i \left.\frac{\partial \mathscr{L}}{\partial \dot{q_i}}\delta q_i\right|_{t_1}^{t_2}\\&= \sum_i \left.\frac{\partial \mathscr{L}}{\partial \dot{q_i}}\delta q_i\right|_{t_1}^{t_2}\end{align*}

根据拉格朗日方程,带方括号的第一项消失。

代入作用量变分中,得

\begin{align*}\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt &= \mathscr{L}(t_2)\Delta t_2 - \mathscr{L}(t_1)\Delta t_1 + \delta\int_{t_1}^{t_2}\mathscr{L}\;dt\\&= \left.(\mathscr{L}\Delta t + \sum_ip_i\delta q_i)\right|_{t_1}^{t_2}\end{align*}

接下来我们需要将在端点,的-变分用在正确路径以及错误路径端点处的-变分来表示。我们需要找出的两种变分之间的关系。

路径家族的参化方程:

现在考虑端点。端点变化导致路径的变分为:

当和均足够小时(),

可对以及使用最优线性展开:

(已将二阶导舍去)

于是

根据-变分的定义,(),有

替换后我们就得到了两种变分的关系式:

同理,对于端点,有

所以

再代入作用量变分:

\begin{align*}\Delta \int_{t_1}^{t_2}\mathscr{L}\;dt &= \left[\mathscr{L}\Delta t + \sum_i p_i(\Delta q_i - \dot{q_i}\Delta t)\right]_{t_1}^{t_2}\\&= \left.(\sum_i p_i\Delta q_i - \mathscr{H}\Delta t)\right|_{t_1}^{t_2}\end{align*}

如果没有额外的条件,至此就不能再继续了。

为了得到最小作用量原理,系统需要满足下列三个条件:

1)系统的拉格朗日函数以及哈密顿函数不能显含时间,这也意味着是一个守恒量。

2)变分需保证不管是正确还是错误路径的哈密顿函数都是守恒的。

3)所有错误路径端点坐标的变分需为零(时间的变分不为零!)。

第三条是间接为第二条服务的。哈密顿函数,若想要保证它始终是一个守恒量,就不能改变。由于不同的路径会有不同的速度,为保证守恒,时间必须要变化。

满足上述三个条件的变分原理则简化为:

这个简洁的表达式就是最小作用量原理(principle of least action)

积分在上世纪的相关书籍中被称为作用量或作用量积分。现在人们口头常说的作用量通常指由哈密顿原理得来的积分。所以为了区分,前者有时也被称为简缩作用量(abbreviated action)

最小作用量原理形式多样。我们知道,在非相对论力学中,如果广义坐标不显含时间,动能的所有齐次展开项中只有速度的二次项不为零:

如果势函数不显含速度,拉格朗日函数的齐次展开项中速度的零次项,于是:

正则动量

利用欧拉齐次函数定理

代入最小作用量原理中,可以得到简单形式:

而如果这时系统所受合外力也为零(哈密顿函数不显含时间),总能量守恒:

动能也同样不含有时间。

于是最小作用量原理又可被进一步简化为:

这个惊人结果告诉我们,在位形空间的所有路径中,系统会选择一条使得通过两端点用时最短(严格来讲是取得极值)的路径运动。该形式的最小作用量原理又被称为费马几何光学原理(Fermat's principle in geometrical optics)或最短时间原理(principle of shortest time),它是光线传播需要遵守的法则:一条介于两点之间的光束总是会选择一条用时最短的路径传播。

你可能感兴趣的:(分析力学基本原理介绍7.7:最小作用量原理)