【初等数论】指数、原根与不定方程

【初等数论】指数、原根与不定方程

1、指数

现在我们就开始为剩余系建立“坐标”,完全剩余系是连续的,剩余类本身就是很好的坐标,所以这里我们只需讨论既约剩余系。前面已经知道 ( a , m ) = 1 (a,m)=1 (a,m)=1时,总存 d 在使得 a d ≡ 1 ( m o d m ) a^d\equiv 1\pmod{m} ad1(modm),满足条件的最小的 d 0 = δ m ( a ) d_0=\delta_m(a) d0=δm(a)称为a对模m的阶或指数,也可简记为 δ ( a ) \delta(a) δ(a),我们可以看出来当模 m 确定时, d 0 d_0 d0由 a 唯一的确定,d 是 a 的函数。为了得到更进一步的结论,我们先整理一下指数的一些简单性质如下:
(1)若 a d ≡ 1 ( m o d m ) a^d\equiv 1\pmod{m} ad1(modm),则 δ m ( a ) ∣ d \delta_m(a)\mid d δm(a)d。从而有若 a h ≡ a d ( m o d m ) a^h\equiv a^d\pmod{m} ahad(modm),则 h ≡ d ( m o d m ) h\equiv d\pmod{m} hd(modm)
(2) δ m ( a ) ∣ φ ( m ) \delta_m(a)|\varphi(m) δm(a)φ(m) δ m ( a − 1 ) = δ m ( a ) \delta_m(a^{-1})=\delta_m(a) δm(a1)=δm(a)

我们来继续研究指数的性质,首先考虑 δ ∗ = δ m ( a n ) \delta^*=\delta_m(a^n) δ=δm(an),由 a n δ ∗ ≡ 1 ( m o d m ) a^{n\delta^*}\equiv 1\pmod{m} anδ1(modm) δ m ( a ) ∣ n δ ∗ \delta_m(a)\mid n\delta^* δm(a)nδ,故可容易有公式(1),你可以简单停留思考下,有了(1)式后我们就可以从 δ m ( a ) \delta_m(a) δm(a) δ m ( a n ) \delta_m(a^n) δm(an) 了。其次由定义显然有:若 n ∣ m n∣m nm,则 δ n ( a ) ∣ δ m ( a ) \delta_n(a)\mid \delta_m(a) δn(a)δm(a)。所以对互质分解 m = m 1 m 2 ⋯ m n m=m_1m_2\cdots m_n m=m1m2mn (分解模数),总有 δ m k ( a ) ∣ δ m ( a ) \delta_{m_k}(a)\mid \delta_m(a) δmk(a)δm(a),再根据模的性质就有公式(2)。再进一步,对任意的a1,a2,⋯,an,考虑方程组 x ≡ a k ( m o d m k ) x\equiv a_k\pmod{m_k} xak(modmk)唯一解 a剩余定理),显然有 δ m k ( a ) = δ m k ( a k ) \delta_{m_k}(a)=\delta_{m_k}(a_k) δmk(a)=δmk(ak) ,再根据公式(2)可得 a 满足公式(3)。
δ m ( a n ) = δ m ( a ) ( δ m ( a ) , n ) (1) \delta_m(a^n)=\dfrac{\delta_m(a)}{(\delta_m(a),n)}\tag{1} δm(an)=(δm(a),n)δm(a)(1) δ m ( a ) = [ δ m 1 ( a ) , δ m 2 ( a ) , ⋯   , δ m n ( a ) ] (2) \delta_m(a)=[\delta_{m_1}(a),\delta_{m_2}(a),\cdots,\delta_{m_n}(a)]\tag{2} δm(a)=[δm1(a),δm2(a),,δmn(a)](2) δ m ( a ) = [ δ m 1 ( a 1 ) , δ m 2 ( a 2 ) , ⋯   , δ m n ( a n ) ] (3) \delta_m(a)=[\delta_{m_1}(a_1),\delta_{m_2}(a_2),\cdots,\delta_{m_n}(a_n)]\tag{3} δm(a)=[δm1(a1),δm2(a2),,δmn(an)](3)
 
  再来研究 δ m ( a ) , a = a 1 a 2 ⋯ a n \delta_m(a),a=a_1a_2\cdots a_n δm(a),a=a1a2an(分解底数),令 β = [ δ ( a 1 ) , ⋯   , δ ( a n ) ] \beta=[\delta(a_1),\cdots,\delta(a_n)] β=[δ(a1),,δ(an)],则显然有 δ ( a ) ∣ β \delta(a)\mid \beta δ(a)β(提示:可以结合(1)式进行思考)。先看各个 δ ( a k ) \delta(a_k) δ(ak) 互素的情况,这时 β = δ ( a 1 ) δ ( a 2 ) ⋯ δ ( a n ) \beta=\delta(a_1)\delta(a_2)\cdots\delta(a_n) β=δ(a1)δ(a2)δ(an),令 β k = β δ ( a k ) \beta_k=\dfrac{\beta}{\delta(a_k)} βk=δ(ak)β。因为 1 ≡ a δ ( a ) β k ≡ ( a k × a ! k ) δ ( a ) β k ≡ a k δ ( a ) β k ( a ! k β k ) δ ( a ) ≡ a k δ ( a ) β k ( m o d m ) 1\equiv a^{\delta(a)\beta_k}\equiv (a_k \times a_{!k})^{\delta(a)\beta_k}\equiv a_k^{\delta(a)\beta_k}(a_{!k}^{\beta_k})^{\delta(a)}\equiv a_k^{\delta(a)\beta_k}\pmod{m} 1aδ(a)βk(ak×a!k)δ(a)βkakδ(a)βk(a!kβk)δ(a)akδ(a)βk(modm),又因为 δ ( a k ) \delta(a_k) δ(ak)互素。故 δ ( a k ) ∣ δ ( a ) \delta(a_k)\mid \delta(a) δ(ak)δ(a),从而有公式(4)。如果 δ ( a k ) \delta(a_k) δ(ak)不互素,一般并没有 δ ( a ) = β \delta(a)=\beta δ(a)=β。但反过来,对任意的 a 1 , a 2 , ⋯   , a n a_1,a_2,\cdots,a_n a1,a2,,an,利用公式(1)和(4)构造满足公式(5)的 a 还是很容易的。
  δ m ( a ) = δ m ( a 1 ) δ m ( a 2 ) ⋯ δ m ( a n ) (4) \delta_m(a)=\delta_m(a_1)\delta_m(a_2)\cdots\delta_m(a_n)\tag{4} δm(a)=δm(a1)δm(a2)δm(an)(4) δ m ( a ) = [ δ m ( a 1 ) , δ m ( a 2 ) , ⋯   , δ m ( a n ) ] (5) \delta_m(a)=[\delta_m(a_1),\delta_m(a_2),\cdots,\delta_m(a_n)]\tag{5} δm(a)=[δm(a1),δm(a2),,δm(an)](5)
 
  指数在研究循环小数时有个有趣的结论。对既约分数 a b \dfrac{a}{b} ba,如果有 b = 2 m ⋅ 5 n ⋅ k b=2^m\cdot 5^n\cdot k b=2m5nk,则 a b \dfrac{a}{b} ba是循环小数的充要条件是 ( 10 , k ) = 1 , k > 1 (10,k)=1,k>1 (10,k)=1,k>1。如果 δ k ( 10 ) = c \delta_k(10)=c δk(10)=c,则最小循环周期为 c,并且小数点后的非循环数长度为 m a x ( m , n ) max(m,n) max(m,n)。特别地,如果 ( 10 , b ) = 1 (10,b)=1 (10,b)=1,则 a b \dfrac{a}{b} ba是纯循环小数。证明过程不是难,可以作为练习,提示:使用关系式 1 0 c ≡ 1 ( m o d k ) 10^c\equiv 1\pmod{k} 10c1(modk)

2、原根

由指数的性质(2)可知 a , a 2 , ⋯   , a δ m ( a ) a,a^2,\cdots,a^{\delta_m(a)} a,a2,,aδm(a) δ m ( a ) \delta_m(a) δm(a)个不同的数,特别地当 δ m ( a ) = φ ( m ) \delta_m(a)=\varphi(m) δm(a)=φ(m)时,它们遍历 m 的既约剩余系。这种关系使得既约剩余系变得特别简单,我们也由此找到了合适的坐标。为此,当 δ m ( g ) = φ ( m ) \delta_m(g)=\varphi(m) δm(g)=φ(m) 时称 g称为模 m的原根,它便是既约剩余系的单位元,负责将剩余系串成一个线性空间。先来思考如下几个问题:
 
• 如果 ( n , φ ( m ) ) = 1 (n,\varphi(m))=1 (n,φ(m))=1,则 x x x遍历m的既约剩余系时, x n x^n xn也遍历既约剩余系;
• 若 q ≡ 1 ( m o d 4 ) , p = 2 q + 1 q\equiv 1\pmod{4},p=2q+1 q1(mod4),p=2q+1,或 q ≡ 1 ( m o d 2 ) , p = 4 q + 1 q\equiv 1\pmod{2},p=4q+1 q1(mod2),p=4q+1,都有 2 是 p p p的原根;
a n − b n a^n−b^n anbn的素因子有形式 k n + 1 kn+1 kn+1 a m − b m , ( m ∣ n ) a^m−b^m,(m|n) ambm,(mn)

我们自然会有问题:什么样的模数有原根?有多少个原根?如何判定?前面已经知道 δ ( a ) ∣ β \delta(a)\mid \beta δ(a)β,而除了 1 , 2 , 4 , p e , 2 p e 1,2,4,p^e,2p^e 1,2,4,pe,2pe这5种情况外(p为奇素数),容易证明其它都有 β < φ ( m ) \beta<\varphi(m) β<φ(m),它们肯定没有原根,因为当模数 m 不属于上面这五种情况时,必有 m 为 2 a ( a ≥ 3 ) , 2^a (a \geq3), 2a(a3), 2 a p 1 a 1 ⋅ ⋅ ⋅ p r a r ( a ≥ 2 , r ≥ 1 ) 2^ap_1^{a_1}···p_r^{a_r} (a \geq 2, r \geq 1) 2ap1a1prar(a2,r1) 2 a p 1 a 1 ⋅ ⋅ ⋅ p r a r ( a ≥ 0 , r ≥ 2 ) 2^ap_1^{a_1}···p_r^{a_r} (a \geq 0, r \geq 2) 2ap1a1prar(a0,r2),而这里的 β \beta β [ 2 c 0 , ϕ ( p 1 a 1 ) , ⋅ ⋅ ⋅ , ϕ ( p r a r ) ] [2^{c_0}, \phi(p_1^{a_1}),···,\phi(p_r^{a_r})] [2c0,ϕ(p1a1),,ϕ(prar)] 给出。这里的 c 0 c_0 c0 由下列式子给出:
  c 0 = {   0 , a 0 = 0 , 1 ; 1 , a 0 = 2 ; a 0 − 2 , a 0 ≥ 3. c_0 = \left\{\begin{matrix} & \ 0, \qquad a_0 = 0, 1;\\ & 1, \qquad a_0 = 2;\\ & a_0 - 2, \quad a_0 \geq3. \end{matrix}\right. c0= 0,a0=0,1;1,a0=2;a02,a03. 又因为我们有式子, δ 2 l ( a ) ∣   2 l − 2 , l ≥ 3 \delta_{2^l}(a) | \ 2^{l-2}, l \geq 3 δ2l(a) 2l2,l3 故可以得到 β < φ ( m ) \beta<\varphi(m) β<φ(m) ,可自行验证。

下面就需要论证那5种情况是否有原根,直接验算可知1,2,4有原根。对于模p的情况,由公式(5)知存在g使得 δ ( g ) = [ δ ( 1 ) δ ( 2 ) ⋯ δ ( p − 1 ) ] \delta(g)=[\delta(1)\delta(2)\cdots\delta(p-1)] δ(g)=[δ(1)δ(2)δ(p1)],首先当然有 δ ( g ) ∣ p − 1 \delta(g)|p-1 δ(g)p1。另外因为 x δ ( g ) − 1 ≡ 0 ( m o d p ) x^{\delta(g)}-1\equiv 0\pmod{p} xδ(g)10(modp)有全解,则 p − 1 ∣ δ ( g ) p-1|\delta(g) p1δ(g) 。从而 δ ( g ) = p − 1 \delta(g)=p-1 δ(g)=p1,所以p有原根 g。

g d ≡ 1 ( m o d p e ) g^d\equiv 1\pmod{p^e} gd1(modpe) g d ≡ 1 ( m o d 2 p e ) g^d\equiv 1\pmod{2p^e} gd1(mod2pe) 的等价性,并且 φ ( p e ) = φ ( 2 p e ) \varphi(p^e)=\varphi(2p^e) φ(pe)=φ(2pe),可知 p e p^e pe 2 p e 2p^e 2pe有相同的原根,这样一来我们就只需要讨论模 p e p^e pe是否有原根了。当g是 p n p^n pn原根时,因为 p n ∣ p n + 1 p^n\mid p^{n+1} pnpn+1,故 δ p n + 1 ( g ) \delta_{p^{n+1}}(g) δpn+1(g) φ ( p n ) φ(p^n) φ(pn) φ ( p n + 1 ) φ(p^n+1) φ(pn+1)。要想g也是 p n + 1 p^n+1 pn+1的原根,必须 δ p n + 1 ( g ) = φ ( p n + 1 ) \delta_{p^{n+1}}(g)=\varphi(p^{n+1}) δpn+1(g)=φ(pn+1),即满足式子(6)。而如果该条件满足,用归纳法可以验算得它对一切 g φ ( p e ) , ( e ⩾ n ) g^{\varphi(p^e)},(e\geqslant n) gφ(pe),(en)都满足,即g是所有 p e p^e pe的原根。
g φ ( p n ) = 1 + r ( n ) p n , p ∤ r ( n ) (6) g^{\varphi(p^n)}=1+r(n)p^n,\quad p\nmid r(n)\tag{6} gφ(pn)=1+r(n)pn,pr(n)(6)
 
 现在只要能证明以上条件对 n = 1 n=1 n=1成立(即 g p − 1 = 1 + r p , p ∤ r g^{p-1}=1+rp,p\nmid r gp1=1+rp,pr),我们就找到了所有模 p e p^e pe的原根,研究证明了 p e p^e pe原根的存在性。对模 p 的原根 g,考察 g k = g + k p , k = 0 , 1 , ⋯   , p − 1 g_k=g+kp,k=0,1,\cdots,p-1 gk=g+kp,k=0,1,,p1 和式子(7)中的变形。 r + ( p − 1 ) g p − 2 k r+(p-1)g^{p-2}k r+(p1)gp2k 中有且仅一个是 p 的倍数,取其它任何一个值都能得到了满足条件的原根,条件得证。
g k p − 1 ≡ g p − 1 + ( p − 1 ) g p − 2 p k ≡ 1 + p ( r + ( p − 1 ) g p − 2 k ) ( m o d p ) (7) g_k^{p-1}\equiv g^{p-1}+(p-1)g^{p-2}pk\equiv 1+p(r+(p-1)g^{p-2}k)\pmod{p}\tag{7} gkp1gp1+(p1)gp2pk1+p(r+(p1)gp2k)(modp)(7)

至此我们已经证明了原根存在的充要条件是模为 1 , 2 , 4 , p e , 2 p e 1,2,4,p^e,2p^e 1,2,4,pe,2pe 之一,但如果想要找出原根,目前还没有很简单的方法。一般只能逐个尝试每个数,然而利用公式(5)的构造法是可以加快计算的,比如如果已经知道 δ 41 ( 2 ) = 20 \delta_{41}(2)=20 δ41(2)=20 δ 41 ( 3 ) = 8 \delta_{41}(3)=8 δ41(3)=8,因为 [ 20 , 8 ] = 40 [20,8]=40 [20,8]=40,故素因子 2,3 必定也是模 41 的原根的素因子,经过尝试后得 2 4 ⋅ 3 ≡ 7 ( m o d 41 ) 2^4\cdot 3\equiv 7\pmod{41} 2437(mod41)是 41 的原根。

如果原根存在,选定一个原根 g 后,它的幂次遍历整个既约剩余系。如果 g k ≡ a ( m o d m ) g^k\equiv a\pmod{m} gka(modm),称 k 为a 的指标,记作 γ m , g ( a ) \gamma_{m,g}(a) γm,g(a),或简记为 γ g ( a ) \gamma_g(a) γg(a) γ ( a ) \gamma(a) γ(a)。指标将既约剩余系变成了一个完全剩余系,使其结构由分散的变为线性的,由此可以更好地研究它的性质。以下为原根的一些性质,其中性质(3)中蕴含了指数为 d ∣ φ ( m ) d\mid \varphi(m) dφ(m)的数有 φ(d)个,它们是 g φ ( m ) d k , ( k , d ) = 1 g^{\frac{\varphi(m)}{d}k},(k,d)=1 gdφ(m)k,(k,d)=1。特别地共有 φ ( φ ( m ) ) \varphi(\varphi(m)) φ(φ(m))个原根,它们是 g k , ( k , φ ( m ) ) = 1 g^k,(k,\varphi(m))=1 gk,(k,φ(m))=1

(1) γ m , g ( a b ) ≡ γ m , g ( a ) + γ m , g ( b ) ( m o d φ ( m ) ) \gamma_{m,g}(ab)\equiv\gamma_{m,g}(a)+\gamma_{m,g}(b)\pmod{\varphi(m)} γm,g(ab)γm,g(a)+γm,g(b)(modφ(m))
(2) γ g 1 ( a ) ≡ γ g 1 ( g 2 ) γ g 2 ( a ) ( m o d φ ( m ) ) \gamma_{g_1}(a)\equiv\gamma_{g_1}(g_2)\gamma_{g_2}(a)\pmod{\varphi(m)} γg1(a)γg1(g2)γg2(a)(modφ(m)),特别地有 γ g 1 ( g 2 ) γ g 2 ( g 1 ) ≡ 1 ( m o d φ ( m ) ) \gamma_{g_1}(g_2)\gamma_{g_2}(g_1)\equiv 1\pmod{\varphi(m)} γg1(g2)γg2(g1)1(modφ(m))
(3) δ m ( a ) = φ ( m ) ( γ m , g ( a ) , φ ( m ) ) \delta_m(a)=\dfrac{\varphi(m)}{(\gamma_{m,g}(a),\varphi(m))} δm(a)=(γm,g(a),φ(m))φ(m)

我们一直想把指数当做即约剩余系的“坐标”,现在就来着手做这件事。一般的,将模m进行素数分解 2 e 0 ⋅ p 1 e 1 ⋅ ⋯ p n e n 2^{e_0}\cdot p_1^{e_1}\cdot\cdots p_n^{e_n} 2e0p1e1pnen,其既约剩余系的每个数 a 在各个维度都有一个值 a k a_k ak。对 p k e k , 前 面 的 证 明 保 证 了 它 有 原 根 p^{e_k}_k,前面的证明保证了它有原根 pkekg_k$ 和 γ k = γ p k e k , g k ( a k ) \gamma_k=\gamma_{p_k^{e_k},g_k}(a_k) γk=γpkek,gk(ak)就可以看做a 在第 k 维的坐标。

但对于 2 e 0 2^{e_0} 2e0,除 e 0 < 3 e_0<3 e0<3外是没有原根的, e 0 ⩾ 3 e_0\geqslant 3 e03时怎么建立坐标?通过归纳法你可以证明 δ 2 e ( 5 ) = 2 e − 2 \delta_{2^e}(5)=2^{e-2} δ2e(5)=2e2,并且容易知道 ± 5 0 , ± 5 1 , ⋯   , ± 5 2 e − 2 − 1 \pm 5^0,\pm 5^1,\cdots,\pm 5^{2^{e-2}-1} ±50,±51,,±52e21是它的一个既约剩余系。这样任何既约数都有唯一表达式(8), γ − 1 , γ 0 \gamma_{-1},\gamma_0 γ1,γ0就可以看做它的坐标。完整的就得到任何既约数的指标表达式(9)和(10)((10)中 g ~ k γ k \tilde{g}_k^{\gamma_k} g~kγk的是(9)中的 γ k γ_k γk取1、其它取0得来),使用(10)来证明威尔逊定理就简单多了。
( − 1 ) γ − 1 5 γ 0 , ( 0 ⩽ γ − 1 < 2 ,   0 ⩽ γ 0 < 2 e − 2 ) (8) (-1)^{\gamma_{-1}}5^{\gamma_0},\quad (0\leqslant \gamma_{-1}<2,\:0\leqslant \gamma_0<2^{e-2})\tag{8} (1)γ15γ0,(0γ1<2,0γ0<2e2)(8) a ≡ M 0 − 1 M 0 ( − 1 ) γ − 1 5 γ 0 + M 1 − 1 M 1 g 1 γ 1 + ⋯ + M n − 1 M n g n γ n ( m o d m ) (9) a\equiv M_0^{-1}M_0(-1)^{\gamma_{-1}}5^{\gamma_0}+M_1^{-1}M_1g_1^{\gamma_1}+\cdots+M_n^{-1}M_ng_n^{\gamma_n}\pmod{m}\tag{9} aM01M0(1)γ15γ0+M11M1g1γ1++Mn1Mngnγn(modm)(9) a ≡ g ~ − 1 γ − 1 ⋅ g ~ 0 γ 0 ⋅ g ~ 1 γ 1 ⋯ g ~ n γ n ( m o d m ) (10) a\equiv \tilde{g}_{-1}^{\gamma_{-1}}\cdot\tilde{g}_0^{\gamma_0}\cdot\tilde{g}_1^{\gamma_1}\cdots\tilde{g}_n^{\gamma_n}\pmod{m}\tag{10} ag~1γ1g~0γ0g~1γ1g~nγn(modm)(10)

3、二项同余方程

最后再来看同余方程(11)它一般称为二项同余方程。如果方程有解,称a为m的n次剩余,否则称为n次非剩余。对m进行素数分解 2 e 0 ⋅ p 1 e 1 ⋅ ⋯ p n e n 2^{e_0}\cdot p_1^{e_1}\cdot\cdots p_n^{e_n} 2e0p1e1pnen后,方程可以化为一个方程组,我们只需分别讨论这些方程即可。
x n ≡ a ( m o d m ) (11) x^n\equiv a\pmod{m}\tag{11} xna(modm)(11)
  
  模 p e p^e pe(p为奇素数)有原根 g,用它来分析二项方程会很简单(下面的讨论针对有原根的模m都成立)。将原根带入原方程,得到式子(12)的左侧,它显然对应于右侧的一元一次同余方程。可以先回顾一下一次方程 a x ≡ b ( m o d m ) ax\equiv b\pmod{m} axb(modm)的特点,令 d = ( a , m ) d=(a,m) d=(a,m),则 d ∣ b d\mid b db,且方程解的周期为 m d \dfrac{m}{d} dm,请先在脑子想象一下它们的布局。回到原方程,令 d = ( n , φ ( m ) ) d=(n,\varphi(m)) d=(n,φ(m)),则方程有解的充要条件是 d ∣ γ ( a ) d|\gamma(a) dγ(a),且共有 φ ( m ) d \dfrac{\varphi(m)}{d} dφ(m)个n次剩余。方程的解有d个,它们的周期是 φ ( m ) d \dfrac{\varphi(m)}{d} dφ(m)
( g y ) n ≡ g γ ( a ) ( m o d m )   ⇔   n y ≡ γ m , g ( a ) ( m o d φ ( m ) ) (12) (g^y)^n\equiv g^{\gamma(a)}\pmod{m}\:\Leftrightarrow\:ny\equiv \gamma_{m,g}(a)\pmod{\varphi(m)}\tag{12} (gy)ngγ(a)(modm)nyγm,g(a)(modφ(m))(12)
  
  现在来把条件 d ∣ γ ( a ) d|\gamma(a) dγ(a)转化为与a直接相关的。因为 a = g γ ( a ) a=g^\gamma(a) a=gγ(a),使用公式(1)直接有式子(13)。结合条件d|γ(a),显然有 δ ( a ) ∣ φ ( m ) d \delta(a)|\dfrac{\varphi(m)}{d} δ(a)dφ(m),它又等价于公式(14)。这就是方程有解的充要条件,明显二次剩余的判定条件只是它的特例。
φ ( m ) = ( φ ( m ) , γ ( a ) ) δ m ( a ) (13) \varphi(m)=(\varphi(m),\gamma(a))\delta_m(a)\tag{13} φ(m)=(φ(m),γ(a))δm(a)(13) a φ ( m ) ( n , φ ( m ) ) ≡ 1 ( m o d m ) (14) a^{\frac{\varphi(m)}{(n,\varphi(m))}}\equiv 1\pmod{m}\tag{14} a(n,φ(m))φ(m)1(modm)(14)

对模 m = 2 e m=2^e m=2e的情景需要单独考虑,前面的讨论中说明了它的既约剩余系有两个独立的维度,故只需分别讨论两个维度就行了。令 a = ( − 1 ) γ − 1 5 γ 0 , d = ( n , 2 e − 2 ) a=(-1)^{\gamma_{-1}}5^{\gamma_0},d=(n,2^{e-2}) a=(1)γ15γ0,d=(n,2e2),可知方程有解的充要条件是 ( n , 2 ) ∣ γ − 1 (n,2)\mid\gamma_{-1} (n,2)γ1 d ∣ γ 0 d\mid\gamma_0 dγ0,方程解的个数为 ( n , 2 ) d (n,2)d (n,2)d。展开说就是,当 2 ∤ n 2\nmid n 2n时有且仅有1解,既约剩余系的每个值都是n次剩余。当 2 ∣ n 2\mid n 2n时有解的充要条件是 a = 5 γ 0 a=5^{\gamma_0} a=5γ0 d ∣ γ 0 d\mid\gamma_0 dγ0,并且有2d个解,共有 2 e − 2 d \dfrac{2^{e-2}}{d} d2e2个数是n次剩余。

下面把 2 ∣ n 2∣n 2n有解的充要条件转化为与 a 相关的,首先易知必有形式 d = 2 λ , ( λ ⩾ 1 ) d=2^{\lambda},(\lambda\geqslant 1) d=2λ,(λ1)。因为 δ 2 λ + 2 ( 5 ) = 2 λ = d \delta_{2^{\lambda+2}}(5)=2^{\lambda}=d δ2λ+2(5)=2λ=d,我们的条件 d ∣ γ 0 d\mid\gamma_0 dγ0其实等价于 δ 2 λ + 2 ( 5 ) = 2 λ = d \delta_{2^{\lambda+2}}(5)=2^{\lambda}=d δ2λ+2(5)=2λ=d,这就得到充要条件为公式(15)。当然你也可以得到与 p e p^e pe类似的式子,但因为不如上式简洁,这里就不赘述了。
a ≡ 1 ( m o d 2 λ + 2 ) , 2 λ = ( n , 2 e − 2 ) ,   ( λ ⩾ 1 ) (15) a\equiv 1\pmod{2^{\lambda+2}},\quad2^{\lambda}=(n,2^{e-2}),\:(\lambda\geqslant 1)\tag{15} a1(mod2λ+2),2λ=(n,2e2),(λ1)(15)

不定方程

经过前面关于初等数论的基础知识的学习和理解,这里我们就可以开始不定方程的简单论述。不定方程是初等数论向前发展直接的驱动力之一。不定方程又叫丢潘图方程,它们以整数(或有理数)为变量和参数,而且有两个以上的未知数,多以多项式形式出现。不定方程既是数论的应用,也是数论理论形成的来源,对不定方程的思考可以将前面学习过的知识和内容串起来。

4、一次不定方程

最简单的不定方程就是一次方程(1),它表现为一个多元线性方程。如果你还记得前面最大公约数的线性组合定义,就容易得到方程有整数解的充要条件是 ( a 1 , a 2 , ⋯   , a n ) ∣ c (a_1,a_2,\cdots,a_n)\mid c (a1,a2,,an)c。多元方程的第一步往往是降元,令 d = ( a 2 , ⋯   , a n ) , a k ′ = a k d d=(a_2,\cdots,a_n),a'_k=\dfrac{a_k}{d} d=(a2,,an),ak=dak,则方程等价于一次方程组(2)(想想为什么?以及为什么要先抽出最大公约数?)。如果对(2)式一直做类似处理,就会得到多个二元一次方程,这样就把问题集中到了简单的情景。
a 1 x 1 + a 2 x 2 + ⋯ + a n x n = c (1) a_1x_1+a_2x_2+\cdots+a_nx_n=c\tag{1} a1x1+a2x2++anxn=c(1) {   a 1 x 1 + d y = c   a 2 ′ x 2 + ⋯ + a n ′ x n = y (2) \begin{cases}\:a_1x_1+dy=c\\\:a'_2x_2+\cdots+a'_nx_n=y\end{cases}\tag{2} {a1x1+dy=ca2x2++anxn=y(2)

而对于二元一次方程 a x + b y = c ax+by=c ax+by=c,它有明显的几何意义,方程的解就是直线方程上的整数点,所有对其讨论都可以从图形中找出。容易看出,如果已知一个解 x 0 , y 0 x_0,y_0 x0,y0,则方程的全部解为公式(3)。至于如何求得一个特解,一般还是用辗转相除法,对于一些简单的情况,也可以直接尝试各种值。
{   x = x 0 + b ( a , b ) k   y = y 0 − a ( a , b ) k ,   k = 0 , ± 1 , ± 2 , ⋯ (3) \begin{cases}\:x=x_0+\dfrac{b}{(a,b)}k\\\:y=y_0-\dfrac{a}{(a,b)}k\end{cases},\:k=0,\pm 1,\pm 2,\cdots\tag{3} x=x0+(a,b)bky=y0(a,b)ak,k=0,±1,±2,(3)

5、商高方程及其扩展

5.1 商高方程

勾股定理 x 2 + y 2 = z 2 x^2+y^2=z^2 x2+y2=z2 大家都熟悉,有一个自然的问题是:如何求它的所有解?这个问题一般叫商高方程或毕达哥拉斯方程。容易证明当 ( x , y ) = 1 (x,y)=1 (x,y)=1时方程的解两两互素,如果再限定解为正数,这样的解叫本原解。方程的解要么是平凡解 (0,0,0),要么是本原解的倍数,因此我们只需专注于找到所有本原解。

另外,因为素数的平方只能是 4 k + 1 4k+1 4k+1的形式,可推得 x,y 必定是一奇一偶,下面就假设 y 为偶数,原方程整理为式子(4)。容易证明 ( z + a 2 , z − a 2 ) = 1 (\dfrac{z+a}{2},\dfrac{z-a}{2})=1 (2z+a,2za)=1(这个性质以后会经常用),故可设 z + a 2 = r 2 \dfrac{z+a}{2}=r^2 2z+a=r2 z − a 2 = s 2 \dfrac{z-a}{2}=s^2 2za=s2,其中 r > s > 0 , ( r , s ) = 1 r>s>0,(r,s)=1 r>s>0,(r,s)=1。用 r , s r,s r,s 表示 x , y , z x,y,z x,y,z 就得到了方程的解(5),但要注意要使得它们两两互素,还需要限定 2 ∤ r + s 2\nmid r+s 2r+s(自行证明)。
( y 2 ) 2 = z + a 2 ⋅ z − a 2 (4) (\dfrac{y}{2})^2=\dfrac{z+a}{2}\cdot\dfrac{z-a}{2}\tag{4} (2y)2=2z+a2za(4) {   x = r 2 − s 2   y = 2 r s   z = r 2 + s 2 r > s > 0 ,   ( r , s ) = 1 ,   2 ∤ r + s (5) \begin{cases}\:x=r^2-s^2\\\:y=2rs\\\:z=r^2+s^2\end{cases}\quad r>s>0,\:(r,s)=1,\:2\nmid r+s\tag{5} x=r2s2y=2rsz=r2+s2r>s>0,(r,s)=1,2r+s(5)

做一个简单的推广,形如(6)式的方程这么解?这就是著名的费马大定理(Fermat Last Theorem),当然它在1994年被彻底证明前叫费马猜想。费马发现它们并无非平凡解,并声称找到了一个绝妙的证明方法,但由于书的空白太小写不下。后来人经过了三百多年的努力,才用现代数学的方法将它攻破,大家多数倾向于认为费马的证明并不存在或并不成立。
x n + y n = z n (6) x^n+y^n=z^n\tag{6} xn+yn=zn(6)

使用类似的方法和无穷递降法,你可以证明 x 4 + y 4 = z 2 x^4+y^4=z^2 x4+y4=z2 无非平凡解,进而 x 4 + y 4 = z 4 x^4+y^4=z^4 x4+y4=z4 无非平凡解,它就是费马大定理在 n = 4 n=4 n=4时的情况。下面可以思考一下如下几个问题:

• 求解 x 2 + 3 y 2 = z 2 x^2+3y^2=z^2 x2+3y2=z2 2 x 2 − y 2 = 1 2x^2-y^2=1 2x2y2=1
• 求解 1 x 2 + 1 y 2 = 1 z 2 \dfrac{1}{x^2}+\dfrac{1}{y^2}=\dfrac{1}{z^2} x21+y21=z21;(提示:无互质解
• 证明 x n + y n = z n ± 1 x^n+y^n=z^{n\pm 1} xn+yn=zn±1 都有无穷多组解。(提示:构造

5.2 x 3 + y 3 = z 3 x^3+y^3=z^3 x3+y3=z3

再来看费马大定理在 n = 3 n=3 n=3 的情景,欧拉证明了它没有非平凡解,采用的是无穷递降法。假设 x 0 , y 0 , z 0 x_0,y_0,z_0 x0,y0,z0是使得 ∣ x y z ∣ \left| xyz\right| xyz 最小的一组非零解,我们的目的是构造一组值更小的解。首先当然有 ( x 0 , y 0 , z 0 ) = 1 (x_0,y_0,z_0)=1 (x0,y0,z0)=1,并且其中仅有一个偶数,经过调整后可以使 z 0 z_0 z0为偶数。这时可以令 x 0 + y 0 = 2 u , x 0 − y 0 = 2 w x_0+y_0=2u,x_0-y_0=2w x0+y0=2u,x0y0=2w,则有 z 0 3 = 2 u ( u 2 + 3 w 2 ) z_0^3=2u(u^2+3w^2) z03=2u(u2+3w2)(总结成式(7)),这个变换的重要意义在于降次
x 0 + y 0 = 2 u , x 0 − y 0 = 2 w , z 0 3 = 2 u ( u 2 + 3 w 2 ) (7) x_0+y_0=2u,\quad x_0-y_0=2w,\quad z_0^3=2u(u^2+3w^2)\tag{7} x0+y0=2u,x0y0=2w,z03=2u(u2+3w2)(7)

现在来研究 x 3 = a 2 + 3 b 2 x^3=a^2+3b^2 x3=a2+3b2,其中 2 ∤ x , ( a , b ) = 1 2\nmid x,(a,b)=1 2x,(a,b)=1,它里面有我们熟悉的二次表达式。考察 x x x的每个素因子 p,因为 ( − 3 p ) = 1 \left(\dfrac{-3}{p}\right)=1 (p3)=1,故总有 p = α 2 + 3 β 2 p={\alpha}^2+3{\beta}^2 p=α2+3β2(可参考下面将要介绍的平方数分解的最后一段)。使用公式(8)(使用复数证明这类等式更容易,并且体现了范数的思想),可知总有 x = α 2 + 3 β 2 x={\alpha}^2+3{\beta}^2 x=α2+3β2。下面证明总能找到合适的 α , β α,β α,β,使得关系式(9)成立。
( α 1 2 + 3 β 1 2 ) ( α 2 2 + 3 β 2 2 ) = ( α 1 β 1 ± α 2 β 2 ) 2 + 3 ( α 1 β 2 ∓ α 2 β 1 ) 2 (8) ({\alpha_1}^2+3{\beta_1}^2)({\alpha_2}^2+3{\beta_2}^2)=(\alpha_1\beta_1\pm \alpha_2\beta_2)^2+3(\alpha_1\beta_2\mp \alpha_2\beta_1)^2\tag{8} (α12+3β12)(α22+3β22)=(α1β1±α2β2)2+3(α1β2α2β1)2(8) a = α 3 − 9 α β 2 ,   b = 3 α 2 β − 3 β 3 , ( a , b ) = 1 ,   ( α , 3 β ) = 1 (9) a=\alpha^3-9\alpha\beta^2,\:b=3\alpha^2\beta-3\beta^3,\quad (a,b)=1,\:(\alpha,3\beta)=1\tag{9} a=α39αβ2,b=3α2β3β3,(a,b)=1,(α,3β)=1(9)

使用归纳法证明,当 x = 1 x=1 x=1 时,公式(9)显然成立。若结论对 x x x成立,则考虑 ( p x ) 3 = a 2 + 3 b 2 (px)^3=a^2+3b^2 (px)3=a2+3b2,我们的目的是找到表达式(9)。由前面的结论可有 p 3 = c 3 + 3 d 3 p^3=c^3+3d^3 p3=c3+3d3,且有 α 1 β 1 \alpha_1\beta_1 α1β1 c , d c,d c,d满足类似(9)的关系式。与刚才的式子相乘并除以 p 6 p^6 p6 得到(10),然后证明(10)式右侧的两项可以都是整数。若记 x 3 = e 2 + 3 f 2 x^3=e^2+3f^2 x3=e2+3f2,则由假设知存在 α 2 β 2 \alpha_2\beta_2 α2β2 e , f e,f e,f 满足类似(9)的关系式。综合以上结论,可得到的相关结论(11),它们满足公式(9),定理得证。
x 3 = ( a c ± 3 b d p 3 ) 2 + 3 ( a d ∓ 3 b c p 3 ) 2 (10) x^3=(\dfrac{ac\pm 3bd}{p^3})^2+3(\dfrac{ad\mp 3bc}{p^3})^2\tag{10} x3=(p3ac±3bd)2+3(p3ad3bc)2(10) a = e c + 3 f d ,   b = e d − f c , α = α 1 α 2 + 3 β 1 β 2 ,   β = α 2 β 1 − α 1 β 2 (11) a=ec+3fd,\:b=ed-fc,\quad\alpha=\alpha_1\alpha_2+3\beta_1\beta_2,\:\beta=\alpha_2\beta_1-\alpha_1\beta_2\tag{11} a=ec+3fd,b=edfc,α=α1α2+3β1β2,β=α2β1α1β2(11)

现在回过头来看式子(7)中的 z 0 z_0 z0。当 3 ∤ u 3\nmid u 3u 时,由 u , w u,w u,w 必为一奇一偶且互素(想想为什么)和 z 0 z_0 z0 为偶数,容易有 ( 2 u , u 2 + 3 w 2 ) = 1 (2u,u^2+3w^2)=1 (2u,u2+3w2)=1,可以假设式子(12)左侧。而由上面的结论可知(12)的右侧成立,其中最右边三项互质,故有式子(13)。而 ∣ x 1 y 1 z 1 ∣ 3 = ∣ 2 u ∣ = ∣ x 0 + y 0 ∣ < ∣ x 0 y 0 z 0 ∣ 3 |x_1y_1z_1|^3=|2u|=|x_0+y_0|<|x_0y_0z_0|^3 x1y1z13=2u=x0+y0<x0y0z03。当 3 ∣ u 3\mid u 3u 时可以得到同样的结论,由此我们得到了一组积单调递减的解,这是不可能的,所以原方程没有非平凡解。
t 3 = 2 u ,   s 3 = u 2 + 3 w 2 , s = α 2 + 3 β 2   t 3 = 2 α ( α − 3 β ) ( α + 3 β ) (12) t^3=2u,\:s^3=u^2+3w^2,\quad s=\alpha^2+3\beta^2\:t^3=2\alpha(\alpha-3\beta)(\alpha+3\beta)\tag{12} t3=2u,s3=u2+3w2,s=α2+3β2t3=2α(α3β)(α+3β)(12) z 1 3 = 2 α ,   x 1 3 = α − 3 β ,   y 1 2 = α + 3 β , x 1 3 + y 1 3 = z 1 3 (13) z_1^3=2\alpha,\:x_1^3=\alpha-3\beta,\:y_1^2=\alpha+3\beta,\quad x_1^3+y_1^3=z_1^3\tag{13} z13=2α,x13=α3β,y12=α+3β,x13+y13=z13(13)

5.3 a x 2 + b y 2 + c z 2 = 0 ax^2+by^2+cz^2=0 ax2+by2+cz2=0

将商高方程在系数上进行扩展,得到一般性的 a x 2 + b y 2 + c z 2 = 0 ax^2+by^2+cz^2=0 ax2+by2+cz2=0 a b c ≠ 0 abc≠0 abc=0 且无平方因子),当然我们只需研究其本原解 ( x , y , z ) = 1 (x,y,z)=1 (x,y,z)=1。首先容易有 ( a , y z ) = 1 (a,yz)=1 (a,yz)=1 ,则存在 y − 1 , z − 1 y^{-1},z^{-1} y1,z1,变换 b y 2 ≡ − c z 2 ( m o d ∣ a ∣ ) by^2 \equiv -cz^2\pmod{|a|} by2cz2(moda) 得到式子(14),从而 − b c −bc bc ∣ a ∣ |a| a的二次剩余。这样我们就得到了方程有解的一个必要条件: − b c , − c a , − a b −bc,−ca,−ab bc,ca,ab分别是 ∣ a ∣ , ∣ b ∣ , ∣ c ∣ |a|,|b|,|c| a,b,c 的二次剩余。
( b y z − 1 ) 2 ≡ − b c ( m o d ∣ a ∣ ) (14) (byz^{-1})^2\equiv -bc\pmod{|a|}\tag{14} (byz1)2bc(moda)(14)

下面来看它们是否是方程有解的充分条件,使用的是降次法构造法。另外,利用同余方程研究不定方程也是常见方法,这里我们可以先考虑同余方程(15)。先来看降次,首先容易判断 ( a , b , c ) = 1 (a,b,c)=1 (a,b,c)=1,则可以有式(16)。对模 ∣ b ∣ , ∣ c ∣ |b|,|c| b,c 也可以有类似的表达式,它们将原式表示成了两个线性表达式之积,问题也就容易转化到一次方程了。使用剩余定理可以将三个表达式的右侧统一成 ( d x + e y + f z ) ( d ′ x + e ′ y + f ′ z ) (dx+ey+fz)(d'x+e'y+f'z) (dx+ey+fz)(dx+ey+fz) ,再根据同余的性质就有式(17)。
a x 2 + b y 2 + c z 2 ≡ 0 ( m o d ∣ a b c ∣ ) (15) ax^2+by^2+cz^2\equiv 0\pmod{|abc|}\tag{15} ax2+by2+cz20(modabc)(15) a x 2 + b y 2 + c z 2 ≡ b − 1 ( ( b y ) 2 − ( c ′ z ) 2 ) ≡ ( y + b − 1 c ′ z ) ( b y − c ′ z ) ( m o d ∣ a ∣ ) (16) ax^2+by^2+cz^2\equiv b^{-1}((by)^2-(c'z)^2)\equiv (y+b^{-1}c'z)(by-c'z)\pmod{|a|}\tag{16} ax2+by2+cz2b1((by)2(cz)2)(y+b1cz)(bycz)(moda)(16) a x 2 + b y 2 + c z 2 ≡ ( d x + e y + f z ) ( d ′ x + e ′ y + f ′ z ) ( m o d ∣ a b c ∣ ) (17) ax^2+by^2+cz^2\equiv (dx+ey+fz)(d'x+e'y+f'z)\pmod{|abc|}\tag{17} ax2+by2+cz2(dx+ey+fz)(dx+ey+fz)(modabc)(17)

要使方程(15)有解,可以先讨论 d x + e y + f z ≡ 0 ( m o d ∣ a b c ∣ ) dx+ey+fz\equiv 0\pmod{|abc|} dx+ey+fz0(modabc),使用鸽笼原理容易得知它有满足条件(18)的解 x 0 , y 0 , z 0 x_0,y_0,z_0 x0,y0,z0。这样我们就得到了方程(15)的解,为方便讨论,下面假设 a > 0 , b < 0 , c < 0 a>0,b<0,c<0 a>0,b<0,c<0,其它情况都可以转化为这种情况。
d x + e y + f z , ( 0 ⩽ x ⩽ ∣ b c ∣ ,   0 ⩽ y ⩽ ∣ c a ∣ ,   0 ⩽ z ⩽ ∣ a b ∣ ) (18) dx+ey+fz,\quad(0\leqslant x\leqslant\sqrt{|bc|},\:0\leqslant y\leqslant\sqrt{|ca|},\:0\leqslant z\leqslant\sqrt{|ab|})\tag{18} dx+ey+fz,(0xbc ,0yca ,0zab )(18)

现在令 E = a x 0 2 + b y 0 2 + c z 0 2 E=ax_0^2+by_0^2+cz_0^2 E=ax02+by02+cz02,比较容易推导出 E < a x 0 2 ⩽ a b c EE<ax02abc E > b y 0 2 + c z 0 2 ⩾ − 2 a b c E>by_0^2+cz_0^2\geqslant -2abc E>by02+cz022abc ,故有 E = 0 E=0 E=0 E = − a b c E=−abc E=abc。若 E = 0 E=0 E=0,我们就得到了原不定方程的解 x 0 , y 0 , z 0 x_0,y_0,z_0 x0,y0,z0。若 E = − a b c E=−abc E=abc,则乘以 ab 再配方就有式(19),不管各项是否全为零我们都能找到原方程的解。
a ( b y 0 + x 0 z 0 ) 2 + b ( a x 0 − y 0 z 0 ) 2 + c ( z 0 2 + a b ) 2 = 0 (19) a(by_0+x_0z_0)^2+b(ax_0-y_0z_0)^2+c(z_0^2+ab)^2=0\tag{19} a(by0+x0z0)2+b(ax0y0z0)2+c(z02+ab)2=0(19)

至此充分性证明完毕,总结结论就是: a x 2 + b y 2 + c z 2 = 0 ax^2+by^2+cz^2=0 ax2+by2+cz2=0 有解的充要条件是 − b c , − c a , − a b -bc,-ca,-ab bc,ca,ab 分别是|a|,|b|,|c|的二次剩余。

6、平方数分解

数论中一个著名的问题是把整数表示成若干个平方数之和 a = x 1 2 + x 2 2 + ⋯ + x n 2 a=x_1^2+x_2^2+\cdots+x_n^2 a=x12+x22++xn2,平方和常出现于范数当中,其重要性不言而喻。我们先把条件设定得宽松一点,假设 x k ⩾ 0 x_k⩾0 xk0,如果 n = i n=i n=i时对所有a成立,则显然 n = i + 1 n=i+1 n=i+1时也成立,我们需要讨论有没有最小的n使得所有a都成立。当然问题还可以再做放宽,允许对有限个数不成立。当 n = 1 n=1 n=1时,非平方数有无穷多个,故结论不成立。当 n = 2 n=2 n=2时, 4 k + 3 4k+3 4k+3都不能表示成两个平方和,结论也不成立。

n = 3 n=3 n=3 时,高斯得到过定理:自然数能表示为3个平方和的充要条件是 a ≠ 4 e ( 8 k − 1 ) a\ne 4^e(8k-1) a=4e(8k1),这就说明了 n = 3 n=3 n=3时我们要的结论还是不成立。高斯定理的充分性比较复杂,这里仅证明必要性。首先因为 x 2 ≡ 0 , 1 , 4 ( m o d 8 ) x^2\equiv 0,1,4\pmod{8} x20,1,4(mod8),所以 x 1 2 + x 2 2 + x 3 2 ≢ − 1 ( m o d 8 ) x_1^2+x_2^2+x_3^2\not\equiv -1\pmod{8} x12+x22+x321(mod8),定理中 e = 0 e=0 e=0时成立(其实这一点就已经说明了n=3时结论不成立)。下面利用归纳法,当 e = i e=i e=i时必要性成立,如果有 4 i + 1 ( 8 k − 1 ) = x 1 2 + x 2 2 + x 3 2 4^{i+1}(8k-1)=x_1^2+x_2^2+x_3^2 4i+1(8k1)=x12+x22+x32,必然有 2 ∣ x k 2|x_k 2xk,从而两边可同时除以 4,这与 n = i n=i n=i时的必要性成立矛盾,故必要性对一切e成立。

而幸运的是,当 n = 4 n=4 n=4时,我们要的结论终于成立了,它就是著名的拉格朗日定理:任何正整数都可以表示为四个平方数之和(公式(20)),故也称作四平方和定理。这个定理的证明需要用到四平方和恒等式(21),两个四平方和之积也是四平方和。有了这个恒等式,我们的四平方和定理就等价于:任何素数都可以表示为四平方数之和。下面就来证明这个等价命题,注意证明的过程其实也就是寻找分解式的过程。
a = x 1 2 + x 2 2 + x 3 2 + x 4 2 (20) a=x_1^2+x_2^2+x_3^2+x_4^2\tag{20} a=x12+x22+x32+x42(20) ( a 1 2 + a 2 2 + a 3 2 + a 4 2 ) ( b 1 2 + b 2 2 + b 3 2 + b 4 2 ) = ( a 1 b 1 − a 2 b 2 − a 3 b 3 − a 4 b 4 ) 2 + ( a 1 b 2 + a 2 b 1 + a 3 b 4 − a 4 b 3 ) 2 + ( a 1 b 3 − a 2 b 4 + a 3 b 1 + a 4 b 2 ) 2 + ( a 1 b 4 + a 2 b 3 − a 3 b 2 + a 4 b 1 ) 2 (21) (a_1^2+a_2^2+a_3^2+a_4^2)(b_1^2+b_2^2+b_3^2+b_4^2)=\\(a_1b_1-a_2b_2-a_3b_3-a_4b_4)^2+\\(a_1b_2+a_2b_1+a_3b_4-a_4b_3)^2+\\(a_1b_3-a_2b_4+a_3b_1+a_4b_2)^2+\\(a_1b_4+a_2b_3-a_3b_2+a_4b_1)^2\tag{21} (a12+a22+a32+a42)(b12+b22+b32+b42)=(a1b1a2b2a3b3a4b4)2+(a1b2+a2b1+a3b4a4b3)2+(a1b3a2b4+a3b1+a4b2)2+(a1b4+a2b3a3b2+a4b1)2(21)

先来证明 x 2 + y 2 + 1 ≡ 0 ( m o d p ) x^2+y^2+1\equiv 0\pmod{p} x2+y2+10(modp) 有解(这里的1使得表达式非零)。当 x , y x,y x,y各自取遍 0 , 1 , ⋯   , p − 1 2 0,1,\cdots,\dfrac{p-1}{2} 0,1,,2p1时, x 2 , − y 2 − 1 x^2,-y^2-1 x2,y21 各自遍历 p + 1 2 \dfrac{p+1}{2} 2p+1 个不同的数,所以存在 x 0 , y 0 x_0,y_0 x0,y0 满足 x 0 2 + y 0 2 + 1 ≡ 0 ( m o d p ) x_0^2+y_0^2+1\equiv 0\pmod{p} x02+y02+10(modp)。这个结论说明存在 0 < m < p 00<m<p使得 m p = x 1 2 + x 2 2 + x 3 2 + x 4 2 mp=x_1^2+x_2^2+x_3^2+x_4^2 mp=x12+x22+x32+x42有解,从这里开始,下面我们下面要不断缩小m至1。

首先如果 d = ( x 1 , x 2 , x 3 , x 4 ) > 0 d=(x1,x2,x3,x4)>0 d=(x1,x2,x3,x4)>0,则显然 d 2 ∣ m d^2∣m d2m,方程两边可以约去 d 2 d^2 d2。其次如果 2 ∣ m 2∣m 2m,则四个数中必有偶数个奇数,它们可以两两组合为偶数,这样就得到式子(22)。经过以上两步如果仍有 m > 1 m>1 m>1,将原式对 x k x_k xk取模 m,经过前面类似的整理可以有式子(23)。式(23)和原等式相乘并根据四平方和恒等式,可以有 m ′ m 2 p = u 1 2 + u 2 2 + u 3 2 + u 4 2 m'm^2p=u_1^2+u_2^2+u_3^2+u_4^2 mm2p=u12+u22+u32+u42,并且由恒等式容易证明 m ∣ u k m\mid u_k muk,两边除以 m 2 , m ′ < m m2,m′m2m<m被再一次缩小。这个过程可以一直进行到 m = 1 m=1 m=1,这就完成了证明。
m 2 p = ( x 1 + x 2 2 ) 2 + ( x 1 − x 2 2 ) 2 + ( x 3 + x 3 2 ) 2 + ( x 3 − x 4 2 ) 2 (22) \dfrac{m}{2}p=(\dfrac{x_1+x_2}{2})^2+(\dfrac{x_1-x_2}{2})^2+(\dfrac{x_3+x_3}{2})^2+(\dfrac{x_3-x_4}{2})^2\tag{22} 2mp=(2x1+x2)2+(2x1x2)2+(2x3+x3)2+(2x3x4)2(22) m ′ m = y 1 2 + y 2 2 + y 3 2 + y 4 2 ( 0 < m ′ < m ,   0 ⩽ y k < m 2 ) (23) m'm=y_1^2+y_2^2+y_3^2+y_4^2\quad(0mm=y12+y22+y32+y42(0<m<m,0yk<2m)(23)

现在我们把定理的条件加强一点,如果要求 x k > 0 x_k>0 xk>0,结论还成立吗?首先容易证明如果 4 ∣ a 4∣a 4a,则必有 4 ∣ x k 4∣x_k 4xk,等式两边可以除以 4。利用这个特点并使用归纳法,可以证明 2 ⋅ 4 e 2⋅4^e 24e都不能表示为四个非零平方数之和。当把 n = 4 n=4 n=4放宽为 n = 5 n=5 n=5时,考虑的分解式(24)。当 a = 169 + x , ( x > 0 ) a=169+x,(x>0) a=169+x,(x>0)时,先将x表示为4个非零平方的和,然后从式(24)中选择一个分解,最终总可以将a表示为5个非零平方之和。对于 a < 169 a<169 a<169,可以一一验证,除了 17 , 9 , 10 , 12 , 15 , 18 , 33 1 7,9,10,12,15,18,33 17,9,10,12,15,18,33外都可以分解为5个非零平方之和。这样就有结论,除了几个特殊值外,所有整数都能表示为5个非零平方之和,当然由证明过程知道结论对n=6也是成立的(只是特殊值会不一样)。
169 = 1 3 2 = 1 2 2 + 5 2 + 1 2 2 + 4 2 + 3 3 = 1 1 2 + 4 2 + 4 2 + 4 2 = 1 0 2 + 6 2 + 4 2 + 4 2 + 1 2 (24) 169=13^2=12^2+5^2+12^2+4^2+3^3=11^2+4^2+4^2+4^2=10^2+6^2+4^2+4^2+1^2\tag{24} 169=132=122+52+122+42+33=112+42+42+42=102+62+42+42+12(24)

在理解了上述介绍之后,可以尝试着思考下如下这个问题:
• 给出 a = 2 k a=2^k a=2k时的全部解。并由此证明有无穷多个a使得方程不存在 ( x 1 , x 2 , x 3 , x 4 ) = 1 (x1,x2,x3,x4)=1 (x1,x2,x3,x4)=1的解,有无穷多个a使得方程不存在 x k x_k xk互不相等的解。

高斯定理给出了 n = 3 n=3 n=3 时方程有解的充要条件,现在来看 n = 2 n=2 n=2时的情景,这个问题也是非常重要的。先来看素数的情况 p = x 2 + y 2 p=x^2+y^2 p=x2+y2,显然它有解时必定有 p = 2 p=2 p=2 p = 4 k + 1 p=4k+1 p=4k+1。而当 p = 4 k + 1 p=4k+1 p=4k+1时,−1是p的二次剩余,所以 x 2 + 1 ≡ 0 x^2+1≡0 x2+10有解。使用和四平方和定理完全一样的方法(当然也得益于平方和恒等式:平方和之积也是平方和),可以构造出 p = x 0 2 + y 0 2 p=x_0^2+y_0^2 p=x02+y02

现在回到一般整数 a = d 2 m a=d^2m a=d2m,其中m无平方因子。由刚才的结论与平方和恒等式,如果m不含素因子 4 k + 3 4k+3 4k+3,则它必定能表示为平方和。反之如果m能表示为 x 0 2 + y 0 2 x_0^2+y_0^2 x02+y02,则它的任何素因子满足 x 0 2 + y 0 2 ≡ 0 ( m o d    p ) x_0^2+y_0^2\equiv 0(\mod p) x02+y020(modp),故必有 p = 2 p=2 p=2 p = 4 k + 1 p=4k+1 p=4k+1。总结以上就有结论: a = d 2 m a=d^2m a=d2m 可分解为二平方和的充要条件是m不含素因子 4 k + 3 4k+3 4k+3

n = 2 n=2 n=2时,可以提一个跟严格的问题:方程何时有 ( x , y ) = 1 (x,y)=1 (x,y)=1的解。其实刚才的证明中已经看出,首先奇素数因子只能为 p = 4 k + 1 p=4k+1 p=4k+1,另外容易证明 4 ∤ a 4\nmid a 4a。反之如果 p = 2 p=2 p=2 p = 4 k + 3 p=4k+3 p=4k+3,前面的证明中已经表示它能表示为二互素数的平方和。接下来用归纳法可知该结果对 p e p^e pe也成立,用类似方法也能得到 p e p^e pe的组合还是成立。这样就得到结论:整数可分解为二互素数的平方和的充要条件是:不含因子4和 4 k + 3 4k+3 4k+3

顺便提一下,对 p = x 2 + y 2 p=x^2+y^2 p=x2+y2有解的条件,还有一个更通用的证法。首先同样有必要条件 ( − 1 p ) = 1 \left(\dfrac{-1}{p}\right)=1 (p1)=1,下面来证充分性。证明的主要思路还是构造法,对 s 2 ≡ − 1 ( m o d p ) s^2\equiv -1\pmod{p} s21(modp)的解 s 0 s_0 s0,先来构造 x 0 ≡ s 0 y 0 ( m o d p ) x_0\equiv s_0y_0\pmod{p} x0s0y0(modp)。方法很简单,限定 ( 0 ⩽ x , y < p ) (0\leqslant x,y<\sqrt p) (0x,y<p ),则 x − s 0 y x−s_0y xs0y必有模p相等的两个数,相减即得 x 0 ≡ s 0 y 0 ( m o d p ) x_0\equiv s_0y_0\pmod{p} x0s0y0(modp)。然后自然就有 x 0 2 + y 0 2 ≡ 0 ( m o d p ) x_0^2+y_0^2\equiv 0\pmod{p} x<

你可能感兴趣的:(计算数学与数学理论)