前面介绍的只是初等数论的基本概念,它有很多的应用场景,如果有机会以后我们还会看到,这里我只想单独举出不定方程的例子。不定方程又叫丢潘图方程,它们以整数(或有理数)为变量和参数,而且有两个以上的未知数,多以多项式形式出现。不定方程既是数论的应用,也是数论理论形成的来源,对不定方程的思考会动用起你全部的数论知识。这里仅列举一些简单的问题,作为知识巩固也好,作为娱乐欣赏也行。
1. 一次不定方程
最简单的不定方程就是一次方程(1),它表现为一个多元线性方程。如果你还记得前面最大公约数的线性组合定义,就容易得到方程有整数解的充要条件是((a_1,a_2,cdots,a_n)mid c)。多元方程的第一步往往是降元,令(d=(a_2,cdots,a_n),a'_k=dfrac{a_k}{d}),则方程等价于一次方程组(2)(想想为什么?以及为什么要先抽出最大公约数?)。如果对(2)式一直做类似处理,就会得到多个二元一次方程,这样就把问题集中到了简单的情景。
[a_1x_1+a_2x_2+cdots+a_nx_n=c ag{1}]
[egin{cases}:a_1x_1+dy=c\:a'_2x_2+cdots+a'_nx_n=yend{cases} ag{2}]
而对于二元一次方程(ax+by=c),它有明显的几何意义,方程的解就是直线方程上的整数点,所有对其讨论都可以从图形中找出。容易看出,如果已知一个解(x_0,y_0),则方程的全部解为公式(3)。至于如何求得一个特解,一般还是用辗转相除法,对于一些简单的情况,也可以直接尝试各种值。
[egin{cases}:x=x_0+dfrac{b}{(a,b)}k\:y=y_0-dfrac{a}{(a,b)}kend{cases},:k=0,pm 1,pm 2,cdots ag{3}]
2. 商高方程及其扩展
2.1 商高方程
勾股定理(x^2+y^2=z^2)大家都熟悉,有一个自然的问题是:如何求它的所有解?这个问题一般叫商高方程或毕达哥拉斯方程。容易证明当((x,y)=1)时方程的解两两互素,如果再限定解为正数,这样的解叫本原解。方程的解要么是平凡解((0,0,0)),要么是本原解的倍数,因此我们只需专注于找到所有本原解。
另外,因为素数的平方只能是(4k+1)的形式,可推得(x,y)必定是一奇一偶,下面就假设(y)为偶数,原方程整理为式子(4)。容易证明((dfrac{z+a}{2},dfrac{z-a}{2})=1)(这个性质以后会经常用),故可设(dfrac{z+a}{2}=r^2)和(dfrac{z-a}{2}=s^2),其中(r>s>0,(r,s)=1)。用(r,s)表示(x,y,z)就得到了方程的解(5),但要注意要使得它们两两互素,还需要限定(2 mid r+s)(自行证明)。
[(dfrac{y}{2})^2=dfrac{z+a}{2}cdotdfrac{z-a}{2} ag{4}]
[egin{cases}:x=r^2-s^2\:y=2rs\:z=r^2+s^2end{cases}quad r>s>0,:(r,s)=1,:2 mid r+s ag{5}]
做一个简单的推广,形如(6)式的方程这么解?这就是著名的费马大定理(Fermat Last Theorem),当然它在1994年被彻底证明前叫费马猜想。费马发现它们并无非平凡解,并声称找到了一个绝妙的证明方法,但由于书的空白太小写不下。后来人经过了三百多年的努力,才用现代数学的方法将它攻破,大家多数倾向于认为费马的证明并不存在或并不成立。
[x^n+y^n=z^n ag{6}]
使用类似的方法和无穷递降法,你可以证明(x^4+y^4=z^2)无非平凡解,进而(x^4+y^4=z^4)无非平凡解,它就是费马大定理在(n=4)时的情况。证明过程你可以作为习题,并且思考一下如下问题:
• 求解(x^2+3y^2=z^2)和(2x^2-y^2=1);
• 求解(dfrac{1}{x^2}+dfrac{1}{y^2}=dfrac{1}{z^2});(提示:无互质解)
• 证明(x^n+y^n=z^{npm 1})都有无穷多组解。(提示:构造)
2.2 (x^3+y^3=z^3)
再来看费马大定理在(n=3)的情景,欧拉证明了它没有非平凡解,采用的是无穷递降法。假设(x_0,y_0,z_0)是使得(left| xyz ight|)最小的一组非零解,我们的目的是构造一组值更小的解。首先当然有((x_0,y_0,z_0)=1),并且其中仅有一个偶数,经过调整后可以使(z_0)为偶数。这时可以令(x_0+y_0=2u,x_0-y_0=2w),则有(z_0^3=2u(u^2+3w^2))(总结成式(7)),这个变换的重要意义在于降次。
[x_0+y_0=2u,quad x_0-y_0=2w,quad z_0^3=2u(u^2+3w^2) ag{7}]
现在来研究(x^3=a^2+3b^2),其中(2 mid x,(a,b)=1),它里面有我们熟悉的二次表达式。考察(x)的每个素因子(p),因为(left(dfrac{-3}{p} ight)=1),故总有(p={alpha}^2+3{eta}^2)(参考本篇第三段的最后一段)。使用公式(8)(使用复数证明这类等式更容易,并且体现了范数的思想),可知总有(x={alpha}^2+3{eta}^2)。下面证明总能找到合适的(alpha,eta),使得关系式(9)成立。
[({alpha_1}^2+3{eta_1}^2)({alpha_2}^2+3{eta_2}^2)=(alpha_1eta_1pm alpha_2eta_2)^2+3(alpha_1eta_2mp alpha_2eta_1)^2 ag{8}]
[a=alpha^3-9alphaeta^2,:b=3alpha^2eta-3eta^3,quad (a,b)=1,:(alpha,3eta)=1 ag{9}]
使用归纳法证明,当(x=1)时,公式(9)显然成立。若结论对(x)成立,则考虑((px)^3=a^2+3b^2),我们的目的是找到表达式(9)。由前面的结论可有(p^3=c^3+3d^3),且有(alpha_1eta_1)和(c,d)满足类似(9)的关系式。与刚才的式子相乘并除以(p^6)得到(10),然后证明(10)式右侧的两项可以都是整数。若记(x^3=e^2+3f^2),则由假设知存在(alpha_2eta_2)和(e,f)满足类似(9)的关系式。综合以上结论,可得到的相关结论(11),它们满足公式(9),定理得证。
[x^3=(dfrac{acpm 3bd}{p^3})^2+3(dfrac{admp 3bc}{p^3})^2 ag{10}]
[a=ec+3fd,:b=ed-fc,quadalpha=alpha_1alpha_2+3eta_1eta_2,:eta=alpha_2eta_1-alpha_1eta_2 ag{11}]
现在回过头来看式子(7)中的(z_0)。当(3 mid u)时,由(u,w)必为一奇一偶且互素(想想为什么)和(z_0)为偶数,容易有((2u,u^2+3w^2)=1),可以假设式子(12)左侧。而由上面的结论可知(12)的右侧成立,其中最右边三项互质,故有式子(13)。而(|x_1y_1z_1|^3=|2u|=|x_0+y_0|<|x_0y_0z_0|^3)。当(3mid u)时可以得到同样的结论,由此我们得到了一组积单调递减的解,这是不可能的,所以原方程没有非平凡解。
[t^3=2u,:s^3=u^2+3w^2,quad s=alpha^2+3eta^2:t^3=2alpha(alpha-3eta)(alpha+3eta) ag{12}]
[z_1^3=2alpha,:x_1^3=alpha-3eta,:y_1^2=alpha+3eta,quad x_1^3+y_1^3=z_1^3 ag{13}]
2.3 (ax^2+by^2+cz^2=0)
将商高方程在系数上进行扩展,得到一般性的(ax^2+by^2+cz^2=0)((abc e 0)且无平方因子),当然我们只需研究其本原解((x,y,z)=1)。首先容易有((a,yz)=1),则存在(y^{-1},z^{-1}),变换(by^2 equiv -cz^2pmod{|a|})得到式子(14),从而(-bc)是(|a|)的二次剩余。这样我们就得到了方程有解的一个必要条件:(-bc,-ca,-ab)分别是(|a|,|b|,|c|)的二次剩余。
[(byz^{-1})^2equiv -bcpmod{|a|} ag{14}]
下面来看它们是否是方程有解的充分条件,使用的是降次法和构造法。另外,利用同余方程研究不定方程也是常见方法,这里我们可以先考虑同余方程(15)。先来看降次,首先容易判断((a,b,c)=1),则可以有式(16)。对模(|b|,|c|)也可以有类似的表达式,它们将原式表示成了两个线性表达式之积,问题也就容易转化到一次方程了。使用剩余定理可以将三个表达式的右侧统一成((dx+ey+fz)(d'x+e'y+f'z)),再根据同余的性质就有式(17)。
[ax^2+by^2+cz^2equiv 0pmod{|abc|} ag{15}]
[ax^2+by^2+cz^2equiv b^{-1}((by)^2-(c'z)^2)equiv (y+b^{-1}c'z)(by-c'z)pmod{|a|} ag{16}]
[ax^2+by^2+cz^2equiv (dx+ey+fz)(d'x+e'y+f'z)pmod{|abc|} ag{17}]
要使方程(15)有解,可以先讨论(dx+ey+fzequiv 0pmod{|abc|}),使用鸽笼原理容易得知它有满足条件(18)的解(x_0,y_0,z_0)。这样我们就得到了方程(15)的解,为方便讨论,下面假设(a>0,b<0,c<0),其它情况都可以转化为这种情况。
[dx+ey+fz,quad(0leqslant xleqslantsqrt{|bc|},:0leqslant yleqslantsqrt{|ca|},:0leqslant zleqslantsqrt{|ab|}) ag{18}]
现在令(E=ax_0^2+by_0^2+cz_0^2),比较容易推导出(E<ax_0^2leqslant abc)和(E>by_0^2+cz_0^2geqslant -2abc),故有(E=0)或(E=-abc)。若(E=0),我们就得到了原不定方程的解(x_0,y_0,z_0)。若(E=-abc),则乘以(ab)再配方就有式(19),不管各项是否全为零我们都能找到原方程的解。
[a(by_0+x_0z_0)^2+b(ax_0-y_0z_0)^2+c(z_0^2+ab)^2=0 ag{19}]
至此充分性证明完毕,总结结论就是:(ax^2+by^2+cz^2=0)有解的充要条件是(-bc,-ca,-ab)分别是(|a|,|b|,|c|)的二次剩余。
3. 平方数分解
数论中一个著名的问题是把整数表示成若干个平方数之和(a=x_1^2+x_2^2+cdots+x_n^2),平方和常出现于范数当中,其重要性不言而喻。我们先把条件设定得宽松一点,假设(x_kgeqslant 0),如果(n=i)时对所有(a)成立,则显然(n=i+1)时也成立,我们需要讨论有没有最小的(n)使得所有(a)都成立。当然问题还可以再做放宽,允许对有限个数不成立。当(n=1)时,非平方数有无穷多个,故结论不成立。当(n=2)时,(4k+3)都不能表示成两个平方和,结论也不成立。
当(n=3)时,高斯得到过定理:自然数能表示为(3)个平方和的充要条件是(a e 4^e(8k-1)),这就说明了(n=3)时我们要的结论还是不成立。高斯定理的充分性比较复杂,这里仅证明必要性。首先因为(x^2equiv 0,1,4pmod{8}),所以(x_1^2+x_2^2+x_3^2 otequiv -1pmod{8}),定理中(e=0)时成立(其实这一点就已经说明了(n=3)时结论不成立)。下面利用归纳法,当(e=i)时必要性成立,如果有(4^{i+1}(8k-1)=x_1^2+x_2^2+x_3^2),必然有(2|x_k),从而两边可同时除以(4),这与(n=i)时的必要性成立矛盾,故必要性对一切(e)成立。
而幸运的是,当(n=4)时,我们要的结论终于成立了,它就是著名的拉格朗日定理:任何正整数都可以表示为四个平方数之和(公式(20)),故也称作四平方和定理。这个定理的证明需要用到四平方和恒等式(21),两个四平方和之积也是四平方和。有了这个恒等式,我们的四平方和定理就等价于:任何素数都可以表示为四平方数之和。下面就来证明这个等价命题,注意证明的过程其实也就是寻找分解式的过程。
[a=x_1^2+x_2^2+x_3^2+x_4^2 ag{20}]
[(a_1^2+a_2^2+a_3^2+a_4^2)(b_1^2+b_2^2+b_3^2+b_4^2)=\(a_1b_1-a_2b_2-a_3b_3-a_4b_4)^2+\(a_1b_2+a_2b_1+a_3b_4-a_4b_3)^2+\(a_1b_3-a_2b_4+a_3b_1+a_4b_2)^2+\(a_1b_4+a_2b_3-a_3b_2+a_4b_1)^2 ag{21}]
先来证明(x^2+y^2+1equiv 0pmod{p})有解(这里的(1)使得表达式非零)。当(x,y)各自取遍(0,1,cdots,dfrac{p-1}{2})时,(x^2,-y^2-1)各自遍历(dfrac{p+1}{2})个不同的数,所以存在(x_0,y_0)满足(x_0^2+y_0^2+1equiv 0pmod{p})。这个结论说明存在(0<m<p)使得(mp=x_1^2+x_2^2+x_3^2+x_4^2)有解,从这里开始,下面我们下面要不断缩小(m)至(1)。
首先如果(d=(x_1,x_2,x_3,x_4)>0),则显然(d^2mid m),方程两边可以约去(d^2)。其次如果(2mid m),则四个数中必有偶数个奇数,它们可以两两组合为偶数,这样就得到式子(22)。经过以上两步如果仍有(m>1),将原式对(x_k)取模(m),经过前面类似的整理可以有式子(23)。式(23)和原等式相乘并根据四平方和恒等式,可以有(m'm^2p=u_1^2+u_2^2+u_3^2+u_4^2),并且由恒等式容易证明(mmid u_k),两边除以(m^2),(m'<m)被再一次缩小。这个过程可以一直进行到(m=1),这就完成了证明。
[dfrac{m}{2}p=(dfrac{x_1+x_2}{2})^2+(dfrac{x_1-x_2}{2})^2+(dfrac{x_3+x_3}{2})^2+(dfrac{x_3-x_4}{2})^2 ag{22}]
[m'm=y_1^2+y_2^2+y_3^2+y_4^2quad(0<m'<m,:0leqslant y_k<frac{m}{2}) ag{23}]
现在我们把定理的条件加强一点,如果要求(x_k>0),结论还成立吗?首先容易证明如果(4mid a),则必有(4mid x_k),等式两边可以除以(4)。利用这个特点并使用归纳法,可以证明(2cdot4^e)都不能表示为四个非零平方数之和。当把(n=4)放宽为(n=5)时,考虑的分解式(24)。当(a=169+x,(x>0)时,先将(x)表示为(1~4)个非零平方的和,然后从式(24)中选择一个分解,最终总可以将(a)表示为(5)个非零平方之和。对于(a<169),可以一一验证,除了(1~7,9,10,12,15,18,33)外都可以分解为(5)个非零平方之和。这样就有结论,除了几个特殊值外,所有整数都能表示为(5)个非零平方之和,当然由证明过程知道结论对(n=6)也是成立的(只是特殊值会不一样)。
[169=13^2=12^2+5^2+12^2+4^2+3^3=11^2+4^2+4^2+4^2=10^2+6^2+4^2+4^2+1^2 ag{24}]
做个习题放松一下:
• 给出(a=2^k)时的全部解。并由此证明有无穷多个(a)使得方程不存在((x_1,x_2,x_3,x_4)=1)的解,有无穷多个(a)使得方程不存在(x_k)互不相等的解。
高斯定理给出了(n=3)时方程有解的充要条件,现在来看(n=2)时的情景,这个问题也是非常重要的。先来看素数的情况(p=x^2+y^2),显然它有解时必定有(p=2)或(p=4k+1)。而当(p=4k+1)时,(-1)是(p)的二次剩余,所以(x^2+1equiv 0)有解。使用和四平方和定理完全一样的方法(当然也得益于平方和恒等式:平方和之积也是平方和),可以构造出(p=x_0^2+y_0^2)。
现在回到一般整数(a=d^2m),其中(m)无平方因子。由刚才的结论与平方和恒等式,如果(m)不含素因子(4k+3),则它必定能表示为平方和。反之如果(m)能表示为(x_0^2+y_0^2),则它的任何素因子满足(x_0^2+y_0^2equiv 0(mod p)),故必有(p=2)或(p=4k+1)。总结以上就有结论:(a=d^2m)可分解为二平方和的充要条件是(m)不含素因子(4k+3)。
对(n=2)时,可以提一个跟严格的问题:方程何时有((x,y)=1)的解。其实刚才的证明中已经看出,首先奇素数因子只能为(p=4k+1),另外容易证明(4 mid a)。反之如果(p=2)或(p=4k+3),前面的证明中已经表示它能表示为二互素数的平方和。接下来用归纳法可知该结果对(p^e)也成立,用类似方法也能得到(p^e)的组合还是成立。这样就得到结论:整数可分解为二互素数的平方和的充要条件是:不含因子(4)和(4k+3)。
顺便提一下,对(p=x^2+y^2)有解的条件,还有一个更通用的证法。首先同样有必要条件(left(dfrac{-1}{p} ight)=1),下面来证充分性。证明的主要思路还是构造法,对(s^2equiv -1pmod{p})的解(s_0),先来构造(x_0equiv s_0y_0pmod{p})。方法很简单,限定((0leqslant x,y<sqrt p)),则(x-s_0y)必有模(p)相等的两个数,相减即得(x_0equiv s_0y_0pmod{p})。然后自然就有(x_0^2+y_0^2equiv 0pmod{p}),又因为(x_0^2+y_0^2<2p^2),所以就有(x_0^2+y_0^2=p)。同样的证法也可以得到(x^2+dy^2=p,(d=2,3))有解的充要条件是(left(dfrac{d}{p} ight)=1),但要注意(d)越大,要排除的情况越多,结论不一定成立。最后思考一些问题:
• 求证不能表示为整数平方和的整数也不能表示为有理数的平方和,并讨论有理数能表示为有理数平方和的充要条件;
• 证明(p=x^2+y^2)的正解唯一。
4. 佩尔方程
最后再来看一类很重要的方程:佩尔(Pell)方程(x^2-dy^2=pm 1),其中(d)为非平方正数。方程经过整理可以得到表达式(25),它表示(dfrac{x}{y})是(sqrt{d})的近似分数。这不由得使我们想到了连分数,尤其是其精度误差,也许只有连分数能达到,下面就来证明这一猜测。令(dfrac{p_k}{q_k})表示(sqrt{d})的第(k)个连分数,(x_0,y_0)是方程的一组正解。
[left|dfrac{x}{y}-sqrt{d} ight| =dfrac{1}{y^2(dfrac{x}{y}+sqrt{d})}leqslantdfrac{1}{2y^2} ag{25}]
首先假设(q_kleqslant y_0<q_{k+1}),由(y_0<q^{k+1})并根据渐进连分数的性质有(left|sqrt{d}q_k-p_k ight|leqslantleft|sqrt{d}y_0-x_0 ight|),从而(left|sqrt{d}-dfrac{p_k}{q_k} ight|<dfrac{1}{2y_0q_k})。如果(y_0 e q_k),仅从分数的性质容易得到(left|dfrac{p_k}{q_k}-dfrac{x_0}{y_0} ight|geqslant dfrac{1}{y_0q_k}),而另一方面有式子(26),结合这两个式子可有(y_0<q_k),矛盾。所以必定有(y=q_k),接下来容易得到(x_0=p_k),从而我们知道方程的解必定是的渐进连分数的分子和分母。
[left|dfrac{p_k}{q_k}-dfrac{x_0}{y_0} ight|leqslantleft|sqrt{d}-dfrac{p_k}{q_k} ight|+left|sqrt{d}-dfrac{x_0}{y_0} ight|<dfrac{1}{2y_0q_k}+dfrac{1}{2y_0^2} ag{26}]
下面就从这些渐进分数中寻找方程的解,通过计算渐进分数,可以得到(p_k^2-dq_k^2=(-1)^kb_k),其中(b_k)为余部的分母(参考课本)。并且从推导过程中可以得到(b_k)仅在(cmid k)时为(1)而不可能为(-1),其中(c)为连分数的循环周期。如此一来我们就得到了方程的所有解为(p_{hc},q_{hc}),但要注意方程的值只能取(pm 1)其一,规律也是明显的,以后不加区分。
到这里为止,我们似乎已经解决了问题,但方程的解其实还没有一个清晰的表达方法,从方程本身的特点出发,也许还能有进一步的结论。方程的一大特点是等式值为(pm 1),而左边是两个共轭数(p_k+sqrt{d}q_k,p_k-sqrt{d}q_k)之积。不妨把方程的解与复数(x_k=p_{kc}+sqrt{d}q_{kc})一一对应起来,由刚才的讨论可知任何满足(xar{x}=pm 1)的(x)都是方程的解,并且(x^k)都是方程的解。这样我们自然要问,是否每个(x_k)都可以表示为(x_1)的幂?
如果有(x_1^k<x_m<x_1^{k+1}),则有(1<x_mx_1^{-k}<x_1),而容易证(x_mx_1^{-k}=x_m(pm ar{x}_1^k))也是方程的解。但方程不可能有比(x_1)小的解,矛盾,故必然有(x_k=x_1^k),即方程的所有解都可以与表达式(27)中的复数一一对应。这样只要知道第一组解,就可以得到所有解,第一组解可以通过简单的遍历尝试得到,有些书上还给出了一定范围内的解的表,可供查阅。
[p_{kc}+sqrt{d}q_{kc}=(p_c+sqrt{d}q_c)^k ag{27}]
最后来考虑一下以下问题:
• 求证(p=4k+1)时,讨论(x^2-py^2=pm 1)最小解下方程的取值;
• 不使用连分数理论讨论方程(x^2-dy^2=1),先证明存在(m)使得(x^2-dy^2=m)有无穷多解,然后证明(x^2-dy^2=1)有解,最后证((x_1+sqrt{p}y_1)^k)是所有解;
• 使用佩尔方程证明,如果(x^2-dy^2=n)有解,则有无穷多组解;
• 证明若佩尔方程(x^2-dy^2=1)的解满足(x_0>dfrac{y_0^2}{2}-1),则它是最小解。
【全篇完】