来自人人上王怡的日志 鄙人稍作修改
2013.8.23 张益唐先生报告之证明概要
23号下午张益唐先生受邀到校做了名为《Bounded gaps between primes and relevant problems》的报告,对他证明“存在无穷多对间隔小于7000万的素数”的思路做了大概讲述。我有幸前去听了这场报告。这篇日志里写的东西,有些我是懂的,有些不明所以,但我都尽量写清楚了,也做了一点补充。
关于张益唐先生及间隔有限的素数对的介绍,请见季理真教授的《素数不再孤单——孪生素数和一个执着的数学家张益唐的传奇》。
关于肖boss的发言以及一些美的体会请见陈张弛gg日志《【整理】素数不孤单——张益唐素数结论之肖杰表述》。
(张益唐先生说,由于在场有不少本科生,还有大一的同学,所以他不能讲得过于专业化。数论很有意思,其中很多问题,就连小学生都知道是什么,但它们的证明非常困难。另外,他建议我们有问题要经常思考,即便有些问题不一定能想出来,但要保持这个状态。)
下面开始。
1.人们(例如Goldstone, Pintz, Yildirim)在研究孪生素数猜想时已用了这样的概念:设一个有限非负整数集
[mathcal{H}={h_1,h_2,h_3cdots,h_k}]
称$mathcal{H}$是"可允许的”(admissible),如果对任意素数$p$,存在正整数$n$,使得$p$与$P(n):=(n+h_1)(n+h_2)cdots(n+h_k)$互素。
(这样的$n+h_1,n+h_2cdots n+h_k$会有比较好的性质)
例如,${2,3}$不是可允许的,因为对$p=2$不满足;${0,2,4}$不是可允许的,因为对$p=3$不满足;但${0,2},{0,2,6}$都是可允许的。
2.1920年左右Hardy和Littlewood提出了这样的猜想:对于一串可允许的$mathcal{H}$,存在无穷多个n使得$n+h_1,n+h_2cdots n+h_k$都是素数,而孪生素数猜想正是这个猜想的特殊情况。
3.张益唐证明了如下定理:
设$mathcal{H}={h_1,h_2,h_3cdots,h_n}$是可允许的,且若其个数$kge 3.5 imes 10^6$,那么存在无穷个$n$使得$n+h_1,n+h_2cdots n+h_k$中至少有两个素数。
注:由这个定理就可以推出[liminf_{n oinfty}(p_{n+1}-p_n)<7 imes 10^7]
也即存在无穷多对素数,其差小于7000万(有限!)。 推导过程我放在后面的“补充”里。
4.怎么切入3中定理呢?
张益唐采用解析数论的办法。解析数论通常会处理有限和,其侧重点是怎么算这个和。有时候会用一些定义在自然数集上的“算术函数”(arithmetic function)。例如设
[egin{eqnarray*}
f(n) =
egin{cases}
1 & mbox{if }nmbox{ is a prime} \
0 & mbox{ otherwise}
end{cases}
end{eqnarray*}]
对于这样的函数,一种最自然的想法就是求和。例如如上的函数求和就有
[pi(x)=sum_{nle x}f(n)]
其中$pi(x)$是小于等于$x$的素数个数。
5.为什么要研究这样$f(n)$的和呢?因为我们想让一个“可允许”的几何中的素数个数大于1,也就是$sum_{i=1}^{k} f(n+h_i)>1$对于无穷个$n$成立,这样就能间接地说明$mathcal{H}$这个集合中有两个素数了,因为$f(n+h_k)$只能为整数。但是这样简洁明了的方法行不通,我们只好退而求其次。引入一个“权”函数$varphi(x)$。
我们令$$S_1=sum_{nle x}varphi(n),S_2=sum_{nle x}left(sum_{i=1}^k f(n+h_i) ight)varphi(n)$$。并来研究 $frac{S_2}{S_1}$的大小。比如我们就令$varphi(n)equiv 1$,那么如果我们证明出来 $S_2>S_1$成立,利用鸽笼原理,立刻就能得到存在一个$n$使得$left(sum_{i=1}^k f(n+h_i) ight)>1$,也就是存在一个$n$,让$n+mathcal{H}$这个集合中有两个素数。
不过直接研究对于$sum_{nle x}$似乎不是一个好方法,因为说不定存在的那个$n$一直是个很小的数,所以有时候会利用$sum_{xle nle 2x}varphi(n)$进行求和。比如我们还是令
$$S_1=sum_{xle nle 2x}varphi(n),S_2=sum_{xle nle 2x}left(sum_{i=1}^k f(n+h_i) ight)varphi(n)$$
这时候我们令[egin{eqnarray*}
f(n) =
egin{cases}
log{n} & mbox{if }nmbox{ is a prime} \
0 & mbox{ otherwise}
end{cases}
end{eqnarray*}]
那么如果$S_2>log{(3x)} S_1$,就会有 $S_1=sum_{i=1}^k f(n+h_i)>log{3x}$对于某个$n$成立,这样同样可以看出,存在$i,j$使得$f(n+h_i)$与$f(n+h_j)$都是大于0。我们如下的结果都是要证明后面这样一个$S_2>log{(3x)} S_1$。
但是这些尝试的结果都不尽如人意。有人令$varphi(n)=n,n^2,n^3$,但是都没有什么出众的结果。这个问题有很长的历史,在其中做出开拓性贡献的是Selberg。
6.既然这样一个$varphi(n)$的权我们设为正的(如果是负的话,这些不等式估计就毫无意义了),那么我们就可以引入一个函数$lambda(n)$,使得$varphi(n)=lambda(n)^2$,现在问题就转变为寻找一个$lambda(n)$,让它能导出证明。
而从数论中筛法的角度,Goldston,Pintz,Yildirim三人引入一个这样的$lambda(n)$,即
[lambda(n)=frac{1}{(k+ell)!}sum_{d|P(n),d<D}mu(d)left(logleft(frac{D}{d} ight) ight)^{k+ell}quad P(n):=(n+h_1)(n+h_2)cdots(n+h_k)]
其中$D=x^{varepsilon},0<varepsilon<frac{1}{2}$,而$mu(n)$为Möbius函数 ,新的常数$ell$与$k$有关(论文中张选取了$ell=180$)。
从Hardy、Littlewood到 Goldston、Pintz、Yildirim,80年来才找到这个比较有用的形式。
7.计算两个和,即$$S_1=sum_{xle nle 2x}lambda(n)^2,S_2=sum_{xle nle 2x}left(sum_{i=1}^k f(n+h_i) ight)lambda(n)^2$$.
大致的计算结果是$S_1approx T_1 (log{x})^{k+2ell},S_2approx T_2 (log{x})^{k+2ell}+O(mathcal{E})$,其中$O(mathcal{E})$是误差项。
Goldston等人得出了这样的结果:即在(上述常数$D$中用到的)$varepsilon<frac{1}{4}$时,$S_2-(log{3x})S_1$为负数,显然不能满足要求,但如果$varepsilon=frac{1}{4}+varpi$,虽然$T_2>log{(3x)} T_1$,但是这两者相减的误差项却很难估计。所以他们三人就止步于此了。
(PS:即使“广义黎曼假设”是对的,在这里也没有帮助)
8.张益唐的想法是对$lambda(n)$进行一些调整,在式子
[lambda(n)=frac{1}{(k+ell)!}sum_{d|P(n),d<D}mu(d)left(logleft(frac{D}{d} ight) ight)^{k+ell}]
中,有些$d$对$lambda(n)$的贡献其实很小,所以很小的应该和很大的区分开来。考虑使$mu(d)!=0$的数$d$,比如如果它有$>x^{1/10}$的因子,那么实际上它对整个序列的和的贡献(即对$lambda(n)$的贡献)是很小的。我们可以把所有含有因子大于$x$的某个幂次的数“筛”掉,余下来的就是贡献比较大的数了(也许你会问,没筛掉不是会更大吗?实际上,没筛掉的话会对整个和每一项的估计都变少,从而影响整个数列的和)。
张益唐选取的是$varpi=frac{1}{1168}$,也就是$D=x^{frac{1}{4}+varpi}$,而且拥有大于$x^{varpi}$的素因子的数将会被“筛”掉。
(张益唐这时提到了杨振宁先生说过的关于治学的话:“宁拙毋巧,宁朴勿华。”开始研究的时候宁愿“笨拙”一点,Goldston等人在计算中采用了比较漂亮的办法,而张益唐用了一些比较原始的办法,算出了同样的结果,同时有了更细致的观察)
所以如上的$lambda$也就变成了
[lambda(n)=frac{1}{(k+ell)!}sum_{d|(P(n),mathcal{P}),d<D}mu(d)left(logleft(frac{D}{d} ight) ight)^{k+ell},quad mathcal{P}=prod_{p<x^{varpi}}p]
9.而最关键的东西来了!现在对应的误差项是可以估计出来的!假如$d$满足$x^{frac{1}{2}-epsilon}<d<D^2,d|(P(n),mathcal{P})$(其中$epsilon$是一个很小的正常数),我们可以看出来它的素因子相当小,但是$d$又很大,所以它素因子个数很多。
我们再给定一个正常数$R<d$,对于$d = p_1cdots p_b$,则存在$a$使得$r= p_1cdots p_a lt R$,且$p_1cdots p_{a+1} gt R$。这就给了$d$一个分解,即分解为$d=rq$,其中$r=p_1cdots p_a$有$R/x^{varpi}<r<R$
所以误差项原来是$mathcal{E}=sum_{d|(P(n),mathcal{P})}|mathcal{E}_d|$,而现在有不等式估计
$$mathcal{E}=sum_{d|(P(n),mathcal{P})}|mathcal{E}_d|le sum_{R/x^{varpi}<r<R}sum_{q}|mathcal{E}_{rq}|$$
10.接下来用到解析数论中另外一些典型的办法,例如一些组合技巧,素数的数论函数和分解。又牵涉到一些新的参数,最后用到代数几何中的一些深刻结果。总共把误差项分为三类估计,前两类用到了Weil’s bound for Kloosterman sums,第三类用到了更深刻的由Deligne证明的Weil猜想。
(兜了不少圈子,最终证出来后,张益唐发现一些辛苦证明的结果可以从已知的Heath-Brown恒等式推出来。可是一开始宁朴勿华吧,不要想着做得多现成多漂亮,宁愿回到最原始的出发点上去,硬算一遍,以便看出很多东西。误差的第三类估计,原先也是差一点点而过不去的,但适当用了d=rq的分解后,就解决了。这是他最满意的一点。如果读他的paper,建议看第5页,上面把他的idea解释了。他个人认为解析数论仍然很有前途。)
11.陶哲轩在他的博客上发布了一个PolyMath的项目 用张益唐的新方法对Bombieri-Friedlander-Iwaniec在1986年提出的猜想(似乎是对${n+H_1,n+H_2,cdots n+H_m}$为连续的素数,$H_m-H_1$的大小最小为多少进行的猜测)进行了检验,其中有的结果假设了Elliott-Halberstam猜想和Deligne定理.不过结果是喜人的。现在(2014年1月23日成果如下)
$m$ | BFI猜想预测 | 假设EH猜测 | 未假设EH | 未假设Deligne定理 |
$1$ | $2$ | $12$ | $270$ | $270$ |
$2$ | $6$ | $270$ | $395,122 $ | $474,266$ |
$3$ | $8$ | $52,116$ | $24,462,654 $ | $32,313,878$ |
$4$ | $12$ | $474,266$ | $1,497,901,734 $ | $2,186,561,568$ |
$5$ | $16$ | $4,137,854$ | $82,575,303,608 $ | $131,161,149,090$ |
$m$ | $small(1+o(1))mlog{m}$ | $O(m e^{2m})$ | $O(m e^{(4-frac{52}{283})m})$ | $O(m e^{(4-frac{43}{283})m})$ |
补充
(1)利用3中定理
设$mathcal{H}={h_1,h_2,h_3cdots,h_n}$是可允许的,且若其个数$kge 3.5 imes 10^6$,那么存在无穷个$n$使得$n+h_1,n+h_2cdots n+h_k$中至少有两个素数。
可以证得[liminf_{n oinfty}(p_{n+1}-p_n)<7 imes 10^7]
推导入下:
如果$mathcal{H}={q_1,q_2cdots q_k}$是$k$个素数构成的集合,而且每个素数都比$k$来的大,那么$mathcal{H}$就是可允许的,这是因为不在$mathcal{H}$的素数,显然没法构成完全剩余系,而在$mathcal{H}$中的素数,$mathcal{H}$元素个数又比它来的少。
素数有无穷多个,因此可以让$kge 3.5 imes 10^6$,由3中定理可知,存在无穷多个$n$使得$n+q_1,n+q_2cdots n+q_k$中至少有两个素数。从而就有$|n+q_i-n+q_j|=|q_i-q_j|<infty$即证明了其有有界的间隔。
而回忆$pi(x)$的定义:
$pi(x)$是小于等于$x$的素数个数。
计算机计算有
[pi(7 imes 10^7)-pi(3.5 imes 10^6)=4,118,064-250,150=3,867,941>3.5 imes 10^6]
从而可以在$[3.5 imes 10^6,7 imes 10^7]$之间选择$kge 3.5 imes 10^6$个素数出来,其间隔自然小于7000万了