numerical recipe 里一共讲了两种实数对称矩阵的对角化,
jacobi法
tred2生成上三角阵以后用tqli对角化
前者稳定但慢易并行,后者较快但疑似不稳定,串行。
花了一下午,一点点调试终于知道了第二种方法不稳定的原因在哪里
1 SUBROUTINE tred2(a,d,e,novectors) 2 USE nrtype; USE nrutil, ONLY : assert_eq,outerprod 3 IMPLICIT NONE 4 REAL(SP), DIMENSION(:,:), INTENT(INOUT) :: a 5 REAL(SP), DIMENSION(:), INTENT(OUT) :: d,e 6 LOGICAL(LGT), OPTIONAL, INTENT(IN) :: novectors 7 INTEGER(I4B) :: i,j,l,n 8 REAL(SP) :: f,g,h,hh,scale 9 REAL(SP), DIMENSION(size(a,1)) :: gg 10 LOGICAL(LGT) :: yesvec 11 n=assert_eq(size(a,1),size(a,2),size(d),size(e),'tred2') 12 if (present(novectors)) then 13 yesvec=.not. novectors 14 else 15 yesvec=.true. 16 end if 17 do i=n,2,-1 18 l=i-1 19 h=0.0 20 if (l > 1) then 21 scale=sum(abs(a(i,1:l))) 22 if (scale == 0.0) then 23 e(i)=a(i,l) 24 else 25 a(i,1:l)=a(i,1:l)/scale 26 h=sum(a(i,1:l)**2) 27 f=a(i,l) 28 g=-sign(sqrt(h),f) 29 e(i)=scale*g 30 h=h-f*g 31 a(i,l)=f-g 32 if (yesvec) a(1:l,i)=a(i,1:l)/h 33 do j=1,l 34 e(j)=(dot_product(a(j,1:j),a(i,1:j)) & 35 +dot_product(a(j+1:l,j),a(i,j+1:l)))/h 36 end do 37 f=dot_product(e(1:l),a(i,1:l)) 38 hh=f/(h+h) 39 e(1:l)=e(1:l)-hh*a(i,1:l) 40 do j=1,l 41 a(j,1:j)=a(j,1:j)-a(i,j)*e(1:j)-e(j)*a(i,1:j) 42 end do 43 end if 44 else 45 e(i)=a(i,l) 46 end if 47 d(i)=h 48 end do 49 if (yesvec) d(1)=0.0 50 e(1)=0.0 51 do i=1,n 52 if (yesvec) then 53 l=i-1 54 if (d(i) /= 0.0) then 55 gg(1:l)=matmul(a(i,1:l),a(1:l,1:l)) 56 a(1:l,1:l)=a(1:l,1:l)-outerprod(a(1:l,i),gg(1:l)) 57 end if 58 d(i)=a(i,i) 59 a(i,i)=1.0 60 a(i,1:l)=0.0 61 a(1:l,i)=0.0 62 else 63 d(i)=a(i,i) 64 end if 65 end do 66 END SUBROUTINE tred2
问题出在22行,scale==0.0的判断上。稍微有点常识的人都知道,计算机里做浮点数判断不能用==,必须用abs(scale-0.0)<episilon episilon为一个很小的数。没想到numerical recipe第三版的这本书里还有这样子的代码。
鉴于scale>=0.0,所以改成scale<=episilon就行了,结果就很稳定了。
吐槽一下,怪不得我总觉得结果怎么那么随机,原来是这里出的问题,这可是真随机啊!