快速平方根倒数算法

快速平方根倒数算法

原文

很以前久，看《DOOM启示录》的时候就看到，当年卡马克大神在《雷神之锤》中使用了一个神奇的数字，能够通过位操作快速计算平方根倒数 y=1x√ 。但是当时并没有深究，这两天偶然看到了这篇文章，终于将我这个多年的“未解之谜”解开了，特此做下笔记，图片取自原文。

代码实现
首先是这个神奇算法的代码：

float fast_inverse_sqrt(float x)
{
float half_x = 0.5 * x;
int i = *((int *)&x); // 以整数方式读取X
i = 0x5f3759df - (i>>1); // 神奇的步骤
x = *((float )&i); // 再以浮点方式读取i
x = x(1.5 - (half_x * x * x)); // 牛顿迭代一遍提高精度
return x;
}
其中最最重要的就是第二步，通过这个神奇的步骤，能够得到x平方根倒数的近似值。前后穿插着用整型读取浮点数等等，实在是不知所云。但实际上，其中包含着很有意思的数学背景（每次一提到数学，我就觉得好方）。

背后的数学
首先来重新温习一下机组里面的浮点数基础知识（机组60分默默飘过）。

单精度浮点数
单精度浮点数有32bit，包括1位符号位s，8位指数位e，23位尾数位m（赞一下CSDN的markdown编辑器的latex数学公式的功能~)：

s e⋯e��8 m⋯m��23
其表示的数值为： (1+m′)2e′ ，这里的m’代表尾数部分的数值，m’只包含小数位，即 m′=0.m⋯m��23 ，e’则是指数部分的数值，只有整数位， e′=e⋯e��8−B 。为了表示负的指数，指数部分要减去一个偏移量B。
再规定M表示以整数方式解释尾数二进制位的值，E表示相同的方式解释指数部分的值。可以得到以下的转换关系：

m′=MLL=223
e′=E−BB=127
那么对于一个浮点数的二进制位 s e⋯e��8 m⋯m��23 以整数方式解读的话，其值就为： I=EL+M （因为平方根输入只能为正，所以默认s为0）。

平方根倒数近似计算
下面开始进入正题：
对于输入x，我们要计算的是 y=1x√ ，将该式子两边取对数： log2(y)=−12log2(x) 。然后我们将x，y都替换为浮点数表示形式：

log2((1+m′y)2e′y)=−12log2((1+m′x)2e′x)
log2(1+m′y)+e′y=−12(log2(1+m′x)+e′x)
观察发现，上式等号两边均有 log2(1+v) 形式的式子，v的范围是0到1，而该式在这个定义域内的函数图像非常接近一条直线：

这里写图片描述

因此我们近似的用 x+σ 替换得到：

m′y+σ+e′y=−12(m′x+σ+e′x)
σ 为预先计算的一个常数。接下来将数值转为整形方式读取二进制位的形式：

MyL+σ+Ey−B=−12(MxL+σ+Ex−B)
移项合并后得到：

32L(σ−B)+My+LEy=−12(Mx+LEx)
恰好我们又发现，在等式的两边都含有以整数方式解释浮点数的表示 I=M+LE ，进一步化简有：

Iy=−12Ix+κκ=32L(B−σ)
由此，我们得到了一个比较有用的近似公式， κ 便是神奇的数字0x5f3759df 。该公式表明计算x的平方根倒数时，我们只需要用整型方式读取x，再代入上式计算得到结果的整形解释值，然后再用浮点数方式读取即可！我当时就震惊了。

牛顿迭代提高精度
经过上一步，我们有了初步的近似结果，为了进一步提高精度，我们再用牛顿迭代法计算一次。牛顿迭代法描述的是，给定连续函数f(x)，对于方程f(x)=0，确定任意初始的 x0 ，我们可以通过下面这个迭代式计算得到其解：

xn+1=xn−f(xn)f′(xn)
我们要计算的式子为 y=1x0√，x0 为已知（这个 x0 是指输入，不是牛顿迭代的初始值），将其转换为关于y的方程就是 f(y)=1y2−x0=0 ，根据牛顿迭代可得：

yn+1=yn−1y2n−x0−2y3n
yn+1=32yn−12x0y3n
也就是最后一步的代码了。

这里写图片描述

更多讨论
上述推导过程中可以看出，不同次方根在我们的计算中仅仅是作为一个因子而存在的，因此将该近似算法完全可以推广到其他次方根的情况下。另外，对于64位浮点数，我们也可以采用完全相同的推导过程来得到相似的结果。这只是一个近似算法，它与真实计算值之间的偏差与神奇数字的取值有很微妙的关系，这篇博客对这个问题进行了一些讨论。

真是神奇的算法！
相关阅读:
多层级makefile
vscode常用快捷键
 unix socket接口
 以太网复习
 shell脚本算术运算
 1185: 零起点学算法92——单词数（C）
1183: 零起点学算法90——海选女主角（C语言）
1181: 零起点学算法88——偶数求和（C语言）
1144: 零起点学算法51——数组中删数（C语言）
列主元消去法&全主元消去法——Java实现
原文地址：https://www.cnblogs.com/jt2001/p/6129906.html