• 各种编程语言对尾递归的支持


      版权申明:本文为博主窗户(Colin Cai)原创,欢迎转帖。如要转贴,必须注明原文网址
    
      http://www.cnblogs.com/Colin-Cai/p/11774213.html 
    
      作者:窗户
    
      QQ/微信:6679072
    
      E-mail:6679072@qq.com

      尾递归

      这篇文章,我们讲尾递归。在递归中,如果该函数的递归形式表现在函数返回的时候,则称之为尾递归。

      举个简单的例子,用伪码如下:

      function Add(a, b)

      if a = 0

        return b

      return Add(a-1, b+1)

      end

      

      上面这个函数实际上是两个数的加法,简单起见,只考虑非负整数,后面叙述具体语言总是会以这个函数为例子。所有的return部分都是不再依赖于递归,或者是返回Add函数,其参数的计算不再依赖于递归,典型的尾递归。

      上述代码很容易用循环表示:

      

      function Add(a, b)

      while True

        if a = 0

          return b

        end

        a <= a-1

        b <= b+1

      end

      end

      所有的尾递归都可以用循环表示,只需要把传入的参数当成是状态,运算的过程当成是状态的转换。

      比如Add(3,0)的计算就经过

      3,0

      2,1

      1,2

      0,3

      这样的状态转换。

      

      函数的计算会维护一个栈,每当遇到函数调用会记录当前运行的状态,如此在函数返回的时候可以恢复上下文。

      比如,对于Fibonacci数列,伪码如下:

      function fib(n)

      if n < 3

        return 1

      end

      return fib(n-1)+fib(n-2)

      end

      

      我们计算fib(4),栈大致如下:

      fib(4)

      =>

      fib(4)

      fib(3)

      =>

      fib(4)

      fib(3)

      fib(2)

      =>

      fib(4)

      fib(3)

      fib(2) 1

      =>

      f(4)

      f(3) 1+

      =>

      f(4)

      f(3) 1+

      f(1)

      =>

      f(4)

      f(3) 1+

      f(1) 1

      =>

      f(4)

      f(3) 2

      =>

      f(4) 2+

      =>

      f(4) 2+

      f(2)

      =>

      f(4) 2+

      f(2) 1

      =>

      f(4) 3

      =>

      3

      

      而作为尾递归,我们计算Add(3,0),栈可能是如下过程:

      Add(3,0)

      =>

      Add(3,0)

      Add(2,1)

      =>

      Add(3,0)

      Add(2,1)

      Add(1,2)

      =>

      Add(3,0)

      Add(2,1)

      Add(1,2)

      Add(0,3)

      =>

      Add(3,0)

      Add(2,1)

      Add(1,2)

      Add(0,3) 3

      =>

      Add(3,0)

      Add(2,1)

      Add(1,2) 3

      =>

      Add(3,0)

      Add(2,1) 3

      =>

      Add(3,0) 3

      =>

      3

      对于Add函数,以上栈的长度与计算量成正比。如此,意味着计算量越大所需要的栈越大,甚至导致超过最大限制而无法运算。

      同时我们发现,简单的转为循环表示的Add则没有这个问题。

      这里,可以采用一个编译技术,就是尾递归优化,其一般情况是,如果一个函数的计算中遇到了完全转化成另一个函数调用的情况,那么栈的当前函数部分的信息可以完全抹去,而替换为新的函数。如此处理下,此情况栈不会增长。

      Add(3,0)的栈的过程如下:

      Add(3,0)

      =>

      Add(2,1)

      =>

      Add(1,2)

      =>

      Add(0,3)

      =>

      3

      尾递归优化给了我们一种迭代的方式,之所以研究它,在于函数式编程会用到它。

      注:递归论区分递归和迭代(迭置),和计算机上定义有一点区别,在此不深入。

    C/C++

      我们从底层的语言开始,首先还是上面的加法实现。为了让范围更大一点,便于观察,我们使用unsigned long long类型。

    /*add.c*/
    unsigned long long add(unsigned long long a, unsigned long long b)
    {
            if(a==0ULL)
                    return b;
            return add(a-1ULL,b+1ULL);
    }

      再写一个main来测试它,用命令行参数去获得传入add的两个参数

    #include <stdio.h>
    unsigned long long add(unsigned long long a, unsigned long long b);
    int main(int argc, char **argv)
    {
        unsigned long long a, b;
        sscanf(argv[1], "%llu", &a);
        sscanf(argv[2], "%llu", &b);
        printf("%llu
    ", add(a,b));
        return 0;
    }

      用gcc编译,

      gcc add.c main.c -o a.out

      运行一下,

      ./a.out 10000000 100000000

      马上发生短错误,直接崩溃。看来C语言作为底层语言没必要支持这个啊?

      于是我们开启优化,

      gcc -O2 add.c main.c -o a.out

      然后运行一下

      ./a.out 10000000000000000 10000000000000000

      立即得到我们想要的值而没有发生崩栈

      20000000000000000

      看来……不对,1亿亿次迭代瞬间完成?

      objdump反汇编一把,

    00000000004006b0 <add>:
      4006b0:       48 8d 04 37             lea    (%rdi,%rsi,1),%rax
      4006b4:       c3                      retq   

      ……原来全被优化了,gcc现在还真强大,直接猜出语义,clang测一把也是如此。

      这个并非我们想要的,我们得用其他手段去验证(其实我们可以抽出部分优化选项来,但此处讲的是验证思路)。

      此处借助我在《相互递归》中讲的奇偶判断,分三个函数,实现如下,

    /*sub1.c*/
    unsigned long long sub1(unsigned long long x)
    {
            return x - 1ULL;
    }
    /*is_odd.c*/
    unsigned long long sub1(unsigned long long x);
    int is_even(unsigned long long x);
    int is_odd(unsigned long long x)
    {
            if(x == 0ULL)
                    return 0;
            return is_even(sub1(x));
    }
    /*is_even.c*/
    unsigned long long sub1(unsigned long long x);
    int is_odd(unsigned long long x);
    int is_even(unsigned long long x)
    {
            if(x == 0ULL)
                    return 1;
            return is_odd(sub1(x));
    }

      上述函数是单独编写,甚至,减1的操作也单独用一个文件来实现。如此测试的原因,就在于,我们要排除掉整体优化的可能。

      还需要写一个main函数来验证,

    /*main.c*/
    #include <stdio.h>
    int is_odd(unsigned long long x);
    int main(int argc, char **argv)
    {
        unsigned long long x;
        sscanf(argv[1], "%llu", &x);
        printf("%llu is %s
    ", x, is_odd(x)?"odd":"even");
        return 0;
    }

      以上四个文件单独编译,开启-O2优化选项(当然,其实main无所谓)

      for i in sub1.c is_odd.c is_even.c main.c; do gcc -O2 -c $i; done

      然后链接,

      gcc sub1.o is_odd.o is_even.o main.o -o a.out

      然后我们对一个很大的数来进行测试,

      ./a.out 10000000000

      一会儿之后,程序打印出

      10000000000 is even

      以上可以证明,gcc/clang对于尾递归优化支持的挺好。实际上,很早之前大部分C语言编译器就支持了这点,因为从技术上来看,并不是很复杂的事情。而C++也同理。

    Python

      Python实现add如下

    def add(a, b):
        if a==0:
            return b
        return add(a-1, b+1)

      计算add(1000,0)就崩栈了,显然Python的发行是不支持尾递归优化的。

      不过这里栈似乎小了点,可以用sys.setrlimit来修改栈的大小,这实际上是UNIX-like的系统调用。

      有人用捕捉异常的方式让其强行支持尾递归,效率当然是损失很多的,不过这个想法倒是很好。想起以前RISC大多不支持奇边界存取值,比如ARM,于是在内核中用中断处理强行支持奇边界错误,虽然效率低了很多,但逻辑上是通过的。异曲同工,的确也是一条路,不过我还是更加期望Python在未来支持尾递归优化吧。  

    JavaScript

      依然是用add测试,编写以下网页

    <input type="text" id="in1" />
    <input type="text" id="in2" />
    <input type="button" id="bt1" onclick="test()" value="测试"/>
    <script type="text/javascript">
    function add(a, b)
    {
        if (a==0) { 
            return b;
        }
        return add(a-1, b+1);
    }
    
    function test()
    {
        a = parseInt(document.getElementById("in1").value);
        b = parseInt(document.getElementById("in2").value);
        try {
            alert(add(a,b));
        }
        catch(err) {
            alert('Error');
        }
    }
    </script>

      

      就用1000000和0来测试,没看到哪个浏览器不跳出Error的……据说v8引擎做好了,可是人家就不给你用……

    Scheme

      然后我们来看Scheme,按照Scheme的标准一向强行规定Scheme支持尾递归优化。

      我们实现add函数如下

    (define (add a b)
     (if (zero? a) b (add (- a 1) (+ b 1))))

      实现更为复杂的奇偶判断

    (define (is-odd x)
        (if (zero? x) #f (is_even (- x 1))))
    (define (is-even x)
        (if (zero? x) #t (is_odd (- x 1))))

      使用Chez Scheme、Racket、guile测试,使用很大的数来运算,

      然后使用top来观测程序的内存使用情况,我们发现,虽然CPU占用率可能是100%,但内存的使用并不增加。就连guile这样的一个小的实现都是如此,从而它们都是符合标准而对尾递归进行优化的。

    Common Lisp

      测完Scheme,再来测Scheme的本家兄弟,另外一种Lisp——Common Lisp

      先用Common Lisp实现add,因为Common Lisp将数据和过程用不同的命名空间,导致代码有点奇怪(似乎很不数学)

    (defun add(a b)
     (if (zerop a) b (funcall #'add (- a 1) (+ b 1))))

      使用clisp来运行

      (add 10000 10000)

      结果就

    *** - Program stack overflow. RESET

      因为没有尾递归优化的规定,所以对于那种无限循环,Common Lisp只能选择迭代才能保证不崩栈,比如使用do。使用do重新实现add如下

    (defun add(a b)
     (do
      ((x a (- x 1))
       (y b (+ y 1)))
      ((zerop x) 
    y)))

      如此,终于不崩栈了。但是似乎也改变了Lisp的味道,do显然此处只能在设计编译器、解释器的时候就得单独实现,虽然按理Lisp下这些都应该是宏,但是无论用宏如何将函数式编程映射为显示的迭代,因为尾clisp递归优化不支持,则无法和系统提供的do一样。

      sbcl是Common Lisp的另外一个实现,在这个实现中,我们使用第一个add函数的版本,没有发生崩栈。我们再来实现一下奇偶判断

    (defun is-odd(x) 
     (if (zerop x) '() (funcall #'is-even (- x 1))))
    (defun is-even(x)
     (if (zerop x)  t (funcall #'is-odd (- x 1))))

      计算

     (is-even 1000000000)

      过了几秒,返回了结果t,证明了sbcl对尾递归做了优化。也终于给了我们一个更为靠谱的Common Lisp的实现。

    AWK

      选择一种脚本语言来测试这个问题,使用GNU awk来实现add

    awk '
    function add(a,b)
    {
       if(a==0)
           return b
        return add(a-1, b+1)
    }
    {print add($1, $2)}'

      运行后,用top来观测内存占用

      

       

      输入

      100000000 1

      让其做加法

      

      内存使用瞬间爆发,直到进程被系统KO。

      话说,awk没有对尾递归优化也属正常,而且对于内存的使用还真不节制,超过了我的想象。不过这也与语言的目的有关,awk本就没打算做这类事情。

    Haskell

      直接上如下Haskell程序来描述奇偶判断

    is_even x = if x==0 then True else is_odd (x-1)
    is_odd x = if x==0 then False else is_even (x-1)
    main = print (is_even 1000000000)

      用ghc编译运行,输出True,用时33秒。

      Haskell不亏是号称纯函数式编程,尾递归优化无条件支持。

    Prolog

      本不想测prolog,因为首先它并没有所谓的函数,靠的是谓词演化来计算,推理上的优化是其基本需求。尾递归本不属于Prolog的支持范畴,当然可以构造类似尾递归的东西,而且Prolog当然可以完成,不会有悬念。

      比如我们实现奇偶判断如下:

    is_even(0, 1).
    is_even(X, T) :- M is X-1, is_odd(M, T).
    is_odd(0, 0).
    is_odd(X, T) :- M is X-1, is_even(M, T).

      查询

      ?- is_even(100000000,S),write(S),!.

      得到

      1

    Erlang

      先写一个model包含add/even/odd三个函数,

    -module(mytest).
    -export([add/2,even/1,odd/1]).
    add(A,B)->if A==0->B;true->add(A-1,B+1) end.
    even(X)->if X==0->true;true->odd(X-1) end.
    odd(X)->if X==0->false;true->even(X-1) end.

      加载模板,并测试如下

    1> c(mytest).
    {ok,mytest}
    2> mytest:add(1000000000,1000000000).
    2000000000
    3> mytest:even(1000000000).          
    true
    4> mytest:odd(1000000000).
    false

      显然,Erlang对尾递归支持很好。

    golang

      编写add的实现如下

    package main
    import "fmt"
    func add(a int, b int) int {
        if (a==0) {
            return b;
        }
        return add(a-1,b+1);
    }
    
    func main() {
        fmt.Println(add(100000000, 0))
    }

      

      运行

      go run add.go

      马上崩溃

    Lua

      Lua的作者和JS的作者一样是Lisp的粉丝,Lua的后期设计(从Lua4)据说参考了Scheme。

    function odd(x)
        if (x==0) then
            return false
        end
        return even(x-1)
    end
    function even(x)
        if (x==0) then
            return true
        end
        return odd(x-1)
    end
    print(odd(io.read()))

      运行

      echo 1000000000 | lua5.3 x.lua

      过程中,观察内存没有明显变化,之后打印出了false

      看来,至少参考了Scheme的尾递归优化。

    Ruby

      Ruby的作者松本行弘也是Lisp的粉丝,当然,我想大多数编程语言的作者都会是Lisp的粉丝,因为它会给人很多启发。

      实现奇偶判断如下:

    #!/usr/bin/ruby
     
    def odd(x)
        if x == 0
            return 0
        end
        return even(x-1)
    end
    
    def even(x)
        if x == 0
            return 1
        end
        return odd(x-1)
    end
    
    puts even gets.to_i

      然而,数字大一点点,就崩栈了。Ruby并不支持尾递归优化。

    尾声

      测了这些语言以及相应的工具,其实还是在于函数式编程里,尾递归实现的迭代是我们经常使用的手段,编译器/解释器的支持就会显得很重要了。再深一步,我们会去想想,编译器/解释器此处该如何做,是否可以对现有的设计进行修改呢?或者,对该语言/工具的未来怀着什么样的期待呢?再或者,如果我们自己也设计一种编程语言,会如何设计这种编程语言呢?……

  • 相关阅读:
    python多线程
    python Queue
    PHP curl 模拟登陆
    Smarty 插件开发
    Smarty 使用继承方式实现配置
    Smarty include使用
    MongoDB初探系列之二:认识MongoDB提供的一些经常使用工具
    Ubuntu 12.10 安装JDK7
    第17期中国智能家居主题沙龙将于5月23日在京举行
    重温 Win32 API ----- 截屏指定窗体并打印
  • 原文地址:https://www.cnblogs.com/Colin-Cai/p/11774213.html
Copyright © 2020-2023  润新知