• 解释型语言和编译型语言的不同以及Python如何运行


    计划写关于Python中如何实现属性管理、函数(或类方法)管理、类管理的几篇成系列的文章。
    而这篇文章写在这个系列之前,希望对后面几篇文章的理解有所帮助。
    老实说,我也是在网上搜索了一些资料才写的这篇文章,如果有的地方写的不够好,请指正...

    何为编译?

    1. 生成目标文件。
    2. 且目标文件是针对特定的 CPU 体系的(注意,开头用了"且"字)。
      为ARM生成的目标文件,不能被用于MIPS的CPU,也不能用于x86的CPU。反过来说也是成立的。
      也就是说这段代码在生成目标文件的过错中就已经被翻译成了目标CPU指令,所以如果这个程序需要在另外一种CPU上面运行,这个代码就必须重新翻译。
      而上述这个翻译过程叫做编译。

    何为解释?

    对于各种非编译型语言(例如python/java)来说,可能不存在某种翻译成中间文件的过错,可能存在某种编译成中间文件的过程
    如果存在翻译过错,那么他们翻译生成的通常是一种『平台无关』的中间代码,这种代码一般不是针对特定的CPU平台,他们是在运行过程中才被翻译成目标CPU指令的,因而在ARM CPU上能执行,换到MIPS也能执行,换到x86也能执行,不需要重新对源代码进行翻译。
    而由于这些中间代码并不是能在CPU上直接运行,所以需要某种中介(叫做虚拟机)在执行时负责把代码翻译成CPU能执行的指令。

    区别

    编译型语言生成的文件已经针对某个特定的CPU生成了最终文件,所以在下载的时候针对不同的CPU下载不同的文件,这就是为什么在网上下载某个文件时,Windows系统用户下载Windows的下载包(因为Windows是操作x86系列CPU的),而Android手机(因为Android是操作ARM系列CPU的)需要下载Android类型的下载包。
    针对解释型语言,因为你的中间文件并不是针对某个CPU的,所以如果某人在网上共享了一个Python源代码或者中间代码(字节码),那么不管你运行什么操作系统,下载的文件是一样的。而如果你原来没有下载虚拟机的话,可能你需要下载一个虚拟机才能够运行这个下载的文件。
    你可能会说,我只要装了Python,就可以运行下载下来的Python文件了呀,这是因为你下载的Python运行包中已经包含了一个虚拟机。

    简单总结:

    1,编译型语言在编译过程中生成目标平台的指令,解释型语言在运行过程中才生成目标平台的指令。
    2,虚拟机的任务是在运行过程中将中间代码翻译成目标平台的指令。

    优缺点

    1. 解释语言需要考虑不同平台的共性。比如A平台支持加法和乘法,而B平台仅支持加法。为了执行9乘9这个操作同时还要保证它在A和B两个平台上都能运行,必须将9乘9翻译成A.B两平台都支持的加法,即9个9相加。所以势必会影响效率。
    2. 解释语言具有跨平台的优点,只要在平台上装了针对于该平台的虚拟机,那么一次编写,N次运行,所以生产效率高。
    3. 当代码发生更改时,解释语言由于时解释一句执行一句,效率不会发生更改。但是编译语言需要重新编译,效率会受到影响。
    4. 对解释型语言来说,代码的错误检查发生在执行时。

    Python的运作模式

    讲了这么多,下面的部分是才是真正对我们编写代码有实际影响的。

    python运行时分为下面的四步:

    • 词法分析
    • 句法分析
    • 编译
    • 解释
    1. 词法分析的工作就是将输入的原始代码分解为一些符号token(包括标示符,关键字,数字, 操作符等)。这个过程中是不会报任何错的。
    2. 句法分析程序再接收这些符号,并用一种结构来展现它们之间的关系(在这种情况下使用的抽象语法树)。此时如果出现句法错误,会有提示。
      我们常说,Python运行时不会执行函数,所以也不会报函数中的错误。
      其实是说的片面的,请看下面的代码,我在函数f中写了一個语法错误,Python会报错。
    L=[1,2,3]
    def f():
        L1=[for i in L]
    

    执行结果如下:

      File "hh.py", line 4
        L1=[for i in L]
              ^
    SyntaxError: invalid syntax
    
    1. 在句法分析后Python接收这棵抽象语法树,并将它转化为一个(或多个)代码对象。此时会出现我们说的中间码,或者说字节码。
    >>> def f(x=1,y=2):
    ...   a='a'
    ...   b='b'
    ...   return x+y
    ... 
    >>> f.__code__
    <code object f at 0x7fe93cdfc5d0, file "<stdin>", line 1>
    >>> dir(f.__code__)
    ['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'co_argcount', 'co_cellvars', 'co_code', 'co_consts', 'co_filename', 'co_firstlineno', 'co_flags', 'co_freevars', 'co_kwonlyargcount', 'co_lnotab', 'co_name', 'co_names', 'co_nlocals', 'co_stacksize', 'co_varnames']
    >>> f.__code__.co_name
    'f'
    >>> f.__code__.co_nlocals   #定义的局部变量个数
    4
    >>> f.__code__.co_varnames
    ('x', 'y', 'a', 'b')
    >>> f.__code__.co_argcount  
    2
    >>> f.__code__.co_code      #字节码
    b'dx01x00}x02x00dx02x00}x03x00|x00x00|x01x00x17S'
    

    如果我们直接运行一个Python文件,那么Python在执行完后就把这个字节码文件删除掉了,因为Python认为复用性不高。
    但是如果是一个模块文件,那么Python会存起来,我们来做个实验。
    a.py

    import b
    

    b.py

    def f(a=1):
        print(a)
    

    当我们运行只有唯一一条语句的a.py时,Python会创立一个__pycache__的文件夹,其中就包括了b.cpython-34.pyc文件,这个就是b.py的字节码文件,如果用open函数打开来看看,就会看到下面的二进制文件,如果用普通方式打开,那么会提示编码错误。

    >>> open('__pycache__/b.cpython-34.pyc','rb').read()
    b'xeex0c
    0%xd8Ux19x00x00x00xe3x00x00x00x00x00x00x00x00x00x00x00x00x03x00x00x00@x00x00x00sx13x00x00x00dx00x00dx01x00dx02x00x84x01x00Zx00x00dx03x00S)x04xe9x01x00x00x00cx01x00x00x00x00x00x00x00x01x00x00x00x02x00x00x00Cx00x00x00sx0ex00x00x00tx00x00|x00x00x83x01x00x01dx00x00S)x01N)x01xdax05print)x01xdax01axa9x00rx04x00x00x00xfax13/home/aaa/proj/b.pyxdax01fx01x00x00x00sx02x00x00x00x00x01rx06x00x00x00N)x01rx06x00x00x00rx04x00x00x00rx04x00x00x00rx04x00x00x00rx05x00x00x00xdax08<module>x01x00x00x00sx00x00x00x00'
    
    1. 解释器逐个接收这些代码对象,并执行它们所代表的代码。

    题外话

    以下题外话摘录于网上,如果有什么地方不对,请指正。
    现在关于解释和编译的界限也不是特别清晰了。
    Java需要预先把代码编译成虚拟机指令的,然后在运行这些虚拟机指令,有的教科书上会成为混合型或者半编译型。
    像Python和lua这样就更不好分了,可以直接解释源代码运行,也可以编译为虚拟机指令然后再运行。
    php编译之后的结果可以被Web Server缓存起来,甚至还可以先被翻译为C++,然后再编译。
    .NET 的CLR运行时是Windows的组成部分,编译好的.NET 系列语言的代码直接生成可执行文件,然后被“直接”执行,看起来跟C没有什么太大的差别。
    JavaScript可以被V8引擎编译为机器码然后执行,如果在node.js下,这个编译结果被缓存起来了,你说这跟编译好再执行的C有什么区别?

    编译型语言

    1、编辑:用编辑软件(EDIT.EXE或记事本)形成源程序(.ASM),如:LX.ASM;
    2、汇编:用汇编程序(MASM.EXE)对源程序进行汇编,形成目标文件(.OBJ),格式如下:MASM LX.ASM;
    3、连接:用连接程序(LINK.EXE)对目标程序进行连接,形成可执行文件(.EXE),格式如下:LINK LX.OBJ;
    4、执行:如果结果在屏幕在显示,则直接执行可执行文件。
    5、调试:用调试程序(DEBUG.EXE)对可执行文件进行调试,格式如下:DEBUG LX.EXE
    目标代码由机器指令组成,一般不能独立运行,因为源程序中可能使用了某些汇编程序不能解释引用的库函数,而库函数代码又不在源程序中,此时还需要链接程序完成外部引用和目标模块调用的链接任务,最后输出可执行代码

    如果对这个方向很感兴趣,那么下面的几篇文章可以进一步阅读:
    http://python.jobbole.com/81660/
    http://developer.51cto.com/art/201309/410862.htm
    http://developer.51cto.com/art/201003/190924.htm

  • 相关阅读:
    10、mysql序列使用、数据去重
    9、mysql临时表、复制表
    记一次FileOutputStream出现FileNotFoundException(stale file handle)的问题
    记一次ORACLE报ORA-02290: 违反检查约束条件错误
    TreeUtil---生成树状结构数据
    Redis
    Redis事务
    Redis工具类
    Nginx
    EasyExcel动态导出数据
  • 原文地址:https://www.cnblogs.com/jessonluo/p/4750481.html
Copyright © 2020-2023  润新知