• py11 模块


    一 模块介绍

    一个模块就是一个包含了一组功能的python文件,比如spam.py,模块名为spam,可以通过import spam使用。

    在python中,模块的使用方式都是一样的,但其实细说的话,模块可以分为四个通用类别: 
    1 使用python编写的.py文件   

    2 已被编译为共享库或DLL的C或C++扩展   

    3 把一系列模块组织到一起的文件夹(注:文件夹下有一个__init__.py文件,该文件夹称之为包)   

    4 使用C编写并链接到python解释器的内置模块

    示例文件

    #spam.py
    print('from the spam.py')
    
    money=1000
    
    def read1():
        print('spam模块:',money)
    
    def read2():
        print('spam模块')
        read1()
    
    def change():
        global money
        money=0

    py文件区分两种用途:模块与脚本

    #编写好的一个python文件可以有两种用途:
    一:脚本,一个文件就是整个程序,用来被执行

    二:模块,文件中存放着一堆功能,用来被导入使用 #python为我们内置了全局变量__name__,

    当文件被当做脚本执行时:__name__ 等于'__main__' 当文件被当做模块导入时:__name__等于模块名

    #作用:用来控制.py文件在不同的应用场景下执行不同的逻辑

        if __name__ == '__main__':

    import

    import的本质:

    import spam:相当于把spam文件下所有代码解释一遍(类似于print的代码直接运行了),然后赋值给spam,这样一来就能spam.money,spam.read2()调用了

    模块导入时到底发生了是么?

    • 当模块第一次被导入时,先为源文件(spam模块)创建新的名称空间,然后在该命名空间解释代码(相当于执行源文件),最后创建名字spam来引用该命名空间,这样就可以通过spam.xx访问。
    • 当再次导入相同文件时,由于第一次导入后就将模块名加载到内存了,后续的import语句仅是对已经加载到内存中的模块对象增加了一次引用,不会重新执行模块内的语句。
    • ps:我们可以从sys.module中找到当前已经加载的模块,sys.module是一个字典,内部包含模块名与模块对象的映射,该字典决定了导入模块时是否需要重新导入。
    #test.py
    import spam #只在第一次导入时才执行spam.py内代码,此处的显式效果是只打印一次'from the spam.py',当然其他的顶级代码也都被执行了,只不过没有显示效果.
    import spam
    import spam
    import spam
    
    '''
    执行结果:
    from the spam.py
    '''

    导入模块还有别的方式,例如:

    import spam

    import spam,spam1

    from spam import *(把spam中所有的不是以下划线(_)开头的名字都导入到当前位置)(不建议使用)

    from spam import money,read1

    from spam import money,read1 as spam_read1

    • from spam import * 因为会吧spam文件所有的变量,函数都导入,可能会与本身文件变量,函数有冲突,不建议使用
    • 通过from导入的模块,使用时,不能再用spam.xx来使用,只能直接xx或者xxx()来使用。
    • 当用from导入的变量或函数与本文件产生冲突(名字相同)时,以本文件的为优先

    导入模块时:

    首先,会根据sys.path进行寻找,在sys.path对应的路径中找是否有需要导入的模块,没找到就报错,可以通过sys.path.append()和sys.path.insert()来添加需要的路径。

    文件的__file__属性代表当前文件的文件名,os.path.abspath(__file__)代表获取当前文件的绝对路径,os.path.dirname()获取目录名(相当于上一级)。eg:

    sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

    sys.path 输出是一个列表,其中第一项是空串'',代表当前目录(若是从一个脚本中打印出来的话,可以更清楚地看出是哪个目录),亦即我们执行python解释器的目录(对于脚本的话就是运行的脚本所在的目录)。

    包是一种管理 Python 模块命名空间的形式,采用"点模块名称"。

    比如一个模块的名称是 A.B, 那么他表示一个包 A中的子模块 B 。

    就好像使用模块的时候,你不用担心不同模块之间的全局变量相互影响一样,采用点模块名称这种形式也不用担心不同库之间的模块重名的情况。

    这样不同的作者都可以提供 NumPy 模块,或者是 Python 图形库。

    不妨假设你想设计一套统一处理声音文件和数据的模块(或者称之为一个"包")。

    这里给出了一种可能的包结构(在分层的文件系统中):

    sound/                          顶层包
          __init__.py               初始化 sound 包
          formats/                  文件格式转换子包
                  __init__.py
                  wavread.py
                  wavwrite.py
                  aiffread.py
                  aiffwrite.py
                  auread.py
                  auwrite.py
                  ...
          effects/                  声音效果子包
                  __init__.py
                  echo.py
                  surround.py
                  reverse.py
                  ...
          filters/                  filters 子包
                  __init__.py
                  equalizer.py
                  vocoder.py
                  karaoke.py
                  ...

    在导入一个包的时候,Python 会根据 sys.path 中的目录来寻找这个包中包含的子目录。

    目录只有包含一个叫做 __init__.py 的文件才会被认作是一个包,主要是为了避免一些滥俗的名字(比如叫做 string)不小心的影响搜索路径中的有效模块。

    最简单的情况,放一个空的 :file:__init__.py就可以了。当然这个文件中也可以包含一些初始化代码或者为(将在后面介绍的) __all__变量赋值。

    用户可以每次只导入一个包里面的特定模块,比如:

    import sound.effects.echo

    这将会导入子模块:sound.effects.echo。 他必须使用全名去访问:

    sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)

    还有一种导入子模块的方法是:

    from sound.effects import echo

    这同样会导入子模块: echo,并且他不需要那些冗长的前缀,所以他可以这样使用:

    echo.echofilter(input, output, delay=0.7, atten=4)

    还有一种变化就是直接导入一个函数或者变量:

    from sound.effects.echo import echofilter

    同样的,这种方法会导入子模块: echo,并且可以直接使用他的 echofilter() 函数:

    echofilter(input, output, delay=0.7, atten=4)

    注意当使用from package import item这种形式的时候,对应的item既可以是包里面的子模块(子包),或者包里面定义的其他名称,比如函数,类或者变量。

    import语法会首先把item当作一个包定义的名称,如果没找到,再试图按照一个模块去导入。如果还没找到,恭喜,一个:exc:ImportError 异常被抛出了。

    反之,如果使用形如import item.subitem.subsubitem这种导入形式,除了最后一项,都必须是包,而最后一项则可以是模块或者是包,但是不可以是类,函数或者变量的名字。

    导入包的实质就是执行包的__init__.py文件

    使用import 包名     # 相当于执行__init__.py,在__init__.py文件里也可以import导入模块,未在__init__.py中导入的模块尽管导入了包名也无法使用

    使用import 包名.模块名  # 如此只能导入包中的一个模块,调用时也需要包名.模块名.方法名这样调用(用as优化),带路径的导入也是如此:(模块包名.[路径(子包).]模块名)

    使用from 包名 import *  # 这样会先找__init__.py中叫__all__ 的列表变量,把这个列表中的所有名字作为包内容导入。

    • 当__all__未定义时,from 包名 import *这种方式会执行__init__.py,若__init__.py文件中导入了模块,则会把模块导入
    • 当__all__定义了但是为空时,from 包名 import *这种方式也会执行__init__.py,若__init__.py文件中导入了模块,会对模块进行解释(相当于运行),但是无法使用该模块。因为__all__定义了,则只会导入__all__里的模块,但是其为空,所以值会执行__init__.py,对__init__.py文件导入的模块进行解释,却不能使用这些模块。
    • 当__all__定义了且不为空时,from 包名 import *这种方式执行__init__.py,对__init__.py文件中导入的模块进行解释,但是只能使用__all__中的模块

    包以及包所包含的模块都是用来被导入的,而不是被直接执行的。而环境变量都是以执行文件为准的

    比如我们想在glance/api/versions.py中导入glance/api/policy.py,有的同学一抽这俩模块是在同一个目录下,十分开心的就去做了,它直接这么做

    在version.py中
    
    import policy
    policy.get()

    没错,我们单独运行version.py是一点问题没有的,运行version.py的路径搜索就是从当前路径开始的,于是在导入policy时能在当前目录下找到

    但是你想啊,你子包中的模块version.py极有可能是被一个glance包同一级别的其他文件导入,比如我们在于glance同级下的一个test.py文件中导入version.py,如下

    from glance.api import versions
    '''
    执行结果:
    ImportError: No module named 'policy'
    '''
    
    '''
    分析:
    此时我们导入versions在versions.py中执行
    import policy需要找从sys.path也就是从当前目录找policy.py,
    这必然是找不到的
    '''

    dir() 函数

    内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回:
    >>> import spam, sys
    >>> dir(spam)
    ['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'change', 'money', 'read1', 'read2']
    >>> dir(sys)  
    ['__displayhook__', '__doc__', '__excepthook__', '__loader__', '__name__',
     '__package__', '__stderr__', '__stdin__', '__stdout__',
     '_clear_type_cache', '_current_frames', '_debugmallocstats', '_getframe',
     '_home', '_mercurial', '_xoptions', 'abiflags', 'api_version', 'argv',
     'base_exec_prefix', 'base_prefix', 'builtin_module_names', 'byteorder',
     'call_tracing', 'callstats', 'copyright', 'displayhook',
     'dont_write_bytecode', 'exc_info', 'excepthook', 'exec_prefix',
     'executable', 'exit', 'flags', 'float_info', 'float_repr_style',
     'getcheckinterval', 'getdefaultencoding', 'getdlopenflags',
     'getfilesystemencoding', 'getobjects', 'getprofile', 'getrecursionlimit',
     'getrefcount', 'getsizeof', 'getswitchinterval', 'gettotalrefcount',
     'gettrace', 'hash_info', 'hexversion', 'implementation', 'int_info',
     'intern', 'maxsize', 'maxunicode', 'meta_path', 'modules', 'path',
     'path_hooks', 'path_importer_cache', 'platform', 'prefix', 'ps1',
     'setcheckinterval', 'setdlopenflags', 'setprofile', 'setrecursionlimit',
     'setswitchinterval', 'settrace', 'stderr', 'stdin', 'stdout',
     'thread_info', 'version', 'version_info', 'warnoptions']
    

    如果没有给定参数,那么 dir() 函数会罗列出当前定义的所有名称:

    >>> a = [1, 2, 3, 4, 5]
    >>> import fibo
    >>> fib = fibo.fib
    >>> dir() # 得到一个当前模块中定义的属性列表
    ['__builtins__', '__name__', 'a', 'fib', 'fibo', 'sys']
    >>> a = 5 # 建立一个新的变量 'a'
    >>> dir()
    ['__builtins__', '__doc__', '__name__', 'a', 'sys']
    >>>
    >>> del a # 删除变量名a
    >>>
    >>> dir()
    ['__builtins__', '__doc__', '__name__', 'sys']
    >>>

    绝对导入

    关于这句from __future__ import absolute_import的作用:
    直观地看就是说”加入绝对引入这个新特性”。说到绝对引入,当然就会想到相对引入。那么什么是相对引入呢?比如说,你的包结构是这样的:
    pkg/
    pkg/init.py
    pkg/main.py
    pkg/string.py

    如果你在main.py中写import string,那么在Python 2.4或之前, Python会先查找当前目录下有没有string.py, 若找到了,则引入该模块,然后你在main.py中可以直接用string了。如果你是真的想用同目录下的string.py那就好,但是如果你是想用系统自带的标准string.py呢?那其实没有什么好的简洁的方式可以忽略掉同目录的string.py而引入系统自带的标准string.py。这时候你就需要from __future__ import absolute_import了。这样,你就可以用import string来引入系统的标准string.py, 而用from pkg import string来引入当前目录下的string.py了

    相对导入(各种坑)

    相对导入

    如果在结构中包是一个子包(比如这个例子中对于包sound来说),而你又想导入兄弟包(同级别的包)你就得使用导入绝对的路径来导入。比如,如果模块sound.filters.vocoder 要使用包sound.effects中的模块echo,你就要写成 from sound.effects import echo。from后面一个点代表同级目录,两个点代表上级目录。

    from . import echo
    from .. import formats
    from ..filters import equalizer
    

    下面是相对导入需要注意的几点

    1.如果要将一个文件夹目录当做package的话,必须要在该目录下加一个__init__.py的文件(注意是两个下划线连在一起__),否则将无法作为一个package;

    2.执行模块是程序入口模块时(__name__ == '__main__'),不能使用相对导入。因为在程序入口模块执行时,__name__这个变量值是”__main__”。而相对引用符号”.”的就是对应__name__这个变量。当这个模块是在别的模块中被导入使用,此时的”.”就是原模块的文件名。在main函数中执行时,此时”.”变成了”__main__”。(会出现No module named '__main__.xxxx'; '__main__' is not a package

    3.虽然第二点说了,程序入口模块不能使用相对导入,那么在程序入口模块中随意调用别的模块进行相对导入不就行了?emmmm太天真了,与程序入口模块在同一目录下的模块也无法使用相对导入,否则会出现(ImportError: attempted relative import with no known parent package)解决模块的算法是基于__name____package__变量的值。大部分时候,这些变量不包含任何包信息 —- 比如:__name__ = __main____package__ = None(第三点属于None) 时,python解释器不知道模块所属的包。在这种情况下,相对引用会认为这个模块就是顶级模块,而不管模块在文件系统上的实际位置。

    4.执行脚本时,会把当前项目目录和执行文件的目录加入到sys.path中

    下面给出报错示例:首先请看目录结构(请自行忽略8级汉语拼音)

    在abc三个文件中互相import a这种导入时一点问题都没有,但一旦换成相对导入

    1.例如在a.py中写

    from . import b
    from .b import funb
    from .daorubao import d
    

    这三种写法都会报错,想想属于哪种错?答案是相对导入注意的第二点,执行模块是程序入口模块时不能使用相对导入

    修改方法是把后两行的.去掉即可

    2.在c.py中写

    from .a import funa
    from .daorubao import d
    

    然后在b.py中写

    import c
    

    然后运行b.py,这时,c.py中的两行语句无论哪一行都会报错,错误参考相对导入注意第三点

    解决方法依然是吧c.py中的两行语句的.去掉即可

    3.在e.py中写

    from . import f
    from .f import *
    

    然后在a.py中写

    from daorubao import e
    

    这个时候会出现。。emmm不会出现错误,因为这时e中的相对导入可以使用,不是入口程序,也不和入口程序在同一目录下

     __all__属性在模块与包中的应用

     在包中

     在包中__all__的使用在上文有提到,总结来说就是使用from 包名 import *时,会先找__init__.py中叫__all__ 的列表变量

    • 当__all__未定义时,from 包名 import *这种方式会执行__init__.py,若__init__.py文件中导入了模块,则会把模块导入
    • 当__all__定义了但是为空时,from 包名 import *这种方式也会执行__init__.py,若__init__.py文件中导入了模块,会对模块进行解释(相当于运行),但是无法使用该模块。因为__all__定义了,则只会导入__all__里的模块,但是其为空,所以值会执行__init__.py,对__init__.py文件导入的模块进行解释,却不能使用这些模块。
    • 当__all__定义了且不为空时,from 包名 import *这种方式执行__init__.py,对__init__.py文件中导入的模块进行解释,但是只能使用__all__中的模块

    在模块中

    用于模块导入时限制,也是只有使用
    from 模块名 import *时,被导入模块若定义了__all__属性,则只有__all__内指定的属性、方法、类可被导入。若没定义,则导入模块内的所有公有属性,方法和类 。

    详见https://blog.csdn.net/sxingming/article/details/52903377

    特别注意一下这种

    def func():  # 模块中的public方法
        print('func() is called!')
    
    def _func():  # 模块中的protected方法
        print('_func() is called!')
    
    def __func():  # 模块中的private方法
        print('__func() is called!')
    
    from kk import * #这种方式只能导入公有的属性,方法或类【无法导入以单下划线开头(protected)或以双下划线开头(private)的属性,方法或类】
    但是如果带下划线的方法属性被写进__all__或者直接import a._func也是可以用的
    from kk import func,_func,__func #可以通过这种方式导入public,protected,private
    import kk #也可以通过这种方式导入public,protected,private

    importlib

    Python将importlib作为标准库提供。它旨在提供Pythonimport语法和(__import__()函数)的实现。另外,importlib提供了开发者可以创建自己的对象(即importer)来处理导入过程。

    那么imp呢?还有一个imp模块提供了import语句接口,不过这个模块在Python3.4已经deprecated了。建议使用importlib来处理。

    下面是简单使用:

    import importlib
    
    # 根据字符串导入模块
    # 通常用来导入包下面的模块
    o = importlib.import_module("xx.oo")
    s2 = "Person"
    
    # 由字符串找函数、方法、类  利用 反射
    the_class = getattr(o, "Person")
    p2 = the_class("小黑")
    p2.dream()
    

    动态导入

    importlib模块支持传递字符串来导入模块。我们先来创建一些简单模块一遍演示。我们在模块里提供了相同接口,通过打印它们自身名字来区分。我们分别创建了foo.pybar.py,代码如下:

    def main():
        print(__name__)
    

    现在我们尽需要使用importlib导入它们。我们来看看代码是如何实现的,确保该代码在刚才创建的两个文件的相同目录下。

    #importer
    import importlib
    
    def dynamic_import(module):
        return importlib.import_module(module)
    
    
    if __name__ == "__main__":
        module = dynamic_import('foo')
        module.main()
    
        module2 = dynamic_import('bar')
        module2.main()
    

    这里我们导入importlib模块,并创建了一个非常简单的函数dynamic_import。这个函数直接就调用了importlib的import_module方法,并将要导入的模块字符串传递作为参数,最后返回其结果。然后在主入口中我们分别调用了各自的main方法,将打印出各自的name.

    $ python3 importer.py 
    foo
    bar
    

    也许你很少会代码这么做,不过在你需要试用字符串作为导入路径的话,那么importlib就有用途了。

    模块导入检查

    Python有个众所周知的代码风格EAFP: Easier to ask forgiveness than permission.它所代表的意思就是总是先确保事物存在(例如字典中的键)以及在犯错时捕获。如果我们在导入前想检查是否这个模块存在而不是靠猜。 使用mportlib就能实现。

    import importlib.util
    
    def check_module(module_name):
        """
        Checks if module can be imported without actually
        importing it
        """
        module_spec = importlib.util.find_spec(module_name)
        if module_spec is None:
            print("Module: {} not found".format(module_name))
            return None
        else:
            print("Module: {} can be imported".format(module_name))
            return module_spec
    
    def import_module_from_spec(module_spec):
        """
        Import the module via the passed in module specification
        Returns the newly imported module
        """
        module = importlib.util.module_from_spec(module_spec)
        module_spec.loader.exec_module(module)
        return module
    
    if __name__ == '__main__':
        module_spec = check_module('fake_module')
        module_spec = check_module('collections')
        if module_spec:
            module = import_module_from_spec(module_spec)
            print(dir(module))
    

    这里我导入了importlib的子模块util。check_module里面调用find_spec方法, 传递该模块字符串作为参数。当我们分别传入了一个不存在和存在的Python模块。你可以看到当你传入不存在的模块时,find_spec函数将返回 None,在我们代码里就会打印提示。如果存在我们将返回模块的specification。

    我们可以通过该模块的specification来实际导入该模块。或者你直接将字符串作为参数调用import_module函数。不过我这里也学习如何试用模块specification方式导入。看看import_module_from_spec函数。它接受check_module提供的模块specification作为参数。然后我们将它传递给了module_from_spec函数,它将返回导入模块。Python文档推荐导入后然后执行模块,所以接下来我们试用exec_module函数执行。最后我们使用dir来确保得到预期模块。

    从源代码导入

    importlib的子模块有个很好用的技巧我想提提。你可以使用util通过模块的名字和路径来导入模块。

    import importlib.util
    
    def import_source(module_name):
        module_file_path = module_name.__file__
        module_name = module_name.__name__
    
        module_spec = importlib.util.spec_from_file_location(
            module_name, module_file_path
        )
        module = importlib.util.module_from_spec(module_spec)
        module_spec.loader.exec_module(module)
        print(dir((module)))
    
        msg = 'The {module_name} module has the following methods {methods}'
        print(msg.format(module_name=module_name, methods=dir(module)))
    
    
    if __name__ == "__main__":
        import logging
        import_source(logging)
    

    在上面的代码中,我们实际导入logging模块,并将模块传递给了import_source函数。这样我们就可以通过导入的模块获取到实际的路 径和名字。然后我们将信息传递给sec_from_file_location函数,它将返回模块的specification。也了这个我们就可以在前 面那样直接通过importlib导入了。

    总结

    目前,你知道如何在代码中使用importlib和import钩子。这个模块内容非常多,如果你想自定义importer或者loader,那么你可以通过官方文档或者源代码了解更多。

  • 相关阅读:
    Java Web开发 之VO、PO、DTO等收集
    Hive的安装与使用
    各种默认回车提交表单
    A/B Problem
    A+B Problem II
    A+B Problem IV
    关于521
    劝你别做
    无主之地1
    A+B Problem(V)
  • 原文地址:https://www.cnblogs.com/wlx97e6/p/9394354.html
Copyright © 2020-2023  润新知