大部份内容摘自授课老师的博客http://www.cnblogs.com/Eva-J/
编译python文件
编译python文件是为了提高加载模块的速度,强调强调强调:提高的是加载速度而绝非运行速度。
python解释器会在__pycache__目录下缓存每个模块编译后的版本,格式为:module.version.pyc。
通常会包含python的版本号。
例如,在CPython3.3版本下,my_module.py模块会被缓存成__pycache__/my_module.cpython-33.pyc。
这种命名规范保证了编译后的结果多版本共存。
Python检查源文件的修改时间与编译的版本进行对比,如果过期就需要重新编译。
这是完全自动的过程。并且编译的模块是平台独立的,
所以相同的库可以在不同的架构的系统之间共享,即pyc是一种跨平台的字节码,类似于JAVA和.NET,
是由python虚拟机来执行的,但是pyc的内容跟python的版本相关,不同的版本编译后的pyc文件不同,
2.5编译的pyc文件不能到3.5上执行,并且pyc文件是可以反编译的,因而它的出现仅仅是用来提升模块的加载速度的。
python解释器在以下两种情况下不检测缓存。
1 如果是在命令行中被直接导入模块,则按照这种方式,每次导入都会重新编译,
并且不会存储编译后的结果(python3.3以前的版本应该是这样)
python -m my_module.py
2 如果源文件不存在,那么缓存的结果也不会被使用,
如果想在没有源文件的情况下来使用编译后的结果,则编译后的结果必须在源目录下。
提示:
1.模块名区分大小写,foo.py与FOO.py代表的是两个模块;
2.你可以使用-O或者-OO转换python命令来减少编译模块的大小。
-O转换会帮你去掉assert语句
-OO转换会帮你去掉assert语句和__doc__文档字符串
由于一些程序可能依赖于assert语句或文档字符串,你应该在在确认需要的情况下使用这些选项。
3.在速度上从.pyc文件中读指令来执行不会比从.py文件中读指令执行更快,
只有在模块被加载时,.pyc文件才是更快的。
4.只有使用import语句是才将文件自动编译为.pyc文件,
在命令行或标准输入中指定运行脚本则不会生成这类文件,
因而我们可以使用compieall模块为一个目录中的所有模块创建.pyc文件。
模块可以作为一个脚本(使用python -m compileall)编译Python源
python -m compileall /module_directory 递归 编译
如果使用python -O -m compileall /module_directory -l则只一层
命令行里使用compile()函数时,自动使用python -O -m compileall
详见:https://docs.python.org/3/library/compileall.html#module-compileall
补充:dir()函数
内建函数dir是用来查找模块中定义的名字,返回一个有序字符串列表:
import my_module
dir(my_module)
如果没有参数,dir()列举出当前定义的名字。
dir()不会列举出内建函数或者变量的名字,它们都被定义到了标准模块builtin中,可以列举出它们,
import builtins
dir(builtins)
包
包是一种通过使用‘.模块名’来组织python模块名称空间的方式。
1. 无论是import形式还是from...import形式,
凡是在导入语句中(而不是在使用时)遇到带点的,都要第一时间提高警觉:这是关于包才有的导入语法。
2. 包是目录级的(文件夹级),文件夹是用来组成py文件(包的本质就是一个包含__init__.py文件的目录)。
3. import导入文件时,产生名称空间中的名字来源于文件,import 包,
产生的名称空间的名字同样来源于文件,即包下的__init__.py,导入包本质就是在导入该文件。
强调:
1. 在python3中,即使包下没有__init__.py文件,import 包仍然不会报错,
而在python2中,包下一定要有该文件,否则import 包报错。
2. 创建包的目的不是为了运行,而是被导入使用,记住,包只是模块的一种形式而已,包即模块。
包A和包B下有同名模块也不会冲突,如A.a与B.a来自俩个命名空间。
以下是创建(包)目录的代码(脚本),以后可以在这个基础上扩展出规范的创建脚本,自动省时:
import os
os.makedirs('glance/api')
os.makedirs('glance/cmd')
os.makedirs('glance/db')
l = []
l.append(open('glance/__init__.py','w'))
l.append(open('glance/api/__init__.py','w'))
l.append(open('glance/api/policy.py','w'))
l.append(open('glance/api/versions.py','w'))
l.append(open('glance/cmd/__init__.py','w'))
l.append(open('glance/cmd/manage.py','w'))
l.append(open('glance/db/models.py','w'))
map(lambda f:f.close() ,l)
目录结构:
glance/ #Top-level package
├── __init__.py #Initialize the glance package
├── api #Subpackage for api
│ ├── __init__.py
│ ├── policy.py
│ └── versions.py
├── cmd #Subpackage for cmd
│ ├── __init__.py
│ └── manage.py
└── db #Subpackage for db
├── __init__.py
└── models.py
文件内容
#policy.py
def get():
print('from policy.py')
#versions.py
def create_resource(conf):
print('from version.py: ',conf)
#manage.py
def main():
print('from manage.py')
#models.py
def register_models(engine):
print('from models.py: ',engine)
注意事项
1.关于包相关的导入语句也分为import和from ... import ...两种,
但是无论哪种,无论在什么位置,
在导入时都必须遵循一个原则:凡是在导入时带点的,点的左边都必须是一个包,否则非法。
可以带有一连串的点,如item.subitem.subsubitem,但都必须遵循这个原则。
2.对于导入后,在使用时就没有这种限制了,点的左边可以是包,模块,函数,类(它们都可以用点的方式调用自己的属性)。
3.对比import item 和from item import name的应用场景:
如果我们想直接使用name那必须使用后者。
import
我们在与包glance同级别的文件中测试:
import glance.db.models
glance.db.models.register_models('mysql')
from ... import ...
需要注意的是from后import导入的模块,
必须是明确的一个不能带点,否则会有语法错误,如:from a import b.c是错误语法
我们在与包glance同级别的文件中测试
from glance.db import models
models.register_models('mysql')
from glance.db.models import register_models
register_models('mysql')
__init__.py文件
不管是哪种方式,只要是第一次导入包或者是包的任何其他部分,
都会依次执行包下的__init__.py文件(我们可以在每个包的文件内都打印一行内容来验证一下),
这个文件可以为空,但是也可以存放一些初始化包的代码。
from glance.api import *
在讲模块时,我们已经讨论过了从一个模块内导入所有*,此处我们研究从一个包导入所有*。
此处是想从包api中导入所有,实际上该语句只会导入包api下__init__.py文件中定义的名字,
我们可以在这个文件中定义__all___:
在__init__.py中定义
x=10
def func():
print('from api.__init.py')
__all__=['x','func','policy']
此时我们在于glance同级的文件中执行from glance.api import *就导入__all__中的内容(versions仍然不能导入)。
from glance.api import *
glance/
├── __init__.py
├── api
│ ├── __init__.py __all__ = ['policy','versions']
│ ├── policy.py
│ └── versions.py
├── cmd __all__ = ['manage']
│ ├── __init__.py
│ └── manage.py
└── db __all__ = ['models']
├── __init__.py
└── models.py
from glance.api import *
policy.get()
绝对导入和相对导入
我们的最顶级包glance是写给别人用的,然后在glance包内部也会有彼此之间互相导入的需求,
这时候就有绝对导入和相对导入两种方式:
绝对导入:以glance作为起始
相对导入:用.或者..的方式最为起始(只能在一个包中使用,不能用于不同目录内)
例如:我们在glance/api/version.py中想要导入glance/cmd/manage.py
在glance/api/version.py
#绝对导入
from glance.cmd import manage
manage.main()
#相对导入
from ..cmd import manage
manage.main()
测试结果:注意一定要在于glance同级的文件中测试
from glance.api import versions
注意:在使用pycharm时,有的情况会为你多做一些事情,这是软件相关的东西,会影响你对模块导入的理解,
因而在测试时,一定要回到命令行去执行,模拟我们生产环境,你总不能拿着pycharm去上线代码吧!!!
特别需要注意的是:
可以用import导入内置或者第三方模块(已经在sys.path中),但是要绝对避免使用import来导入自定义包的子模块(没有在sys.path中),应该使用from... import ...的绝对或者相对导入,且包的相对导入只能用from的形式。
单独导入包
单独导入包名称时不会导入包中所有包含的所有子模块,
解决方法是子模块中使用相对路径引入上级(..上一级目录)模块或同级(.当前目录)模块
千万别问:__all__不能解决吗,__all__是用于控制from...import *
附:软件规范开发参考目录图
end
2018-4-27