• python笔记_magic变量和函数


    前言

    先扯一点背景知识

    PEP8(Python Enhancement Proposal)是一份python的编码规范,链接:http://www.python.org/dev/peps/pep-0008/

    在这份编码规范中的“命名规范-命名风格”这一节的最后,提到了对几种使用前置和后置下划线的,对变量的比较特殊的命名方式:

    • 单下划线开头:弱内部使用标识,无法被from M import *所引用
    • 单下划线结尾:避免和python关键字冲突,可以加个后置下划线
    • 双下划线开头:类成员变量中的私有变量,
    • 双下划线开头,双下划线结尾:这是magic对象或属性的名字,永远不要将这样的命名方式应用于自己的变量和函数

    本文主要关注正是以上第四种--python自动在用户命名空间创建的magic变量

    1、__name__变量

    __name__属性是直接内置在.py文件中的。

    • 如果直接执行.py文件,__name__将被设置为__main__。
    • 如果.py文件是被import,__name__将被设置为.py文件的名字

    这个属性经常用来当做一个使用模式的标识:

    #a.py
    print 'a function'
    if __name__=='__main__':
        print 'a test'
    ------------------------------
    #b.py
    import a

    如果执行python a.py将打印出两行内容,执行python b.py只会打印出'a function'。一般可以把只针对a.py的测试代码写在if __name__=='__main__',因为如果a.py被其他的脚本import之后,这部分代码将不会被执行。可以很安全的对a.py进行单独的测试。

    2、__file__变量

    __file__可以用来获取python脚本的“路径+脚本名称”,这可能是一个相对路径也可能是一个绝对路径,取决按照什么路径来执行的脚本,一般来说__file__变量和os.path配合,可以用来获取python脚本的绝对路径:

    #a.py
    import os
    print os.path.realpath(__file__)
    out>>E:Eclipse_workspacepython_learna.py

    3、__import__函数

    python导入模块时,一般使用import,而import语句其实也是调用builtin函数:__import__()实现的导入,直接使用__import__比较少见,除非导入的模块是不确定的,需要在运行时才能确定导入哪些模块,可以使用__import__,默认接收需要导入的模块名的字符串:

    #a.py
    def f1():
        print 'f1'
    def f2():
        print 'f2'
    #b.py
    model=__import__('a')
    model.f1()
    model.f2()

    在memfs的测试中,我的每一个测试case就是一个独立的.py文件,在确定需要测试哪些case后,在运行时才‘动态的’去import相应的case,就是通过__import__来实现的。

    4、__str__函数

    __str__是一个比较常用的内置函数,在定义类的时候经常使用,__str__函数返回一个字符串,这个字符串就是此对象被print时显示的内容,(如果不定义这个函数,将会显示默认的格式:<__main__.A object at 0x0000000001FB7C50>):

    #a.py
    import datetime
    import os
    class A(object):
        def __str__(self):
            #返回当前的日期
            return str(datetime.datetime.now())
    a=A()
    print a
    time.sleep(1)
    #每次打印A()的对象,都返回当前的时间
    print a
    out>>2015-06-25 15:01:01.573000
    out>>2015-06-25 15:01:02.573000

    这个函数在django的model类中如果定义的话,print一条数据库中的数据,可以指定显示任何的值:

    class Question(models.Model):
    #定义一个数据库表,其中包含question_id和question_text
    #....
    def __str__(self):
        #只想显示question_text
        return self.question_text

    注:在python3.x中str被废弃,使用unicode

    5、__init__对象函数

    __init__比较常见,是对象的初始化函数,例子如下:

    #a.py
    class A(object):
        pass
    class B(A):
        #B类继承自A,如果要重写__init__,需要先调用父类的__init__
        def __init__(self,*args):
            super(B,self).__init__(*args)

    6、__new__对象函数

    __new__()函数是类创建对象时调用的内置函数,必须返回一个生成的对象,__new__()函数在__init__()函数之前执行。一般来说没有比较重载这个函数,除非需要更改new对象的流程,有一种场景“单例模式”要求只能存在一个class A的对象,如果重复创建,那么返回的已经创建过的对象的引用。可以这样使用__new__函数:

    a.py
    class A(object):
        def __new__(cls):
            if not "_instance" in vars(cls):
                cls._instance=super(A,cls).__new__(cls)
            return cls._instance
    a=A()
    b=A()
    print id(a)==id(b)
    out>>True

    可以看出,a和b其实引用了同一个对象

    7、__class__对象变量

    instance.__class__表示这个对象的类对象,我们知道在python中,类也是一个对象(好理解么),例:

    #a.py
    class A(object):
        pass
    a=A()
    B=a.__class__
    b=B()
    print type(b)
    out>><class '__main__.A'>

    可以看出,a是A类的一个对象,a.__class__就是A类,将这个类赋值给B,使用B()又可以创建出一个对象b,这个对象b也是A类的对象,(晕了么?),这个__class__有什么卵用呢?下面的例子就可以用到

    8、__add__对象函数

    这其实是一类函数,包括__sub__,__mul__,__mod__,__pow__,__xor__,这些函数都是对加、减、乘、除、乘方、异或、等运算的重载,是我们自定义的对象可以具备运算功能:

    #a.py
    class A(object):
        def __init__(self,v):
            self.v=v
        def __add__(self,other):
            #创建创建一个新的对象
            x=self.__class__(self.v+2*other.v)
            return x
    a=A(1)
    b=A(2)
    c=a+b
    print c.v
    ouot>>5

    这样我们就定义了一个加法操作1+2=1+2*2=5

    9、__doc__文档字符串

    python建议在定义一个类、模块、函数的时候定义一段说明文字,例子如下:

    #c.py
    """
    script c's doc
    """
    class A(object):
        """
        class A's doc
        """
        pass
    def B():
        """
        function B's doc
        """
        pass
    print __doc__
    print A.__doc__
    print B.__doc__
    out>>script c's doc
    out>>class A's doc
    out>>function B's doc

    调用别的模块、函数的时候如果不清楚使用方法,也可以直接查看doc文档字符串

    10、__iter__和next函数

    凡是可以被for....in的循环调用的对象,我们称之为可以被迭代的对象,list,str,tuple都可以被迭代,它们都实现了内部的迭代器函数,比如说list,tuple,字符串这些数据结构的迭代器如下:

    a=[1,2,3,4]
    b=('i',1,[1,2,3])
    print a.__iter__()
    print b.__iter__()
    out>><listiterator object at 0x0000000001CC7C50>
    out>><tupleiterator object at 0x0000000001CC7B00>

    如果我们要实现一个我们自己的迭代器对象,那么我们必须实现两个默认的方法:__iter__和next。

    __iter__()函数将会返回一个迭代器对象,next()函数每次被调用都返回一个值,如果迭代完毕,则raise一个StopIteration的错误,用来终止迭代。下面的例子将实现一个可以迭代的对象,输出a~z的26个字母,该对象接收一个int参数用来表示输出字母的数量,如果该参数超过字母表的长度,则循环从‘a-z’再次进行循环输出:

    import random
    class A(object):
        def __init__(self,n):
            self.stop=n
            self.value=0
            #字母列表
            self.alph=[chr(i) for i in range(97,123)]
        def __iter__(self):
            return self
    
        def next(self):
            #如果超过长度超过26则重置
            if self.value==len(self.alph):
                self.value=0
                self.stop=self.stop-len(self.alph)
            #最终,已完成n个字符的输出,则结束迭代
            if self.value>self.stop:
                raise StopIteration    
            x=self.alph[self.value]
            self.value+=1
            return x
    
    for i in A(1000):
        print i,
    out>>a b c d e f g h i j k l m n o p q r s t u v w x y z a b c d e f g h i j k l m n o p q r s t u v w x y z a b c d e f g h i j k .....

    11、__dict__、__slot__和__all__

    这三个变量有一些关系,__dict__在类和对象中都存在,它是一个包含变量名和变量的字典,见以下的例子:

    #a.py
    class A(object):
        c=3
        d=4
        def __init__(self):
            self.a=1
            self.b=2
        def func(self):
            pass
    print A().__dict__
    print A.__dict__
    out>>{'a': 1, 'b': 2}
    out>>{'__module__': '__main__', 'd': 4, 'c': 3, 'func': <function func at 0x00000000021F2BA8>, '__dict__': <attribute '__dict__' of 'A' objects>, '__weakref__': <attribute '__weakref__' of 'A' objects>, '__doc__': None, '__init__': <function __init__ at 0x00000000021F2AC8>}

    一个对象的__dict__只包含self定义的变量,而一个类的__dict__包含了类里面的函数(func函数)、类变量,以及很多隐性的变量,包括__dict__变量本身也是隐性的。

    __slot__变量的用法理解起来比较要难一点,正常的情况下,我们实例化一个对象,可以给这个对象增加任意的成员变量,即使不在类里面定义的变量都可以,如下:

    #a.py
    class A(object):
    
        def __init__(self):
            self.a=1
            self.b=2
    
    a=A()
    #给a增加一个x变量
    a.x=1
    #也可以给a增加一个匿名函数
    a.y=lambda x,y:x*y
    print a.x
    print a.y(3,5)
    out>>1
    out>>15

    如果我们想限制一下对象绑定的变量,我们可以在类定义的时候增加一个slots变量,这个变量是一个字符串的元组,例子如下:

    class A(object):
        __slots__=('a','b','x')
        def __init__(self):
            self.a=1
            self.b=2
    
            pass
        #__slots__=('a','b',)
        def func(self):
            pass
    a=A()
    a.x=1
    #执行到a.y时会报错:AttributeError: 'A' object has no attribute 'y'
    a.y=lambda x,y:x*y
    print a.y(3,5)

    __all__变量是一个字符串列表,它定义了每一个模块会被from module_name import *这样的语句可以被import的内容(变量,类,函数)

    #a.py 不定义__all__
    class A(object):
        def __init__(self):
            self.a=1
            self.b=2
    
        def func(self):
            pass
    def B():
        pass
    
    c=10
    
    #b.py
    from a import *
    print A
    print B
    print c
    out>><class 'learn_draft.A'>
    out>><function B at 0x00000000021D1438>
    out>>10

    如果在a.py中定义__all__=['A','c'],则B函数对于b.py来说是不可见的。

    12、__hash__

    哈希函数,在python中的对象有一个hashable(可哈希)的概念,对于数字、字符串、元组来说,是不可变的,也就是可哈希的,因此这些对象也可以作为字典的key值。另外,列表、字典等,是可变对象,因此也就是不可哈希的,也就不能作为字典的key值。是否可哈希,可以调用内置函数hash()进行计算,hash()函数返回计算的到的hash值。

    • 完全相同的变量,调用哈希算法的到的hash值一定是相同的

    当然一般来说,我们不会去重新定义一个对象的__hash__函数,除非我们想实现一个自定义的需求,在stackoverflow有人提出这样一个需求,需要判断有相同词频的字符串是相等的,也就是说“abb”和“bab”这样的字符串是相等的,这个时候我们可以继承字符串类,然后重写哈希函数,如下:

    import collections
    
    class FrequencyString(str):
        @property
        def normalized(self):
            try:
                return self._normalized
            except AttributeError:
                self._normalized = normalized = ''.join(sorted(collections.Counter(self).elements()))
                return normalized
    
        def __eq__(self, other):
            return self.normalized == other.normalized
    
        def __hash__(self):
            return hash(self.normalized)

    13、__getattr__和__setattr__,__delattr__对象函数

    先介绍两个内置函数,getattr()和setattr(),使用这两个函数可以获取对象的属性,或者给对象的属性赋值:

    #a.py
    class A(object):
        def __init__(self):
            self.a=1
            self.b=2
    a=A()
    setattr(a,'a',3)
    print a.a
    print getattr(a,'b')
    out>>3
    out>>2

    其实使用这两个函数和直接访问a.a,a.b没有任何区别,但好处是setattr和getattr接受两个字符串去确定访问对象a的哪一个属性,和__import__一样,可以在运行时在决定去访问对象变量的名字,在实际工作中经常会使用这两个函数。

    __getattr__()这个函数是在访问对象不存在的成员变量是才会访问的,见下面的例子:

    class A(object):
        def __init__(self):
            self.a=1
            self.b=2
    
        def func(self):
            pass
        def __getattr__(self,name):
            print 'getattr'
            return self.a
    
    a=A()
    print a.d
    out>>getattr
    out>>1

    在调用a.d时,d不是a的成员变量,则python会去查找对象是否存在__getattr__()函数,如果存在,则返回__getattr__()函数的返回值,我们这里返回的是self.a的值1。

    由于__getattr__()的特性,我们可以将__getattr__()设计成一个公共的接口函数,在autotest的proxy.py中就看到了这样的用法:

    class ServiceProxy(object):
    
    def __init__(self, serviceURL, serviceName=None, headers=None):
        self.__serviceURL = serviceURL
        self.__serviceName = serviceName
        self.__headers = headers or {}
    
    def __getattr__(self, name):
        if self.__serviceName is not None:
            name = "%s.%s" % (self.__serviceName, name)
        return ServiceProxy(self.__serviceURL, name, self.__headers)
    
    #调用的时候,op是执行的特定操作的字符串,op传入__getattr__将会把ServiceProxy对象重新的内部变量重新赋值,然后返回一个更新之后的对象
    function = getattr(self.proxy, op)

    __setattr__和__getattr__不一样,对象的所有属性赋值,都会经过__setattr__()函数,看下面的例子:

    class A(object):
        def __init__(self):
            self.a=1
            self.b=2
    
        def func(self):
            pass
        def __getattr__(self,name):
            print 'getattr'
            return self.a
        def __setattr__(self, name, value):
            print 'setattr %s' % name
            if name == 'f':
                return object.__setattr__(self,name,value+1000)
            else:
                return object.__setattr__(self,  name, value)
    
    a=A()
    a.f=1000
    print a.f
    out>>setattr a
    out>>setattr b
    out>>setattr f
    out>>2000

    从输出可以看到init函数的self.a和self.b的赋值也经过了__setattr__,而且在赋值的时候我们自定义了一个if逻辑,如果name是‘f’,那么value会增加1000,最终的a.f是2000

    __delattr__不举例了,删除一个对象属性用的。

    14、__call__对象函数

    如果一个对象实现了__call__()函数,那么这个对象可以认为是一个函数对象,可以使用加括号的方法来调用,见下面例子:

    class A(object):
        def __init__(self):
            self.li=['a','b','c','d']
        def func(self):
            pass
        def __call__(self,n):
            #返回li列表的第n个元素
            return self.li[n]
    
    a=A()
    #a可以当做函数一样调用
    print a(0),a(1),a(2)
    out>>a b c

    在实际工作中__call__函数非常有用,可以把一个对象变成callable的对象

  • 相关阅读:
    RPC中阻塞队列的作用
    记用tensorflow-ranking时的bugs
    JDK作泛型比较时为什么把逻辑代码写两遍
    Java 不能声明泛型数组
    QuickSort Hoare vs Lomuto
    Java 对数组扩容
    Java交换两对象的问题
    毕业 失业
    dependencyManagement介绍
    web笔记
  • 原文地址:https://www.cnblogs.com/zhuangxiu/p/4797245.html
Copyright © 2020-2023  润新知