• python数据格式化之pprint


    pprint – 美观打印

    作用:美观打印数据结构

    pprint 包含一个“美观打印机”,用于生成数据结构的一个美观视图。格式化工具会生成数据结构的一些表示,不仅可以由解释器正确地解析,而且便于人类阅读。输出尽可能放在一行上,分解为多行时则需要缩进。

    以下实例用用到的data包含一下数据

    data = [(1,{'a':'A','b':'B','c':'C','d':'D'}),

            (2,{'e':'E','f':'F','g':'G','h':'H',

                'i':'I','j':'J','k':'K','l':'L'

                }),

            ]

    1、  打印

    要使用这个模块,最简单的方法就是利用pprint()函数 

    1
    2
    3
    4
    5
    6
    from pprint import pprint
    print 'PRINT:'
    print data
    print 
    print 'PPRINT:'
    pprint(data)

    运行结果:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    PRINT:
    [(1, {'a''A''c''C''b''B''d''D'}), (2, {'e''E''g''G''f''F''i''I''h''H''k''K''j''J''l''L'})]
    PPRINT:
    [(1, {'a''A''b''B''c''C''d''D'}),
     (2,
      {'e''E',
       'f''F',
       'g''G',
       'h''H',
       'i''I',
       'j''J',
       'k''K',
       'l''L'})]

    pprint()格式化一个对象,并把它写至一个数据流,这个数据流作为参数传入(或者是默认的sys.stdout)

    注意为什么第二个字典中会显示一竖列,因为pprint打印支持8个对象以上的竖列打印

    2、  格式化

    格式化一个数据结构而不把它直接写至一个流(例如用于日志记录),可以使用pformat()来构造一个字符串表示。 

    1
    2
    3
    4
    5
    6
    7
    8
    9
    import logging
    from pprint import pformat
    logging.basicConfig(level = logging.DEBUG,
                        format = '%(levelname)-8s %(message)s',
                        )
    logging.debug('Logging pformatted data')
    formatted = pformat(data)
    for line in formatted.splitlines():
        logging.debug(line.rstrip())

    运行结果:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    DEBUG    Logging pformatted data
    DEBUG    [(1, {'a''A''b''B''c''C''d''D'}),
    DEBUG     (2,
    DEBUG      {'e''E',
    DEBUG       'f''F',
    DEBUG       'g''G',
    DEBUG       'h''H',
    DEBUG       'i''I',
    DEBUG       'j''J',
    DEBUG       'k''K',
    DEBUG       'l''L'})]

    然后可以单独低打印格式化的字符串或者计入日志

    splitlines() 按行分割()

    rstrip()去除右边的空格 lstrip()去除左边的空格 strip()去除两边空格。默认为去除空格,也可以传入需要从两边或者其中一边去除的字符,如strip(‘a’)就是去除字符串两边的字符’a’

    3、  任意类

    如果定制类定义了一个__repr__()方法,pprint()使用的PrettyPrinter类还可以处理这些定制类。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    from pprint import pprint 
    class node(object):
        def __init__(self,name,contents =[]):
            self.name = name
            self.contents = contents[:]
        def __repr__(self):
            return ('node(' + repr(self.name) + ',' +
                    repr(self.contents) + ')'
                    )
    trees = [node('node-1'),
             node('node-2',[node('node-2-1')]),
             node('node-3',[node('node-3-1')]),         
             ]
    pprint(trees)

    运行结果:

    1
    2
    3
    [node('node-1',[]),
     node('node-2',[node('node-2-1',[])]),
     node('node-3',[node('node-3-1',[])])]

    由PrettyPrinter组合嵌套对象的表示,从而返回完整字符串表示。

     4、  递归

    递归数据结构有指向原数据源的引用来表示,形式为<Recursion on typename with id=number>。 

    1
    2
    3
    4
    5
    6
    from pprint import pprint 
    local_data = ['a','b',1,2]
    local_data.append(local_data)
    print 'id(local_data) =>',id(local_data)
    pprint(local_data)
    print local_data

    运行结果:

    1
    2
    3
    id(local_data) =47458332363520
    ['a''b'12, <Recursion on list with id=47458332363520>]
    ['a''b'12, [...]]

    在这个例子中,列表local_data增加到了其自身,这会创建一个递归引用

    内置函数id()作用是获得对象的id值,理论上讲每个对象都有一个id值,如果是整数和字符串((相对较小的时候)),那么相同的值会有相同的id值,但是如果是类,及时相同也会有不同的id值。测试如下: 

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    #int or float or lon 都一样(比较小的时候)
    = 65464131311513l
    = 65464131311513l
    = 65464131311513l
    print id(a)
    print id(b)
    print id(c)
    print
    = '12312312'
    = '12312312'
    = '12312312'
    print id(a)
    print id(b)
    print id(c)
    print 
    = 65464131311513l*11
    = 65464131311513l*11
    = 65464131311513l*11
    print id(a)
    print id(b)
    print id(c)
    print
    = '12312312'*11
    = '12312312'*11
    = '12312312'*11
    print id(a)
    print id(b)
    print id(c)
    print 
    class Test(object):
        def __init__(self):
            pass
    = Test()
    = Test()
    = Test()
    print id(a)
    print id(b)
    print id(c)
    print

    测试结果:

    47010342174992

    47010342174992

    47010342174992

    47010343272096

    47010343272096

    47010343272096

    47010343261568

    47010343261648

    47010343261688

    47010343200944

    47010343199152

    47010343202352

    47010343252304

    47010343252944

    47010343253008

    5、  限制嵌套输出

    对于非常深的数据结构,可能不要求输出包含所有细节。有可能数据没有是当地格式化,也可能格式化文本过大而无法管理,或者默写数据时多余的。 

    1
    2
    3
    4
    5
    6
    7
    8
    9
    from pprint import pprint 
    print 'depth 1 :'
    pprint(data,depth=1)
    print 
    print 'depth 2 :'
    pprint(data,depth=2)
    print 
    print 'depth 3 :'
    pprint(data,depth=3)

    运行结果:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    depth 1 :
    [(...), (...)]
    depth 2 :
    [(1, {...}), (2, {...})]
    depth 3 :
    [(1, {'a''A''b''B''c''C''d''D'}),
     (2,
      {'e''E',
       'f''F',
       'g''G',
       'h''H',
       'i''I',
       'j''J',
       'k''K',
       'l''L'})]

    使用depth参数可以控制美观打印机递归处理嵌套数据结构的深度。输出中未包含的层次由一个省略号表示 

    6、  控制输出宽度

    格式化文本的默认输出宽度为80列。要调整这个宽度,可以再pprint()中使用参数width。 

    1
    2
    3
    4
    5
    from pprint import pprint
    for width in [80,5]:
        print 'WIDTH = ', width
        pprint(data,width = width)
        print

    运行结果:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    WIDTH =  80
    [(1, {'a''A''b''B''c''C''d''D'}),
     (2,
      {'e''E',
       'f''F',
       'g''G',
       'h''H',
       'i''I',
       'j''J',
       'k''K',
       'l''L'})]
    WIDTH =  5
    [(1,
      {'a''A',
       'b''B',
       'c''C',
       'd''D'}),
     (2,
      {'e''E',
       'f''F',
       'g''G',
       'h''H',
       'i''I',
       'j''J',
       'k''K',
       'l''L'})]

    宽度大小不能适应格式化数据结构时,如果斩断或转行会引入非法的语法,就不会进行截断或转行

  • 相关阅读:
    安装Visual Studio的插件AnkhSvn
    从零开始安装 Ambari (1) -- 安装前的准备工作
    centos7 安装 mysql
    hortonworks docker 安装
    Kafka connect
    KONG -- 图形化管理(Kong Dashboard)
    KONG -- 配置 service 并添加 key-auth
    KONG 安装 (在 CentOS 7 中)
    kylin cube 构建过程
    sqoop 安装与命令
  • 原文地址:https://www.cnblogs.com/nkwy2012/p/6427946.html
Copyright © 2020-2023  润新知