• Python读取常用的数据文件


    1、CSV

    • csv文件:指将数据列用逗号分隔的文件,文件的扩展名是.csv。另一种数据文件叫制表符数据文件,指数据列之间分隔符是制表符。

    注:用excel表格打开csv文件格式如上图

    # 导入csv库
    import csv
    
    # 1、读取csv数据文件获得一个列表
    csv_list = open(file="data/csv_data.csv", mode="r")
    reader_list = csv.reader(csv_list)
    
    # 遍历列表数据
    for row in reader_list:
        print(row)

    结果:

    ['id', 'name', 'age', 'addr']
    ['1', 'tom', '24', 'BeiJing']
    ['2', 'jack', '23', 'BeiJing']
    ['3', 'bob', '32', 'BeiJing']
    ['4', 'marry', '24', 'BeiJing']
    ['5', 'tony', '11', 'BeiJing']
    ['6', 'marthin', '53', 'BeiJing']
    ['7', 'jason', '22', 'ShangHai']
    ['8', 'keivn', '23', 'ShangHai']
    ['9', 'king', '42', 'ShangHai']
    ['10', 'fiona', '19', 'ShangHai']

    2、JSON

    • json文件:每一条记录都像python中的字典,数据都有键-值对,用冒号(:)分隔,数据条目之间用逗号(,)分隔,首尾用花括号({})包围的数据结构。

    注:json格式文件数据结构如上图所示

    # 导入json库
    import json
    
    # 读取json文件获取json字符串对象
    json_data = open(file="data/json_data.json", mode="r").read()
    print(type(json_data))  # <class 'str'>
    
    # 将json字符串转换json对象
    json_obj = json.loads(json_data)
    print(type(json_obj))  # <class 'dict'>
    
    # 遍历文件
    for item in json_obj['user']:
        print(item)

     结果:

    {'id': 10, 'name': 'Tom', 'age': 22, 'addr': 'BeiJing'}
    {'id': 11, 'name': 'Jack', 'age': 25, 'addr': 'ShangHai'}

    3、XML

    • xml文件:使用标签和属性来保存数据。

    注:xml格式文件数据结构如上图所示

    # 导入xml相关的库
    from xml.etree import ElementTree as ET
    
    # 解析xml文件获取对象
    tree = ET.parse(source="data/xml_data.xml")
    
    # 获取根节点信息,通过根节点查找指定名称的子节点对象
    root_ele = tree.getroot()
    user_ele = root_ele.find('user')
    
    # 获取遍历字节点的属性值
    for i in user_ele:
        print(i.attrib['value'])

    结果:

    10
    Tom
    22
    BeiJing

  • 相关阅读:
    Logstash介绍及Input插件介绍
    nyoj 12-喷水装置(二)(贪心)
    2018年四川理工学院专升本《大学计算机基础》考试大纲 (一)
    nyoj 10 skiing (DFS)
    党建名词及解释(五)
    党建名词及解释(四)
    党建名词及解释(三)
    党建名词及解释(二)
    党建名词及解释(一)
    lqb 基础练习 闰年判断
  • 原文地址:https://www.cnblogs.com/jason2018524/p/14111684.html
Copyright © 2020-2023  润新知